[sg_popup id=1]
Преди да пристъпим към анализа трябва да изясним кои са двете групи данни, които може да изследваме. Това са метрирани и неметрирани групи данни. Метрираните са такива, които се предствят в цифри, а неметрираните, чрез думи. Метрираните могат да бъдат прекъснати и непрекъснати.
Съществуват различни методи на анализ за таблици от данни с различни по рода си параметри. За изцяло метрирани признаци използваме F критериалният анализ, за изцяло неметрирани признаци Xi критериалният анализ, а за комбинирани прилагаме дисперсионният анализ.
Сега ще разгледаме дисперсионният анализ. В конкретния пример става въпрос за това дали съществува статистически значимо взаимодействие между цента на имотите и тяхното разположение по квартали в София. Цената е метрирания признак, а имената на кварталите предствляват неметрирания. Тъй като имаме два фактора, които ще анализираме ще използваме двуфакторен дисперсионен анализ.
Същствува приложение на Exel, наречено ANOVA, което предствя готова таблица с елементите на изследването и дава възможност да се направят съответните изводи бързо и лесно. Ще се спрем на това приложение малко по-надолу в текста, но за да бъде ясно систематизирана работата ни първо ще опиша алгоритъма на изследването.
Изследване чрез двуфакторен дисперсионен анализ:
1. Определят се двете хипотези, които са вариантите за изход от изследването, това да Н0 и Н1.
Н0: Не съществува съществено статистически значимо взаимодействие между района и цената на имотите в София.
Н1: Съществува съществено статистически значимо взаимодействие между района и цената на имотите в София.
2. Определя се вероятността за грешка. В повечето случаи тя е 5% или ?= 0.05
3. Определя се методът, по който ще бъде направено изследването. В случая уточнихме, че това ще е двуфакторен дисперсионен анализ.
4. Изчислява се F емпирично.
5. Изчислява се F теотитично (F crit)
6. Съпоставят се F и F crit и се прави извод:
При F < F crit –> Отхвърляме Н0 и приемаме за вярно Н1
При F > F crit –> Отхвърляме Н1 и приемаме за вярно Н0
При ANOVA функцията изчисленията стават автоматично и затова не сме се спрели на подробно описания на изчислителните методи, които служат за намиране на F и таблицата, от която се извежда F crit.
ANOVA e функция на ексел, която за съжаление не винаги е инсталирана в програмата от самото начало. Може да се наложи да потърсите за приложението в Ексела.
Когато вече имаме ANOVA сме готови да продължим.
Ето и стъпките на работа:
Копирате таблицата над която ще работим в нов ексел. Отиваме на Data и избираме Data analysis и след това ANOVA single factor.
Появява се следния диалогов прозорец:
Маркираме данните от таблицата и кликаме за отметката за поставяне на резулатта на същата страница в ексел. Маркираме долния текст бокс и избираме клетка от която да започне таблицата с резултатаите. Натискаме ОК.
Трябва да получим следната таблица:
Откриваме F и F crit и ги съпоставяме:
В нашият слувай F < F crit –> Отхвърляме Н0 и приемаме за вярно Н1
При вероятност за грешка 5% съществува статистически значимо взаимодействие между района и цената на имотите в София.
Така може с определена точност да получим статистически изводи на база, на които да вземем конкретни и обосновани маркетингови решение. Ние вярваме, че маркетингът се нужда е от мощни инструменти за анализ, които в колкото се може по-голяма степен да улесняват решенията, които взимаме.
No Comments