22.05.2022

Център за системна оптимизация на бизнеса и управление на качеството - факторен анализ. Факторният анализ, неговите видове и методи Факторният анализ за оценка на времето до отказ


Задача за самоподготовка проектантска работапо дисциплината Психологическа работилница № 5 (СПСС).

Предмет:"Факторен анализ".

Изпълнено:

Студент 4-та година

Социално-психологически

факултет

(дневен отдел)

Лалетина Светлана Валериевна

Факторен анализ.

1.1 Дефиниция на статистическа процедура.

Статистически метод, който се използва при обработка на големи масиви от експериментални данни. Набор от аналитични методи, които позволяват разкриване на скрити латентни признаци, както и причините за тяхното възникване и вътрешните модели на тяхната връзка.

Задачите на факторния анализ са:

* намаляване на броя на променливите,

* определяне на структурата на връзките между променливите, т.е. класификация на променливите.

Следователно факторният анализ се използва като метод за намаляване на данните или като метод за структурна класификация.

Важна разлика между факторния анализ и всички други методи е, че той не може да се използва за обработка на първични или, както се казва, „сурови“ експериментални данни, т.е. получени директно от изследването на субектите. Материалът за факторния анализ са корелациите или по-скоро корелационните коефициенти на Pearson, които се изчисляват между променливите, включени в проучването. С други думи, корелационните матрици се подлагат на факторен анализ.

Използва се за проектиране на тестове и методи; да изучава всякакви експериментални наблюдения, тяхната структура, въз основа на външни признаци.

Основната концепция на факторния анализ е фактор. Това е изкуствен статистически показател, получен в резултат на специални трансформации на таблицата на коефициентите на корелация между изследваните психологически характеристики или корелационната матрица. В резултат на факторизацията може да се извлече корелационната матрица различно количествофактори до число, равно на броя на оригиналните променливи. Факторите, идентифицирани в резултат на факторизацията, обаче, като правило, са различни по своята стойност.

Методът ви позволява да правите хипотези за естествените процеси, присъщи на самото измерено свойство. Също така факторният анализ ви позволява да установите за голям брой характеристики тесен набор от свойства, които характеризират връзката между характеристики и фактори.

Факторният анализ има 4 етапа:

1. изчисляване на корелационната матрица за всички променливи, включени в анализа,

2. извличане на фактори,

3. ротация на факторите за създаване на опростена структура,

4. интерпретация на факторите.

1.2 Формула, норми, приложение.



Всички съвременни статистически пакети имат програми за корелационен и факторен анализ. компютърна програмафакторният анализ по същество се опитва да "обясни" корелациите между променливите по отношение на малък брой фактори.

Пример за факторна матрица:

Променлива Фактор 1 Фактор 2
V 1 0,91 0,01
V 2 0,20 0,96
V 3 0,94 - 0,15

Матрицата показва, че корелацията между променливата V 1 и първия фактор е = 0,91. Колкото по-високо е факторното натоварване, толкова по-голяма е връзката му с фактора.

Има един фундаментален важна собственосткоефициент на корелация, поради който се съставят описателни характеристики. Квадратът на корелационния коефициент показва каква част от дисперсията (вариацията) на черта е обща за две променливи, или по-просто казано, колко тези променливи се припокриват. Например 2 променливи с корелация 0,9 се припокриват със степен 0,9 * 0,9 = 0,81. Тези. 81% от дисперсиите на двете променливи са общи, т.е. съвпада.

За да изчислите собствените стойности на фактор 1, трябва да поставите на квадрат факторните натоварвания и да ги добавите надолу в колоната. 0,91*0,91 + 0,20*0,20 + 0,94*0,94 = 1,7517. Ако собствената стойност на даден фактор се раздели на броя на променливите, полученото число ще покаже каква част от дисперсията се обяснява с този фактор. 1,7517 : 3 = 0,5839. Фактор 1 обяснява около 58% от информацията.

КМО - Коефициент, характеризиращ степента на приложимост на факторния анализ за дадена извадка.

0,9 и повече - безусловна адекватност,

0,8 - висока приложимост,



0,7 - приемливо,

0,6 - задоволително,

0,5 - ниско,

По-малко от 0,5 - факторният анализ не е приемлив за тази извадка.

Стойността на Bartlett трябва да бъде поне 0,05.

Условия за прилагане на факторен анализ:

1. не можете да факторизирате получените качествени данни по скала от имена, например цвят на косата, цвят на очите и т.н.

2. всички променливи трябва да са независими и тяхното разпределение трябва да е близко до нормалното.

3. връзките между променливите трябва да бъдат приблизително линейни или да нямат ясно криволинеен характер,

4. в оригиналната корелационна матрица трябва да има няколко корелации с модул по-висок от 0,3. В противен случай е трудно да се извлекат някакви фактори от матрицата.

5. Извадката от субекти трябва да е достатъчно голяма (за предпочитане 100 субекта).


Тема на изследването:

ФАКТОРЕН АНАЛИЗ

Идеята зад факторния анализ

При изучаването на сложни обекти, явления, системи факторите, които определят свойствата на тези обекти, много често не могат да бъдат измерени директно, а понякога дори техният брой и значение не са известни. Но други количества може да са налични за измерване, по един или друг начин в зависимост от факторите, които ни интересуват. Освен това, когато влиянието на неизвестен фактор, който ни интересува, се проявява в няколко измерени характеристики или свойства на обект, тези характеристики могат да покажат тясна връзка помежду си и общият брой фактори може да бъде много по-малък от броя на измерените променливи.

Методите за факторен анализ се използват за идентифициране на факторите, които определят измерените характеристики на обектите.

Като пример за прилагането на факторния анализ може да се посочи изследването на чертите на личността въз основа на психологически тестове. Свойствата на личността не са пряко измерими. Те могат да се съдят само по поведението на човек или естеството на отговорите на въпросите. За да се обяснят резултатите от експериментите, те се подлагат на факторен анализ, който дава възможност да се идентифицират онези лични свойства, които влияят върху поведението на индивида.
Различни методи за факторен анализ се основават на следната хипотеза: наблюдаваните или измерените параметри са само косвени характеристики на обекта, който се изследва, всъщност има вътрешни (скрити, латентни, ненаблюдавани директно) параметри и свойства, чийто брой е малък и които определят стойностите на наблюдаваните параметри. Тези вътрешни параметри се наричат ​​фактори.

Целта на факторния анализ е да концентрира първоначалната информация, изразяваща голямо числоразглежданите знаци чрез по-малък брой по-обемни вътрешни характеристики на явлението, които обаче не могат да бъдат директно измерени

Установено е, че подборът и последващият мониторинг на нивото на общите фактори позволяват да се открият предаварийни състояния на обект на много ранни етапи от развитието на дефекта. Факторният анализ ви позволява да проследявате стабилността на корелациите между отделните параметри. Именно корелациите между параметрите, както и между параметрите и общите фактори съдържат основната диагностична информация за процесите. Използването на инструментариума на пакета Statistica при извършване на факторен анализ елиминира необходимостта от допълнителни изчислителни инструменти и прави анализа ясен и разбираем за потребителя.

Резултатите от факторния анализ ще бъдат успешни, ако е възможно да се интерпретират идентифицираните фактори въз основа на значението на показателите, характеризиращи тези фактори. Този етап от работата е много отговорен; изисква ясно разбиране на смисловото значение на показателите, които участват в анализа и въз основа на които се идентифицират факторите. Ето защо при предварителния внимателен подбор на показатели за факторен анализ трябва да се ръководи от тяхното значение, а не от желанието да се включат възможно най-много от тях в анализа.

Същността на факторния анализ

Ето няколко основни положения на факторния анализ. Нека за матрицата хизмерените параметри на обекта, има ковариационна (корелационна) матрица ° С, Където Ре броят на параметрите, не броят на наблюденията. Чрез линейна трансформация х=QY+Uчовек може да намали размерността на оригиналното факторно пространство хза изравняване Y, при което Р"<<Р. Това съответства на трансформацията на точката, характеризираща състоянието на обекта в й-дименсионално пространство, в ново пространство от измервания с по-ниско измерение Р". Очевидно геометричната близост на две или набор от точки в новото факторно пространство означава стабилност на състоянието на обекта.

Матрица Yсъдържа ненаблюдаеми фактори, които по същество са хиперпараметри, характеризиращи най-общите свойства на анализирания обект. Общите фактори най-често се избират като статистически независими, което улеснява тяхната физическа интерпретация. Векторът на наблюдаваните характеристики хдава смисъл на последствията от промяната на тези хиперпараметри.

Матрица Uсе състои от остатъчни фактори, които включват главно грешки при измерване на характеристиките х(аз). Правоъгълна матрица Qсъдържа факторни натоварвания, които определят линейна връзка между характеристики и хиперпараметри.
Факторните натоварвания са стойностите на корелационните коефициенти на всяка от първоначалните характеристики с всеки от идентифицираните фактори. Колкото по-тясна е връзката на тази характеристика с разглеждания фактор, толкова по-висока е стойността на факторното натоварване. Положителен знак на факторното натоварване показва пряка (а отрицателен знак - обратна) връзка на тази характеристика с фактора.

По този начин данните за факторните натоварвания ни позволяват да направим изводи за набора от първоначални характеристики, които отразяват един или друг фактор, и за относителната тежест на отделна характеристика в структурата на всеки фактор.

Моделът на факторния анализ е подобен на моделите на многовариантна регресия и ANOVA. Основната разлика между модела на факторния анализ е, че векторът Y е ненаблюдаеми фактори, а при регресионния анализ това са записани параметри. От дясната страна на уравнение (8.1) неизвестните са матрицата на факторните натоварвания Q и матрицата на стойностите на общите фактори Y.

За намиране на матрицата на факторните натоварвания се използва уравнението QQ t =S–V, където Q t е транспонираната матрица Q, V е ковариационната матрица на остатъчните фактори U, т.е. . Уравнението се решава чрез итерации с определено нулево приближение на ковариационната матрица V(0). След намиране на матрицата на факторните натоварвания Q, общите фактори (хиперпараметри) се изчисляват с помощта на уравнението
Y=(Q t V -1)Q -1 Q t V -1 X

Пакетът за статистически анализ Statistica ви позволява интерактивно да изчислявате матрицата за натоварване на факторите, както и стойностите на няколко предварително дефинирани основни фактора, най-често два - въз основа на първите два основни компонента на оригиналната матрица на параметрите.

Факторен анализ в системата Statistica

Помислете за последователността на факторния анализ на примера за обработка на резултатите от анкетно проучване на служителите на предприятието. Необходимо е да се идентифицират основните фактори, които определят качеството на трудовия живот.

Първата стъпка е да изберете променливи за факторен анализ. Използвайки корелационен анализ, изследователят се опитва да идентифицира връзката на изследваните характеристики, което от своя страна му дава възможност да избере пълен и неизлишен набор от характеристики чрез комбиниране на силно корелирани характеристики.

Ако извършите факторен анализ за всички променливи, тогава резултатите може да не са напълно обективни, тъй като някои променливи се определят от други данни и не могат да бъдат регулирани от служителите на въпросната организация.

За да разберем кои индикатори трябва да бъдат изключени, нека изградим матрица от коефициенти на корелация в Statistica, използвайки наличните данни: Статистика/ Основна статистика/ Корелационни матрици/ Ok. В началния прозорец на тази процедура за продукт-момент и частични корелации (фиг. 4.3), бутонът за списък с една променлива се използва за изчисляване на квадратната матрица. Изберете всички променливи (изберете всички), Добре, Резюме. Получаваме корелационната матрица.

Ако коефициентът на корелация варира от 0,7 до 1, това означава силна корелация на показателите. В този случай една променлива със силна корелация може да бъде изключена. Обратно, ако коефициентът на корелация е малък, можете да елиминирате променливата, защото тя не добавя нищо към общата сума. В нашия случай няма силна корелация между нито една от променливите и ние ще извършим факторен анализ за пълния набор от променливи.

За да стартирате факторен анализ, трябва да извикате модула Статистика / Многовариантни изследователски техники (многовариантни изследователски методи) / Факторен анализ (факторен анализ). На екрана ще се появи прозорецът на модула за факторен анализ.



За анализ избираме всички променливи на електронната таблица; Променливи: изберете всички, ОК. Редът Входен файл (тип файл с входни данни) показва Сурови данни (първоначални данни). В модула са възможни два вида изходни данни - Raw Data (изходни данни) и Correlation Matrix - корелационна матрица.

Разделът за изтриване на MD определя как се обработват липсващите стойности:
* Casewise - начин за изключване на липсващи стойности (по подразбиране);
* Pairwise - сдвоен начин за премахване на липсващи стойности;
* Средно заместване - заместване на средното вместо липсващи стойности.
Начинът Casewise е да игнорирате всички редове в електронна таблица, съдържащи данни, които имат поне една липсваща стойност. Това важи за всички променливи. В метода Pairwise липсващите стойности се игнорират не за всички променливи, а само за избраната двойка.

Нека изберем начин за обработка на липсващите стойности Casewise.

Statistica ще обработи липсващите стойности по указания начин, ще изчисли корелационната матрица и ще предложи избор от няколко метода за факторен анализ.

След като щракнете върху бутона Ok, се появява прозорецът Дефиниране на метода за извличане на фактор.

Горната част на прозореца е информационна. Той казва, че липсващите стойности се обработват от метода Casewise. Бяха обработени 17 наблюдения и 17 наблюдения бяха приети за допълнителни изчисления. Корелационната матрица се изчислява за 7 променливи. Долната част на прозореца съдържа 3 раздела: Бързо, Разширено, Описателни.

Разделът Описания има два бутона:
1- преглед на корелации, средни и стандартни отклонения;
2- изграждане на множествена регресия.

Като щракнете върху първия бутон, можете да видите средните и стандартните отклонения, корелациите, ковариациите, да изградите различни графики и хистограми.

В раздела Разширени от лявата страна изберете метода (Метод на извличане) на факторния анализ: Основни компоненти (метод на главните компоненти). От дясната страна избираме максималния брой фактори (2). Посочва се или максималният брой фактори (максимален брой фактори), или минималната собствена стойност: 1 (собствена стойност).

Щракнете върху Ok и Statistica бързо ще извърши изчисленията. На екрана се появява прозорецът с резултатите от факторния анализ. Както бе споменато по-рано, резултатите от факторния анализ се изразяват като набор от факторни натоварвания. Затова ще продължим да работим с раздела Зареждания.

Горната част на прозореца е информационна:
Брой променливи (брой анализирани променливи): 7;
Метод (метод за избор на фактор): Основни компоненти (главни компоненти);
Log (10) детерминанта на корелационната матрица: -1.6248;
Брой извлечени фактори (брой избрани фактори): 2;
Собствени стойности (собствени стойности): 3.39786 и 1.19130.
В долната част на прозореца има функционални бутони, които ви позволяват да видите изчерпателно резултатите от анализа, числено и графично.
Завъртане на фактора - завъртане на факторите, в това падащо меню можете да изберете различни завъртания на осите. Чрез завъртане на координатната система можете да получите набор от решения, от които трябва да изберете интерпретируемо решение.

Има различни методи за завъртане на пространствените координати. Пакетът Statistica предлага осем такива метода, представени в модула за факторен анализ. Така, например, методът varimax съответства на координатна трансформация: ротация, която максимизира дисперсията. В метода varimax се получава опростено описание на колоните на факторната матрица, като се намаляват всички стойности до 1 или 0. В този случай се разглежда дисперсията на квадратите на факторните натоварвания. Факторната матрица, получена с помощта на метода на ротация на varimax, е до голяма степен инвариантна по отношение на избора на различни набори от променливи.

Ротацията по метода на квартимакса цели подобно опростяване само по отношение на редовете на факторната матрица. Equimax заема междинна позиция? когато въртите фактори по този метод, се прави опит едновременно да се опростят както колоните, така и редовете. Разгледаните методи на ротация се отнасят до ортогонални ротации, т.е. резултатът е несвързани фактори. Методите на директна облиминна и промаксимална ротация се отнасят до наклонени ротации, които водят до корелирани фактори. Терминът ?нормализиран? в имената на методите показва, че факторните натоварвания са нормализирани, тоест те са разделени на корен квадратен от съответната дисперсия.

От всички предложени методи първо ще разгледаме резултата от анализа без завъртане на координатната система – Unrotated. Ако полученият резултат се окаже интерпретируем и ни устройва, тогава можем да спрем дотук. Ако не, можете да завъртите осите и да видите други решения.

Щракваме върху бутона "Зареждане на факторите" и разглеждаме числено натоварванията на факторите.



Спомнете си, че факторните натоварвания са стойностите на коефициентите на корелация на всяка от променливите с всеки от идентифицираните фактори.

Стойност на факторно натоварване, по-голяма от 0,7, показва, че даденият атрибут или променлива е тясно свързана с разглеждания фактор. Колкото по-тясна е връзката на тази характеристика с разглеждания фактор, толкова по-висока е стойността на факторното натоварване. Положителен знак на факторното натоварване показва пряка (а отрицателен знак? - обратна) връзка на тази характеристика с фактора.
И така, от таблицата на факторните натоварвания бяха идентифицирани два фактора. Първият определя RSD - чувство за социално благополучие. Останалите променливи се дължат на втория фактор.

На линия Expl. Var (фиг. 8.5) показва дисперсията, дължаща се на един или друг фактор. На линия Prp. Totl показва съотношението на дисперсията, която се дължи на първия и втория фактор. Следователно, първият фактор представлява 48,5% от общата дисперсия, а вторият фактор представлява 17,0% от общата дисперсия, останалата част се отчита от други неотчетени фактори. В резултат на това двата идентифицирани фактора обясняват 65,5% от общата дисперсия.



Тук също виждаме две групи фактори - RSD и останалата част от набора променливи, от които се откроява JSR - желанието за смяна на работата. Очевидно има смисъл това желание да се изследва по-задълбочено въз основа на събирането на допълнителни данни.

Избор и прецизиране на броя на факторите

След като имаме информация колко вариация е разпределил всеки фактор, можем да се върнем към въпроса колко фактора трябва да останат. По своята същност това решение е произволно. Но има някои общи насоки и на практика спазването им дава най-добри резултати.

Броят на общите фактори (хиперпараметри) се определя чрез изчисляване на собствените стойности (Фигура 8.7) на X матрицата в модула за факторен анализ. За да направите това, в раздела Explained variance (Фиг. 8.4), щракнете върху бутона Scree plot.


Максималният брой общи фактори може да бъде равен на броя на собствените стойности на матрицата на параметрите. Но с увеличаване на броя на факторите, трудностите при тяхното физическо тълкуване нарастват значително.

Първоначално могат да бъдат избрани само фактори със собствени стойности, по-големи от 1. По същество това означава, че ако даден фактор не извлича дисперсия, еквивалентна поне на тази на една променлива, тогава той се пропуска. Този критерий е най-широко използваният. В примера по-горе, въз основа на този критерий, трябва да се запазят само 2 фактора (два основни компонента).

Можете да намерите място на графиката, където намаляването на собствените стойности отляво надясно се забавя възможно най-много. Предполага се, че вдясно от тази точка се намира само "факториален сипей". В съответствие с този критерий можете да оставите 2 или 3 фактора в примера.
От фиг. се вижда, че третият фактор леко увеличава дела на общата дисперсия.

Факторният анализ на параметрите позволява да се открие на ранен етап нарушение на работния процес (поява на дефект) в различни обекти, което често е невъзможно да се забележи чрез директно наблюдение на параметрите. Това се обяснява с факта, че нарушаването на корелациите между параметрите настъпва много по-рано от промяната на един параметър. Такова изкривяване на корелациите позволява своевременно откриване на факторния анализ на параметрите. За целта е достатъчно да имате масиви от регистрирани параметри.

Можете да дадете общи препоръки за използването на факторен анализ, независимо от предметната област.
* Всеки фактор трябва да отчита поне два измерени параметъра.
* Броят на измерванията на параметрите трябва да бъде по-голям от броя на променливите.
* Броят на факторите трябва да бъде обоснован въз основа на физическата интерпретация на процеса.
* Човек винаги трябва да се стреми да гарантира, че броят на факторите е много по-малък от броя на променливите.

Критерият на Кайзер понякога съхранява твърде много фактори, докато критерият за сипеи понякога съхранява твърде малко фактори. И двата критерия обаче са доста добри при нормални условия, когато има относително малко фактори и много променливи. На практика по-важен е въпросът кога може да се интерпретира полученото решение. Следователно обикновено се изследват няколко решения с повече или по-малко фактори и след това се избира това, което има най-голям смисъл.

Пространството на първоначалните характеристики трябва да бъде представено в хомогенни измервателни скали, тъй като това позволява използването на корелационни матрици при изчислението. В противен случай възниква проблемът с "теглата" на различни параметри, което води до необходимостта от използване на ковариационни матрици при изчислението. Следователно може да възникне допълнителен проблем с повторяемостта на резултатите от факторния анализ, когато броят на характеристиките се промени. Трябва да се отбележи, че този проблем се решава просто в пакета Statistica чрез преминаване към стандартизирана форма на представяне на параметрите. В този случай всички параметри стават еквивалентни по отношение на степента на връзката им с процесите в обекта на изследване.

Лошо кондиционирани матрици

Ако има излишни променливи в първоначалния набор от данни и тяхното елиминиране чрез корелационен анализ не е извършено, тогава обратната матрица (8.3) не може да бъде изчислена. Например, ако една променлива е сумата от две други променливи, избрани за този анализ, тогава корелационната матрица за този набор от променливи не може да бъде обърната и факторният анализ по същество не може да бъде извършен. На практика това се случва, когато човек се опитва да приложи факторен анализ към набор от силно зависими променливи, което понякога се случва, например, при обработката на въпросници. Тогава човек може изкуствено да намали всички корелации в матрицата, като добави малка константа към диагоналните елементи на матрицата и след това да я стандартизира. Тази процедура обикновено води до матрица, която може да бъде обърната и следователно към нея може да се приложи факторен анализ. Освен това тази процедура не засяга набора от фактори, но оценките се оказват по-малко точни.

Факторно и регресионно моделиране на системи с променливи състояния

Системата с променливи на състоянието (SVS) е система, чийто отговор зависи не само от входното действие, но и от обобщен постоянен във времето параметър, който определя състоянието. Регулируем усилвател или атенюатор? това е пример за най-простата SPS, в която коефициентът на предаване може да се променя дискретно или плавно според някакъв закон. Изследването на SPS обикновено се извършва за линеаризирани модели, при които преходният процес, свързан с промяна на параметъра на състоянието, се счита за завършен.

Най-широко се използват атенюатори, направени на базата на L-, T- и U-образни връзки на последователни и паралелни диоди. Съпротивлението на диодите под въздействието на управляващия ток може да варира в широк диапазон, което ви позволява да променяте честотната характеристика и затихването в пътя. Независимостта на фазовото изместване при регулирането на затихването в такива атенюатори се постига с помощта на реактивни вериги, включени в основната структура. Очевидно при различно съотношение на съпротивленията на паралелни и последователни диоди може да се получи същото ниво на въведено затихване. Но промяната във фазовото изместване ще бъде различна.

Нека проучим възможността за опростяване на автоматизирания дизайн на атенюаторите, изключвайки двойната оптимизация на коригиращите вериги и параметрите на управляваните елементи. Като изследван SPS ще използваме електрически контролиран атенюатор, чиято еквивалентна схема е показана на фиг. 8.8. Минималното ниво на затихване се осигурява в случай на ниско съпротивление на елемент Rs и високо съпротивление на елемент Rp. Тъй като съпротивлението на елемента Rs се увеличава и съпротивлението на елемента Rp намалява, затихването на вмъкване се увеличава.

Зависимостите на промяната на фазовото изместване от честотата и затихването за веригата без корекция и с корекция са показани на фиг. 8.9 и 8.10 съответно. В коригирания атенюатор, в диапазона на затихване от 1,3–7,7 dB и честотната лента от 0,01–4,0 GHz, беше постигнато изменение на фазовото изместване не повече от 0,2°. В некоригиран атенюатор промяната във фазовото изместване в същата честотна лента и диапазон на затихване достига 3°. По този начин фазовото изместване се намалява с коефициент почти 15 поради корекцията.


Ние ще разглеждаме коригиращите и контролните параметри като независими променливи или фактори, които влияят на затихването и промяната във фазовото изместване. Това прави възможно, използвайки системата Statistica, да се извърши факторен и регресионен анализ на SPS, за да се установят физически модели между параметрите на веригата и индивидуалните характеристики, както и да се опрости търсенето на оптимални параметри на веригата.

Първоначалните данни бяха формирани по следния начин. За коригиращи параметри и контролни съпротивления, които се различават от оптималните нагоре и надолу върху честотна мрежа от 0,01–4 GHz, бяха изчислени затихването на вмъкване и промяната във фазовото отместване.

Методите за статистическо моделиране, по-специално факторният и регресионният анализ, които преди това не са били използвани за проектиране на дискретни устройства с променливи състояния, позволяват да се разкрият физическите модели на работата на системните елементи. Това допринася за създаването на структурата на устройството въз основа на даден критерий за оптималност. По-специално, този раздел разглежда фазово-инвариантния атенюатор като типичен пример за система с променливи състояния. Идентифицирането и тълкуването на факторните натоварвания, които влияят на различни изследвани характеристики, прави възможно промяната на традиционната методология и значително опростяване на търсенето на коригиращи параметри и контролни параметри.

Установено е, че използването на статистически подход при проектирането на такива устройства е оправдано както за оценка на физиката на тяхната работа, така и за обосноваване на електрически схеми. Статистическото моделиране може значително да намали обема на експерименталните изследвания.

резултати

  • Наблюдението на общи фактори и съответните факторни натоварвания е необходимо идентифициране на вътрешни модели на процеси.
  • За да се определят критичните стойности на контролираните разстояния между факторните натоварвания, е необходимо да се натрупат и обобщят резултатите от факторния анализ за процеси от същия тип.
  • Приложението на факторния анализ не се ограничава до физическите характеристики на процесите. Факторният анализ е едновременно мощен метод за наблюдение на процесите и е приложим при проектирането на системи за различни цели.

Всички явления и процеси от икономическата дейност на предприятията са взаимосвързани и взаимозависими. Някои от тях са пряко свързани, други косвено. Следователно важен методологичен въпрос в икономическия анализ е изследването и измерването на влиянието на факторите върху величината на изследваните икономически показатели.

Факторният анализ в образователната литература се тълкува като част от многовариантния статистически анализ, който комбинира методи за оценка на размерността на набор от наблюдавани променливи чрез изучаване на структурата на ковариационни или корелационни матрици.

Факторният анализ започва своята история в психометрията и в момента се използва широко не само в психологията, но и в неврофизиологията, социологията, политическите науки, икономиката, статистиката и други науки. Основните идеи на факторния анализ са заложени от английския психолог и антрополог Ф. Галтън. Разработването и прилагането на факторния анализ в психологията се извършва от такива учени като: Ch.Spearman, L.Thurstone и R.Kettel. Разработен е математически факторен анализ Хотелинг, Харман, Кайзер, Търстоун, Тъкъри други учени.

Този вид анализ позволява на изследователя да реши две основни задачи: да опише обекта на измерване компактно и в същото време изчерпателно. С помощта на факторния анализ е възможно да се идентифицират факторите, отговорни за наличието на линейни статистически връзки на корелации между наблюдаваните променливи.

Цели на факторния анализ

Например, когато анализира резултатите, получени по няколко скали, изследователят отбелязва, че те са подобни една на друга и имат висок коефициент на корелация, в който случай той може да предположи, че има някои латентна променлива, което може да се използва за обяснение на наблюдаваното сходство на получените оценки. Такава латентна променлива се нарича фактор, който влияе върху множество показатели на други променливи, което води до възможността и необходимостта да се маркира като най-общ, от по-висок порядък.

Така две цели на факторния анализ:

  • определяне на връзките между променливите, тяхната класификация, т.е. "обективна R-класификация";
  • намаляване на броя на променливите.

За идентифициране на най-значимите фактори и в резултат на това факторната структура е най-оправдано да се използва метод на главния компонент. Същността на този метод е да замени корелираните компоненти с некорелирани фактори. Друга важна характеристика на метода е възможността да се ограничат най-информативните основни компоненти и да се изключат останалите от анализа, което опростява интерпретацията на резултатите. Предимството на този метод е също, че той е единственият математически обоснован метод за факторен анализ.

Факторен анализ- методика за цялостно и систематично изследване и измерване на влиянието на факторите върху стойността на ефективния показател.

Видове факторен анализ

Има следните видове факторен анализ:

1) Детерминиран (функционален) - ефективният показател се представя като произведение, частна или алгебрична сума от фактори.

2) Стохастична (корелация) - връзката между показателите за ефективност и фактор е непълна или вероятностна.

3) Директен (дедуктивен) – от общото към частното.

4) Обратно (индуктивно) - от частното към общото.

5) Едностепенни и многостепенни.

6) Статични и динамични.

7) Ретроспективен и проспективен.

Факторният анализ също може да бъде проучване- извършва се при изследване на латентната факторна структура без предположение за броя на факторите и техните натоварвания, и потвърдителенпредназначени да тестват хипотези за броя на факторите и техните натоварвания. Практическото прилагане на факторния анализ започва с проверка на неговите условия.

Задължителни условия за факторен анализ:

  • Всички признаци трябва да са количествени;
  • Броят на характеристиките трябва да бъде два пъти по-голям от броя на променливите;
  • Пробата трябва да бъде хомогенна;
  • Изходните променливи трябва да бъдат разпределени симетрично;
  • Факторният анализ се извършва върху корелиращи променливи.

При анализа променливите, които са силно свързани помежду си, се комбинират в един фактор, в резултат на което дисперсията се преразпределя между компонентите и се получава най-простата и ясна структура от фактори. След комбинирането корелацията на компонентите във всеки фактор един с друг ще бъде по-висока от корелацията им с компоненти от други фактори. Тази процедура също така позволява да се изолират латентни променливи, което е особено важно при анализа на социалните възприятия и ценности.

Етапи на факторния анализ

По правило факторният анализ се извършва на няколко етапа.

Етапи на факторния анализ:

Етап 1. Избор на фактори.

Етап 2. Класификация и систематизация на факторите.

Етап 3. Моделиране на връзката между ефективността и факторните показатели.

Етап 4. Изчисляване на влиянието на факторите и оценка на ролята на всеки от тях за промяна на стойността на ефективния показател.

Етап 5 Практическо използване на факторния модел (изчисляване на резервите за нарастване на ефективния показател).

Според характера на връзката между показателите има детерминистични методиИ стохастичен факторен анализ

Детерминистичен факторен анализе методология за изследване на влиянието на фактори, чиято връзка с показателя за ефективност е функционална, т.е. когато показателят за ефективност на факторния модел е представен като продукт, частна или алгебрична сума от фактори.

Методи за детерминистичен факторен анализ: Метод на верижно заместване; Метод на абсолютните разлики; Метод на относителната разлика; Интегрален метод; Логаритмичен метод.

Този тип факторен анализ е най-често срещаният, тъй като, тъй като е доста лесен за използване (в сравнение със стохастичния анализ), той ви позволява да разберете логиката на основните фактори за развитие на предприятието, да определите количествено тяхното влияние, да разберете кои фактори и в какво пропорция, е възможно и целесъобразно да се промени за подобряване на ефективността на производството.

Стохастичен анализе методология за изследване на фактори, чиято връзка с показателя за ефективност, за разлика от функционалната, е непълна, вероятностна (корелация). Ако при функционална (пълна) зависимост, съответната промяна във функцията винаги настъпва при промяна на аргумента, тогава с корелационна връзка промяната в аргумента може да даде няколко стойности на увеличението на функцията, в зависимост от комбинацията от други фактори, които определят този показател.

Методи за стохастичен факторен анализ: Метод на двойна корелация; Множествен корелационен анализ; Матрични модели; Математическо програмиране; Метод за изследване на операциите; Теория на играта.

Необходимо е също така да се прави разлика между статичен и динамичен факторен анализ. Първият тип се използва при изследване на влиянието на факторите върху показателите за изпълнение за съответната дата. Друг вид е методология за изследване на причинно-следствените връзки в динамика.

И накрая, факторният анализ може да бъде ретроспективен, който изучава причините за увеличението на показателите за ефективност за минали периоди и проспективен, който изследва поведението на факторите и показателите за ефективност в бъдеще.

И така, от условието на задачата, представено по-горе, следва, че имаме масив от данни, състоящ се от 24 независими променливи (изявления), които описват текущото състояние на авиокомпания X на международния пазар на въздушен транспорт в различни аспекти. Основната задача на извършвания факторен анализ е да групира твърдения, които са сходни по значение, в макрокатегории, за да се намали броят на променливите и да се оптимизира структурата на данните.

Използвайте менюто Анализ > Намаляване на данни > Фактор, за да отворите прозореца Факторен анализ. Прехвърлете от левия списък към десния променливи за анализ (ql-q24), както е показано на фиг. 5.32. Полето Selection Variable ви позволява да изберете променлива, в контекста на която ще бъде извършен анализът (например класа на полета). В нашия случай оставете това поле празно.

Щракнете върху бутона Descriptives и в диалоговия прозорец, който се отваря (фиг. 5.33), изберете елемента KMO and Barlett "s test of sphericity. Това ще определи доколко наличните данни са подходящи за факторен анализ. Прозорецът Descriptives ви позволява да покажете други необходима описателна статистика.В повечето примери от маркетингови проучвания обаче тези възможности обикновено не се използват.

Ориз. 5.32.

Ориз. 5.33.

Затворете прозореца с описания, като щракнете върху бутона Продължи. След това отворете прозореца Extraction (Фиг. 5.34), като щракнете върху съответния бутон в главния диалогов прозорец Factor Analysis. Този прозорец е предназначен за избор на метод за формиране на факторен модел; направете следното в него.

Ориз. 5.34.

Първо в полето Метод изберете метода за извличане (формиращи) фактори. Общата препоръка за избор на метод е следната. Необходимо е да изберете метода за извличане на фактори, който ви позволява недвусмислено да класифицирате възможно най-много променливи. По този начин основните съображения тук са броят на класифицираните фактори и уникалността на класификацията (т.е. всяка променлива трябва да принадлежи само на един фактор). Както ще видите по-долу, методът на основните компоненти по подразбиране в SPSS в нашия случай ни позволява недвусмислено да класифицираме 22 променливи от 24 налични (92%), което е много добър показател. Въз основа на опита авторът може да твърди, че добър резултат от факторния анализ е делът на недвусмислено класифицирани променливи от поне 90%. Изберете метода на главните компоненти. Този метод е най-подходящ за решаване на повечето проблеми с маркетингови изследвания чрез факторен анализ.

Второ, посочете броя на генерираните фактори (група Extract). По подразбиране е зададен методът за определяне на броя на извлечените фактори въз основа на стойностите на характерните числа (Собствени стойности над). Без да навлизаме в статистически тънкости, отбелязваме, че характерните числа се използват от SPSS за определяне на количествения и качествен състав на извлечените фактори. При предварително зададена стойност на този индикатор, равна на 1, броят на генерираните фактори ще бъде равен на броя на променливите, стойността на характерните числа за които е по-голяма или равна на 1.

Възможно е също така ръчно да кажете на програмата колко фактора да извлече (Брой фактори). Тази функция е предоставена в SPSS, за да намалите ръчно броя на факторите, когато има твърде много променливи с характеристично число, по-голямо от 1. Голям брой фактори е трудно да се интерпретират, така че ако методът на характерните числа не успее да извлече броя на факторите, приемливи за интерпретация (колкото по-малко, толкова по-добре), трябва независимо да посочите броя на факторите в програмата. Тази задача се решава от аналитика във всеки конкретен случай поотделно. Като едно решение можем да препоръчаме увеличаване на броя на собствените стойности от предварително зададена стойност от 1, да речем, на 1,5 или повече. Това ще помогне, ако се получат голям брой фактори с характеристично число, приблизително равно на 1, и няколко (2-3 или повече) фактора - с характеристично число над 1,5 или друга стойност. Освен това, когато ръчно определя броя на факторите, анализаторът може да вземе подходящо решение въз основа на своя опит или на всякакви други предположения. И накрая, трябва да се отбележи, че при ръчно определяне на броя на факторите, които трябва да бъдат извлечени, понякога броят на недвусмислено класифицираните променливи се оказва по-малък, отколкото при метода на извличане по стойността на характерните числа. Тази отрицателна точка обаче се изравнява от повишената видимост на резултатите от факторния анализ - в крайна сметка това ви позволява да се отървете от фактори, в които няма променливи със значителен коефициент на корелация (в нашия случай 0,5).

Затворете диалоговия прозорец Извличане, като щракнете върху бутона Продължи. Изберете типа ротация на матрицата на коефициента (бутон Ротация в основния диалогов прозорец Факторен анализ). Матрицата на коефициента се завърта, за да се доближи факторният модел възможно най-близо до идеала: способността за уникално класифициране на всички променливи. В диалоговия прозорец Завъртане (Фигура 5.35) изберете конкретен метод на завъртане. В повечето случаи методът Varimax е най-приемливият вариант. Той улеснява тълкуването на факторите чрез минимизиране на броя на променливите с високо факторно натоварване. Изберете този тип завъртане и затворете диалоговия прозорец, като щракнете върху бутона Продължи.

Ориз. 5.35.

След това отворете диалоговия прозорец Факторни резултати (Фигура 5.36), като щракнете върху бутона Резултати. Този прозорец се използва за създаване на нови променливи в оригиналния файл с данни, което по-късно ще позволи на всеки респондент да бъде причислен към определена група (фактор). Броят на новосъздадените променливи е равен на броя на извлечените фактори. По-долу ще покажем как да използвате тези променливи. Изберете опцията Запиши като променливи в диалоговия прозорец Факторни резултати и изберете регресионния модел Regression като метод за определяне на стойностите за тези нови променливи. След това затворете диалоговия прозорец, като щракнете върху бутона Продължи.

Ориз. 5.36.

Последната стъпка преди започване на процедурата за факторен анализ е изборът на някои допълнителни параметри (бутон Опции). В диалоговия прозорец, който се отваря (фиг. 5.37), изберете два елемента: Сортирани по размер и Потискане на абсолютни стойности по-малко от. Първата опция ви позволява да покажете променливите, включени във всеки фактор в низходящ ред на факторните им коефициенти (стойността на приноса на променливата към формирането на фактора). Вторият се оказва много полезен, тъй като улеснява задачата за еднозначно тълкуване на получените фактори. Стойността на този параметър, посочена в съответното поле (в нашия случай 0,5), отрязва променливи с факторни коефициенти, по-малки от тази стойност. Това прави възможно опростяването на ротираната факторна матрица, тъй като незначителните променливи, включени във всеки извлечен фактор, изчезват от нея. Ако не активирате тази опция, факторен коефициент за всеки фактор ще бъде показан за всяка променлива, което ненужно ще претовари факторния модел и ще затрудни изследователите да го разберат.

Параметърът Потискане на абсолютни стойности по-малко от е въведен, за да се улесни практическата интерпретация на резултатите от факторния анализ. Тъй като факторните коефициенти в получената ротирана матрица на коефициента са коефициентите на корелация между съответните променливи и фактори, в повечето практически случаи е разумно първоначалната гранична стойност на незначителните променливи да се зададе на ниво 0,5. Ако резултатът от факторния анализ е, че броят на класифицираните променливи е по-малък от приемливия (например, ако структурата на данните не е подходяща за факторен анализ; вижте по-долу), можете да преизчислите факторния модел с по-ниска гранична стойност (за например 0,4). В обратната ситуация, ако променливата е включена в няколко фактора, може да се предложи повишаване на нивото на извличане от 0,5 на 0,6. Това ще елиминира променливите, включени в няколко фактора наведнъж, увеличавайки практическата пригодност на резултатите от факторния анализ.

И така, след като посочите всички необходими параметри в прозореца с опции, затворете го (бутона Продължи) и стартирайте процедурата за факторен анализ, като щракнете върху бутона 0K в главния диалогов прозорец за факторен анализ.

Ориз. 5.37.

След като програмата направи всички необходими изчисления, ще се отвори прозорецът SPSS Viewer с резултатите от изграждането на факторен модел. Първото нещо, което ни интересува, е пригодността на наличните данни за факторен анализ като цяло. Нека да разгледаме таблицата на KMO и теста на Barlett (Фигура 5.38).Тя има два показателя, които ни интересуват: теста KMO и значимостта на теста Barlett.Резултатите от теста на KMO ни позволяват да заключим за цялостната пригодност на налични данни за факторен анализ, тоест колко добре факторният модел описва структурата на отговорите на респондентите на анализираните въпроси. Резултатите от този тест варират от 0 (факторният модел е абсолютно неприложим) до 1 (факторният модел идеално описва структурата на данните).до 1. В нашия случай този показател е 0,9, което е много добър резултат.

Тестът на Барлет за сферичност тества хипотезата, че променливите, включени във факторния анализ, не са корелирани една с друга. Ако този тест даде положителен резултат (променливите не са корелирани), факторният анализ трябва да се счита за неподходящ за използване на други статистически методи (например, клъстерен анализ) Статистиката, която определя пригодността на факторния анализ според теста на Барлет, е значимостта (линия Sig.).

значимост (под 0,05), факторният анализ се счита за подходящ за анализ на изследваната проба. В нашия случай разглежданият тест показва много ниска значимост (под 0,001), което предполага извода за приложимостта на факторния анализ.

И така, въз основа на тестовете на KMO и Barlett, стигнахме до заключението, че данните, които имаме, са почти идеални за изследване с помощта на факторен анализ.

Ориз. 5.38.

Следващата стъпка в тълкуването на резултатите от факторния анализ е да се вземе предвид получената ротирана матрица на коефициентите на факторите: таблицата на ротираната матрица на компонентите (Фигура 5.39). Тази таблица е основният резултат от факторния анализ. Той отразява резултатите от класификацията на променливите по фактори. В нашия случай, използвайки автоматичния метод за определяне на броя на факторите (на базата на характерни числа, по-големи от 1), беше изграден практически приемлив факторен модел, в който 22 от 24 променливи бяха еднозначно класифицирани от малък брой фактори (5 ). Този резултат може да се счита за добър.

С некласифицирани променливи можете да направите следното. Просто трябва да преизчислите факторния модел, като премахнете предварително зададената гранична стойност от 0,5 в диалоговия прозорец Опции. След това ще бъде изградена факторна матрица (фиг. 5.40), в която анализаторът независимо ще определи принадлежността на некласифицирани променливи към един или друг фактор въз основа на критерия за най-висок коефициент на корелация между променливи и пет фактора. В нашия случай виждате, че променливата ql6 е най-корелирана с фактор 1 (факториален коефициент 0,468) и следователно трябва да бъде приписана на този фактор, а променливата q24 - с фактор 4 (0,474).

След като сме класифицирали недвусмислено всички променливи, се връщаме към таблицата на фиг. 5.40. Получихме пет групи променливи (фактори), които описват текущата конкурентна позиция на авиокомпания X от пет различни гледни точки. Ето ги групите.

q2. Airline X може да се конкурира с най-добрите авиокомпании в света. q3. Вярвам, че Airline X има обещаващо бъдеще в световната авиация. q23. Airline X е по-добра, отколкото повечето хора си мислят. q!4. Airline X е лицето на Русия.

Ориз. 5.39.

qlO. Airline X наистина се грижи за пътниците.

ql. Авиокомпания X има репутация на отлично обслужване на пътниците.

q21. Airline X е ефективна авиокомпания. q5. Горд съм, че работя за Airline X.

ql6. Услугата на Airline X е последователна и разпознаваема по целия свят.

ql2. Вярвам, че висшите мениджъри правят всичко възможно, за да постигнат успеха на една авиокомпания.

qll. Съществува висока степен на удовлетворение от работата сред служителите на авиокомпанията.

q6. В рамките на авиокомпания X има добра комуникация между отделите.

q8. Сега Airline X се подобрява бързо.

q7. Всеки служител на авиокомпанията полага всички усилия, за да осигури нейния успех.

q4. Знам каква ще бъде бъдещата стратегия на Airline X.

ql7. Не бих искал авиокомпания X да се променя.

q20. Промените в авиокомпания X ще бъдат нещо положително.

ql8. Авиокомпания X трябва да се промени, за да използва пълния си потенциал.

q9. Трябва да извървим дълъг път, преди да можем да твърдим, че сме авиокомпания от световна класа.

q22. Бих искал да видя подобряване на имиджа на авиокомпания X по отношение на чуждестранните пътници.

q24. Важно е хората по целия свят да знаят, че ние сме руска авиокомпания.

ql9. Мисля, че Airline X трябва да се представи визуално по по-модерен начин.

ql3. Харесва ми как Airline X се представя визуално на широката публика (по отношение на цветове и марка).

ql5. Изглеждаме като „вчера“ в сравнение с други авиокомпании.

Най-трудната задача във факторния анализ е интерпретацията на получените фактори. Тук няма универсално решение: във всеки конкретен случай анализаторът използва наличния практически опит, за да разбере защо факторният модел свързва тази или онази променлива с този конкретен фактор. Има случаи (особено при малък брой добре формализирани променливи), когато образуваните фактори са очевидни и разликите между променливите са видими с просто око. В такава ситуация можете да се справите без факторен анализ и да разделите променливите на групи ръчно. Въпреки това, ефективността и силата на факторния анализ се проявяват в сложни и нетривиални случаи, когато променливите не могат да бъдат класифицирани предварително и техните формулировки са объркващи. Тогава класификацията на променливите ще бъде от голям изследователски интерес именно въз основа на мненията на респондентите, което ще позволи да се установи как самите респонденти са разбрали този или онзи въпрос.

Когато е възможно и подходящо за целите на изследването, променливите трябва да бъдат формализирани преди факторния анализ. Това ще позволи на анализатора да направи предположения предварително относно разделянето на набора от налични променливи на групи. Задачата на изследователя да интерпретира резултатите от факторната матрица в този случай ще бъде опростена, тъй като той вече няма да започне „от нулата“. Неговата задача ще бъде сведена до тестване на предварително изложени хипотези за принадлежността на определена променлива към определена група.

Понякога има случаи, когато променлива, присвоена от SPSS на конкретен фактор, логически не е свързана по никакъв начин с другите променливи, които съставляват същия фактор. Можете да преизчислите факторния модел, без да отрязвате незначими коефициенти (както в примера на Фигура 5.40) и да видите с какъв друг фактор корелира дадена нелогическа променлива с почти същата сила като фактора, към който е присвоена автоматично. Например променлива Z има коефициент на корелация 0,505 с коефициент 1 и коефициент на корелация 0,491 с коефициент 2. SPSS автоматично присвоява тази променлива на фактора, с който е открита най-висока корелация, без да взема предвид, че с друг фактор тази променлива корелира с почти същата сила. Именно в тази ситуация (с малка разлика в коефициентите на корелация) може да се опита да припише променливата Z на фактор 2 и ако се окаже логично, да я разгледа в групата променливи от втория фактор.

Можете ръчно да намалите броя на извлечените фактори, което ще улесни изследователя при интерпретирането на резултатите от факторния анализ. Трябва обаче да се има предвид, че подобно намаление ще намали гъвкавостта на факторния модел и дори може да доведе до ситуация, при която променливите са неправилно разделени на неправилни, от практическа гледна точка, групи. Освен това намаляването на броя на извличащите се фактори неизбежно ще намали дела на уникално класифицираните фактори.

Като вариант на предишното решение можем да предложим комбиниране на два или повече фактора с малък брой променливи, включени в тях. Такова групиране, от една страна, ще намали броя на факторите, които трябва да се интерпретират, а от друга страна, ще улесни разбирането на малките фактори.

Ако изследователят е в задънена улица и никакви средства не помагат да се обясни принадлежността на определена променлива към определен фактор, остава да се приложи друга статистическа процедура (например клъстерен анализ).

Нека се върнем към нашите пет фактора. Задачата да ги опишем и обясним не е много трудна. Така може да се отбележи, че твърденията, включени в първия фактор (q2, q3, q23, ql4, qlO, ql, q21, q5 и ql6) са общи, т.е. те се отнасят за цялата авиокомпания и описват отношението на въздуха пътници към него. Единственото изключение е променливата q5, която е по-свързана с втория фактор. Коефициентът на корелация с фактор 2 е 0,355 (виж фиг. 5.40), което позволява да се причисли към тази група по логични причини. Фактор 2 (ql2, qll, q6, q8, q7 и q4) описва отношението на служителите към авиокомпания X. Третият фактор (ql7, q20 и ql8) описва отношението на респондентите към промените в авиокомпанията (включва всички твърдения, които имат корен "men" - от думата "промяна"). Четвъртият фактор (q9, q22 и q24) описва отношението на респондентите към имиджа на авиокомпанията. И накрая, петият фактор (ql9, ql3 и ql5) съчетава твърденията, които характеризират отношението на респондентите към визуалния образ на авиокомпания X.

По този начин получихме пет групи изявления, описващи текущата конкурентна позиция на компания X на международния пазар на въздушен транспорт. Въз основа на интерпретативния (семантичен) анализ на тези групи (фактори) могат да бъдат приписани следните определения.

¦ Фактор 1 характеризира общата позиция на авиокомпания X в очите на нейните клиенти.

¦ Фактор 2 характеризира вътрешното състояние на авиокомпания X от гледна точка на нейните служители.

¦ Фактор 3 характеризира промените, настъпващи в авиокомпания X.

¦ Фактор 4 характеризира имиджа на авиокомпания Х.

¦ Фактор 5 характеризира визуалния образ на авиокомпания X.

След като сме интерпретирали успешно всички получени фактори, можем да считаме факторния анализ за завършен и успешен. След това ще покажем как резултатите от факторния анализ могат да се използват за конструиране на секции.

Спомнете си, че съхранихме факторните резултати (т.е. принадлежността на всеки респондент към определен фактор) в оригиналния файл с данни като нови променливи. Тези променливи имат имена като: facX_Y, където X е факторният номер, а Y е поредният номер на факторния модел. Ако изградим факторен модел два пъти и в резултат три фактора са извлечени първия път и два втория, имената на променливите ще бъдат както следва:

¦ facl_l, fac2_l, fac3_l (за три фактора от първия конструиран модел);

¦ facl_2, fac2_2 (за два фактора от втория модел).

В нашия случай ще бъдат създадени пет нови променливи (според броя на извлечените фактори). Тези факторни оценки могат по-късно да се използват, например, за изграждане на съкращения. По този начин, ако е необходимо да се разбере как респондентите - мъже и жени - оценяват различни аспекти от дейността на авиокомпания X, това може да стане с помощта на анализа на факторните оценки.

Най-често срещаният начин за използване на факторни рейтинги в по-нататъшни изчисления е да се класират и след това да се разделят новосъздадените променливи, представляващи извлечените фактори, на четири квартила (25% процентили). Този подход ви позволява да създавате нови променливи с порядъчна скала, която описва четирите нива на всеки фактор. В нашия случай, за твърденията, които съставляват фактор 2, тези нива ще бъдат: не съм съгласен (състоянието на вътрешните работи на компанията не удовлетворява служителите), по-скоро не съм съгласен (оценката на вътрешната ситуация в компанията е под средното) , по-скоро съгласен (оценка над средното), съгласен (оценка Отличен).

За да създадете променливи, по които респондентите ще бъдат допълнително групирани, извикайте менюто Трансформиране > Класиране на случаите. В диалоговия прозорец, който се отваря (Фигура 5.41), изберете променливата, съдържаща факторните оценки за фактор 2 (fac2_l) от левия списък и я поставете в полето Променливи. След това в областта Присвояване на ранг I изберете елемента с най-малка стойност, в нашия случай това означава, че първата група (несъгласни) ще бъде съставена от респонденти, които оценяват състоянието на вътрешните работи на авиокомпанията като лошо. Съответно, групи 2, 3 и 4 ще бъдат определени съответно за категориите по-скоро несъгласен, по-скоро съгласен и съгласен.

Ориз. 5.41.

Щракнете върху Типове класиране > Типове, премахнете отметката от опцията Класиране по подразбиране и вместо това изберете Ntiles с брой групи по подразбиране 4 (Фигура 5.42). Щракнете върху бутона Продължи и след това в главния диалогов прозорец върху OK. Тази процедура ще създаде нова променлива nfac2_l (2 означава втория фактор) във файла с данни, която разделя респондентите на четири групи.

Ориз. 5.42.

Всички респонденти в извадката се характеризират с положително, по-скоро положително, по-скоро отрицателно или отрицателно отношение към текущото състояние на нещата в авиокомпания X. За да се увеличи видимостта, се препоръчва да се присвоят етикети на всяко от четирите идентифицирани нива; можете също да преименувате самата променлива. Вече можете да правите кръстосани анализи с новата ординална променлива, както и да изграждате други статистически модели, предоставени от SPSS. По-долу ще покажем как да използваме резултатите от изграждането на факторен модел в клъстерен анализ.

За да илюстрирам възможностите практическа употребаКато нова променлива ще анализираме кръстосано влиянието на пола на респондентите върху оценката им за текущото състояние на нещата в авиокомпания X (фиг. 5.43). Както следва от представената таблица, анкетираните мъже като цяло са склонни да дават по-ниска оценка на разглеждания параметър на авиокомпанията в сравнение с жените. И така, в структурата на оценките много лошо, лошо и задоволително преобладават мъжете; в оценките много добър, напротив, преобладават жените. При преминаване към всяка следваща (по-висока) категория оценки делът на мъжете равномерно намалява, докато делът на жените съответно нараства. Тест %2 показва, че идентифицираната връзка е статистически значима.

Ориз. 5.43. Кръстосано разпределение: влиянието на пола на респондентите върху оценката им за текущото състояние на нещата в авиокомпания X

Тяхната класификация
В съвременната статистика факторният анализ се разбира като набор от методи, които на базата на реални връзки на характеристики, обекти или явления позволяват да се идентифицират латентен(скрити и недостъпни за пряко измерване) обобщаващи характеристики на организираната структура и механизма на развитие на изучаваните явления или процеси.

Концепцията за латентност е ключова и означава имплицитност на характеристиките, разкрити чрез методите на факторния анализ.

Идеята зад факторния анализ е доста проста. В резултат на измерването имаме работа с набор от елементарни характеристики х азизмерено на няколко скали. Това - явни променливи.Ако знаците се променят съвместно, тогава можем да предположим съществуването на определени общи причини тази променливост, т.е. наличието на някои скрити (латентни) фактори. Задачата на анализа е да открие тези фактори.

Тъй като факторите са комбинация от определени променливи, следва, че тези променливи са свързани една с друга, т.е. имат корелация (ковариация), освен това по-голяма помежду си, отколкото с други променливи, включени в друг фактор. Методите за намиране на фактори се основават на използването на коефициенти на корелация (ковариация) между променливите. Факторният анализ дава нетривиално решение, т.е. решението не може да бъде предвидено без прилагане на специална техника за извличане на фактори. Това решение е от голямо значение за характеризиране на явлението, тъй като първоначално то се характеризираше с достатъчно голям брой променливи, а в резултат на анализа се оказа, че може да се характеризира с по-малък брой други променливи - фактори. .

Не само явни променливи могат да бъдат корелирани х аз , но и наблюдаеми обекти н аз. В зависимост от това какъв тип корелация се разглежда - между признаци или обекти - се разграничават съответно R и Q техники за обработка на данни.

В съответствие със основни принципифакторен анализ, резултатът от всяко измерване се определя от действието на общи фактори, специфични фактори и "фактора" на грешка при измерване. Общсе наричат ​​факторите, влияещи върху резултатите от измерванията на няколко измервателни скали. Всеки от специфиченфактори влияе върху резултата от измерването само на една от скалите. Под грешка при измерванетова предполага набор от безброй причини, които определят резултатите от измерването. Променливостта на получените емпирични данни обикновено се описва с помощта на тяхната дисперсия.


Вече добре знаете, че коефициентът на корелация най-често се използва за количествено определяне на връзката между две променливи. Има много разновидности на този коефициент, като изборът на адекватна мярка за връзка се определя както от спецификата на емпиричните данни, така и от измервателната скала.

Съществува обаче и геометрична възможност за описание на връзката между характеристиките. Графично коефициентът на корелация между две променливи може да бъде представен като два вектора - стрелки, произхождащи от една точка. Тези вектори са разположени под ъгъл един спрямо друг, чийто косинус е равен на коефициента на корелация. Косинусът на ъгъл е тригонометрична функция, чиято стойност може да бъде намерена в справочника. В рамките на тази тема няма да обсъждаме тригонометричната косинусова функция, достатъчно е да знаете къде да намерите съответните данни.

Таблица 7.1 изброява няколко стойности за косинусите на ъглите, за да ви даде обща представа за тях.

Таблица 7.1

Таблица на косинусите за графично изображение

корелации между променливите.

Според тази обща положителна корелационна таблица ( r1) ще съответства на ъгъл от 0 ( cos 0 1), т.е. графично това ще съответства на пълното съвпадение на двата вектора (виж фиг. 7.3 а).

Пълна отрицателна корелация ( r -1) означава, че двата вектора лежат на една и съща права линия, но са насочени в противоположни посоки ( cos 180 -1). (Фиг. 7.3 b).

Взаимна независимост на променливите ( r = 0) е еквивалентно на взаимната перпендикулярност (ортогоналност) на векторите ( cos 90°= 0). (Фиг. 7.3 c).

Междинните стойности на коефициента на корелация, изобразени като двойки вектори, образуващи или остри ( r > 0), или тъп ( r   0 0 , r 1  180, r -1

V 1

V 2

А b
90, r 0   90, r  0   90, r  0

V 2

V 1
Фигура 7.3. Геометрична интерпретация на коефициентите на корелация.

Геометричен подход към факторния анализ


Горната геометрична интерпретация на коефициента на корелация е основа за графично представянецялата корелационна матрица и последваща интерпретация на данните във факторния анализ.

Конструирането на матрица започва с конструирането на вектор, представящ всяка променлива. Другите променливи са представени от вектори с еднаква дължина, всички идващи от една и съща точка. Като пример, разгледайте геометричния израз на корелациите между пет променливи. (Фигура 7.4.)


V 1

V 5 V 2

V 4
Фигура 7.4. Геометрична интерпретация на корелационната матрица (5x5).
Ясно е, че не винаги е възможно да се представи корелацията в две измерения (на равнина). Някои променливи вектори трябва да са под ъгъл спрямо страницата. Този факт не е проблем за реалните математически процедури, но изисква малко въображение от читателя. Фигура 7.5. може да се види, че корелацията между променливите V1 V2 е голяма и положителна (защото има малки ъгли между тези вектори). Променливите V2 V3 са практически независими една от друга, т.к ъгълът между тях е много близък до 90  , т.е. корелацията е 0. Променливите V3 - V5 са силно и отрицателно свързани една с друга. Високите корелации между V1 и V2 са доказателство, че и двете от тези променливи практически измерват едно и също свойство и че всъщност една от тези променливи може да бъде изключена от по-нататъшно разглеждане без значителна загуба на информация. Най-информативни за нас са променливите, независими една от друга, т.е. имащи минимални корелации помежду си или ъгли, съответстващи на 90  (фиг. 7.5.)

V 1

Фигура 7.5. Геометрична интерпретация на корелационната матрица
Тази фигура показва, че има две групи корелации: V 1, V 2, V 3 и V 4, V5. Корелациите между променливите V 1, V 2 , V 3 са много големи и положителни (има малки ъгли между тези вектори и, следователно, големи стойности на косинуса). По същия начин, корелацията между променливите V 4 и V 5 също е голяма и положителна. Но между тези групи променливи корелацията е близка до нула, тъй като тези групи променливи са почти ортогонални една спрямо друга, т.е. разположени една спрямо друга под прав ъгъл. Горният пример показва, че има две групи корелации и информацията, получена от тези променливи, може да бъде апроксимирана чрез два общи фактора (F 1 и F 2), които в този случай са ортогонални един на друг. Това обаче не винаги е така. Разновидностите на факторния анализ, при които се изчисляват корелации между фактори, които не са ортогонални, се наричат ​​косо решение. Ние обаче няма да разглеждаме такива случаи в рамките на този курс и ще се съсредоточим изключително върху ортогоналните решения.

Чрез измерване на ъгъла между всеки общ фактор и всяка обща променлива могат да бъдат изчислени корелациите между тези променливи и съответните фактори. Корелацията между променлива и общ фактор обикновено се нарича факторно натоварване. Геометричната интерпретация на това понятие е дадена на фиг. 7.6.

F2


2023 г
newmagazineroom.ru - Счетоводни отчети. UNVD. Заплата и персонал. Валутни операции. Плащане на данъци. ДДС. Застрахователни премии