Методы факторного анализа. Факторный анализ в экономике Факторный анализ определение выражение латентности графическое изображение

Итак, из условия представленной выше задачи следует, что у нас есть массив данных, состоящий из 24 независимых переменных (утверждений), в различных аспектах описывающих текущее состояние авиакомпании X на международном рынке авиаперевозок. Основной задачей проводимого факторного анализа является группировка схожих по смыслу утверждений в макрокатегории с целью сократить число переменных и оптимизировать структуру данных.

При помощи меню Analyze >Data Reduction > Factor вызовите окно Factor Analysis. Перенесите из левого списка в правый переменные для анализа (ql-q24), как показано на рис. 5.32. Поле Selection Variable позволяет выбрать переменную, в разрезе которой будет проводиться анализ (например, класс полета). В нашем случае оставьте это поле Пустым.

Щелкните на кнопке Descriptives и в открывшемся диалоговом окне (рис. 5.33) выберите пункт КМО and Barlett"s test of sphericity. Это позволит определить, насколько имеющиеся данные пригодны для факторного анализа. Окно Descriptives позволяет вывести и другие необходимые описательные статистики. Однако в большинстве примеров из маркетинговых исследований эти возможности, как правило, не используются.

Рис. 5.32.

Рис. 5.33.

Закройте окно Descriptives, щелкнув на кнопке Continue. Далее откройте окно Extraction (рис. 5.34), щелкнув на соответствующей кнопке в главном диалоговом окне Factor Analysis. Это окно предназначено для выбора метода формирования факторной модели; выполните в нем следующие действия.

Рис. 5.34.

Во-первых, в поле Method выберите метод извлечения (формирования) факторов. Общая рекомендация по выбору метода состоит в следующем. Необходимо выбирать тот метод извлечения факторов, который позволяет однозначно классифицировать как можно больше переменных. Таким образом, основные соображения здесь -- число классифицированных факторов и однозначность классификации (то есть каждая переменная должна принадлежать только одному фактору). Как вы увидите ниже, установленный по умолчанию в SPSS метод Principal components в нашем случае позволяет однозначно классифицировать 22 переменные из 24 имеющихся (92 %), что является весьма хорошим показателем. На основании имеющегося опыта автор может утверждать, что хорошим результатом факторного анализа является доля однозначно классифицированных переменных не менее 90 %. Выберите метод Principal components. Данный метод является наиболее подходящим для решения большинства задач маркетинговых исследований при помощи факторного анализа.

Во-вторых, укажите количество образуемых факторов (группа Extract). По умолчанию установлен метод определения количества извлекаемых факторов на основании значений характеристических чисел (Eigenvalues over). He вдаваясь в статистические тонкости, отметим, что характеристические числа используются SPSS для определения количественного и качественного состава извлекаемых факторов. При предустановленном значении данного показателя, равном 1, количество образуемых факторов будет равно количеству переменных, значение характеристических чисел для которых больше или равно 1.

Также существует возможность вручную указать программе, сколько факторов необходимо извлекать (Number of factors). Эта возможность предусмотрена в SPSS для того, чтобы при слишком большом количестве переменных с характеристическим числом больше 1 вручную сократить число факторов. Большое число факторов трудно интерпретировать, поэтому если методом характеристических чисел не удается извлечь приемлемое для интерпретации число факторов (чем меньше, тем лучше), следует самостоятельно указать программе число факторов. Эта задача решается аналитиком в каждом конкретном случае индивидуально. В качестве одного из вариантов решения можно рекомендовать увеличить число eigenvalue с предустановленного значения 1, скажем, до 1,5 или более. Это поможет, если получено большое число факторов с характеристическим числом, приблизительно равным 1, и несколько (2-3 и более) факторов -- с характеристическим числом более 1,5 или другого значения. Также при ручном определении количества факторов аналитик может принять релевантное решение, основываясь на своем опыте или на каких-либо иных предположениях. И наконец, необходимо отметить, что при ручном указании числа извлекаемых факторов иногда количество однозначно классифицированных переменных оказывается меньше, чем при методе экстракции по величине характеристических чисел. Однако данный негативный момент нивелируется возросшей наглядностью результатов факторного анализа -- ведь это позволяет освободиться от факторов, в которых нет переменных со значимым коэффициентом корреляции (в нашем случае 0,5).

Закройте диалоговое окно Extraction, щелкнув на кнопке Continue. Выберите тип ротации матрицы коэффициентов (кнопка Rotation в главном диалоговом окне Factor Analysis). Ротация коэффициентной матрицы производится для того, чтобы максимально приблизить факторную модель к идеалу: возможности однозначно классифицировать все переменные. В диалоговом окне Rotation (рис. 5.35) выберите конкретный метод ротации. В большинстве случаев наиболее приемлемым вариантом является метод Varimax. Он облегчает интерпретацию факторов, минимизируя количество переменных с высокими факторными нагрузками. Выберите этот тип ротации и закройте диалоговое окно, щелкнув на кнопке Continue.

Рис. 5.35.

Далее откройте диалоговое окно Factor Scores (рис. 5.36), щелкнув на кнопке Scores. Это окно служит для создания в исходном файле данных новых переменных, которые в дальнейшем позволят отнести каждого респондента к определенной группе (фактору). Число вновь создаваемых переменных равно числу извлеченных факторов. Ниже мы покажем, каким образом использовать данные переменные. Выберите в диалоговом окне Factor Scores параметр Save as variables, а в качестве метода определения значений для этих новых переменных -- регрессионную модель Regression. После этого закройте диалоговое окно, щелкнув на кнопке Continue.

Рис. 5.36.

Последним этапом перед запуском процедуры факторного анализа является выбор некоторых дополнительных параметров (кнопка Options). В открывшемся диалоговом окне (рис. 5.37) выберите два пункта: Sorted by size и Suppress absolute values less than. Первая опция позволяет вывести переменные, входящие в каждый фактор, в порядке убывания их факторных коэффициентов (величины вклада переменной в формирование фактора). Вторая оказывается весьма полезна, так как облегчает задачу однозначной интерпретации полученных факторов. Указанное в соответствующем поле значение данного параметра (в нашем случае 0,5) отсекает переменные с факторными коэффициентами менее данного значения. Это позволяет упростить ротированную матрицу факторов, поскольку из нее исчезают незначимые переменные, входящие в каждый извлеченный фактор. Если вы не задействуете данный параметр, для каждой переменной будет отображен факторный коэффициент по каждому фактору, что излишне перегрузит факторную модель и затруднит ее восприятие исследователями.

Параметр Suppress absolute values less than вводится, чтобы облегчить практическую интерпретацию результатов факторного анализа. Так как факторные коэффициенты в результирующей ротированной матрице коэффициентов являются коэффициентами корреляции между соответствующими переменными и факторами, в большинстве практических случаев целесообразно устанавливать начальное значение отсечения незначимых переменных на уровне 0,5. Если в результате факторного анализа окажется, что число классифицированных переменных менее приемлемого (например, если структура данных не вполне подходит для факторного анализа; см. ниже), можно пересчитать факторную модель с меньшим значением отсечения (например, 0,4). В обратной ситуации, если переменная входит в несколько факторов, можно предложить повысить уровень экстракции с 0,5 до 0,6. Это позволит устранить переменные, входящие сразу в несколько факторов, увеличив практическую пригодность результатов факторного анализа.

Итак, указав все необходимые параметры в окне Options, закройте его (кнопка Continue) и запустите процедуру факторного анализа при помощи щелчка на кнопке 0К в главном диалоговом окне Factor Analysis.

Рис. 5.37.

После того как программа произведет все необходимые расчеты, откроется окно SPSS Viewer с результатами построения факторной модели. Первое, что нас интересует, -- это пригодность имеющихся данных для факторного анализа в целом. Посмотрим на таблицу КМО and Barlett"s Test (рис. 5.38). В ней есть два интересующих нас показателя: тест КМО и значимость теста Barlett. Результаты теста КМО позволяют сделать вывод относительно общей пригодности имеющихся данных для факторного анализа, то есть насколько хорошо построенная факторная модель описывает структуру ответов респондентов на анализируемые вопросы. Результаты данного теста варьируются в интервале от 0 (факторная модель абсолютно неприменима) до 1 (факторная модель идеально описывает структуру данных). Факторный анализ следует считать пригодным, если КМО находится в пределах от 0,5 до 1. В нашем случае этот показатель равен 0,9, что является весьма хорошим результатом.

Barlett"s test of sphericity проверяет гипотезу о том, что переменные, участвующие в факторном анализе, некоррелированы между собой. Если данный тест дает положительный результат (переменные некоррелированы), факторный анализ следует признать непригодным использовать другие статистические методы (например, кластерный анализ). Статистикой, определяющей пригодность факторного анализа по тесту Barlett, является значимость (строка Sig.). При приемлемом уровне

значимости (ниже 0,05) факторный анализ считается пригодным для анализа исследуемой выборочной совокупности. В нашем случае рассматриваемый тест показывает весьма низкую значимость (менее 0,001), из чего следует вывод о применимости факторного анализа.

Итак, на основании тестов КМО и Barlett мы пришли к выводу, что имеющиеся у нас данные практически идеально подходят для исследования при помощи факторного анализа.

Рис. 5.38.

Следующим шагом в интерпретации результатов факторного анализа является рассмотрение результирующей ротированной матрицы факторных коэффициентов: таблицы Rotated Component Matrix (рис. 5.39). Данная таблица является основным результатом факторного анализа. В ней отражаются результаты классификации переменных по факторам. В нашем случае при помощи автоматического метода определения количества факторов (на основании характеристических чисел больше 1) была построена практически приемлемая факторная модель, в которой 22 из 24 переменных удалось однозначно классифицировать по небольшому числу факторов (5). Данный результат может считаться хорошим.

С неклассифицированными переменными можно поступить следующим образом. Необходимо просто пересчитать факторную модель, удалив в диалоговом окне Options ранее установленное значение отсечения 0,5. Далее будет построена факторная матрица (рис. 5.40), в которой аналитику предстоит самостоятельно определить принадлежность неклассифицированных переменных к тому или иному фактору на основании критерия наибольшего коэффициента корреляции между переменными и пятью факторами. В нашем случае вы видите, что переменная ql6 в наибольшей степени коррелирует с фактором 1 (факторный коэффициент 0,468) и, следовательно, должна быть отнесена к данному фактору, а переменная q24 -- с фактором 4 (0,474).

После того как мы однозначно классифицировали все переменные, вернемся к таблице на рис. 5.40. Мы получили пять групп переменных (факторов), описывающих текущую конкурентную позицию авиакомпании X с пяти различных сторон. Вот эти группы.

q2. Авиакомпания X может конкурировать с лучшими авиакомпаниями мира. q3. Я верю, что у авиакомпании X есть перспективное будущее в мировой авиации. q23. Авиакомпания X -- лучше, чем многие о ней думают. q!4. Авиакомпания X -- лицо России.

Рис. 5.39.

qlO. Авиакомпания Х действительно заботится о пассажирах.

ql. Авиакомпания X обладает репутацией компаний, превосходно обслуживающей пассажиров.

q21. Авиакомпания X -- эффективная авиакомпания. q5. Я горжусь тем, что работаю в авиакомпании X.

ql6. Обслуживание авиакомпании X является последовательным и узнаваемым во всем мире.

ql2. Я верю, что менеджеры высшего звена прикладывают все усилия для достижения успеха авиакомпании.

qll. Среди сотрудников авиакомпании имеет место высокая степень удовлетворенности работой.

q6. Внутри авиакомпании X хорошее взаимодействие между подразделениями.

q8. Сейчас авиакомпания X быстро улучшается.

q7. Каждый сотрудник авиакомпании прикладывает все усилия для того, чтобы обеспечить ее успех.

q4. Я знаю, какой будет стратегия развития авиакомпании X в будущем.

ql7. Я бы не хотел, чтобы авиакомпания X менялась.

q20. Изменения в авиакомпании X будут позитивным моментом.

ql8. Авиакомпании X необходимо меняться для того, чтобы использовать в полной мере имеющийся потенциал.

q9. Нам предстоит долгий путь, прежде чем мы сможем претендовать на то, чтобы называться авиакомпанией мирового класса.

q22. Я бы хотел, чтобы имидж авиакомпании X улучшился с точки зрения иностранных пассажиров.

q24. Важно, чтобы люди во всем мире знали, что мы -- российская авиакомпания.

ql9. Я думаю, что авиакомпании X необходимо представить себя в визуальном плане более современно.

ql3. Мне нравится, как в настоящее время авиакомпания X представлена визуально широкой общественности (в плане цветовой гаммы и фирменного стиля).

ql5. Мы выглядим «вчерашним днем» по сравнению с другими авиакомпаниями.

Наиболее сложной задачей при проведении факторного анализа является интерпретация полученных факторов. Здесь не существует какого-либо универсального решения: в каждом конкретном случае, аналитик использует имеющийся практический опыт для того, чтобы понять, почему факторная модель относит ту или иную переменную к данному конкретному фактору. Бывают случаи (особенно при малом числе хорошо формализованных переменных), когда образованные факторы являются очевидными и различия между переменными видны невооруженным глазом. В такой ситуации можно обойтись без факторного анализа и разбить переменные на группы вручную. Однако эффективность и мощь факторного анализа проявляются в сложных и нетривиальных случаях, когда переменные нельзя заранее классифицировать, а их формулировки запутаны. Тогда большой исследовательский интерес будет вызывать классификация переменных именно на основании мнений респондентов, что позволит выявить то, как сами опрошенные поняли тот или иной вопрос.

Когда это возможно и приемлемо для целей исследования, следует формализовать переменные до проведения факторного анализа. Это позволит аналитику заранее сделать предположения о разделении совокупности имеющихся переменных на группы. Задача исследователя при интерпретации результатов факторной матрицы в данном случае упростится, так как он уже не будет начинать «с чистого листа». Его задача сведется к проверке ранее выдвинутых гипотез о принадлежности той или иной переменной к конкретной группе.

Иногда возникают случаи, когда переменная, отнесенная SPSS к конкретному фактору, логически никак не связана с остальными переменными, составляющими тот же фактор. Можно пересчитать факторную модель без отсечения незначимых коэффициентов (как в примере на рис. 5.40) и посмотреть, с каким еще фактором данная нелогичная переменная коррелирует практически с той же силой, как с фактором, к которому она была отнесена автоматически. Например, переменная Z имеет коэффициент корреляции с фактором 1, равный 0,505, а с фактором 2 она коррелирует с коэффициентом 0,491. SPSS автоматически относит данную переменную к тому фактору, с которым выявлена наибольшая корреляция, не учитывая при этом, что с другим фактором данная переменная коррелирует практически с той же силой. Именно в такой ситуации (при небольшой разнице в коэффициентах корреляции) можно попробовать отнести переменную Z к фактору 2, и если это окажется логичным, рассматривать ее в группе переменных из второго фактора.

Можно вручную сократить число извлекаемых факторов, что облегчит задачу исследователя при интерпретации результатов факторного анализа. Однако необходимо иметь в виду, что такое сокращение снизит гибкость факторной модели и даже может привести к ситуации, когда переменные будут ложно разделены на неверные, с практической точки зрения, группы. Также снижение числа извлекаемых факторов неизбежно снизит и долю однозначно классифицированных факторов.

В качестве варианта предыдущего решения можно предложить объединить два или более факторов с небольшими количествами входящих в них переменных. Такая группировка, с одной стороны, позволит снизить число интерпретируемых факторов, а с другой -- облегчит понимание малочисленных факторов.

Если исследователь зашел в тупик и никакие средства не помогают объяснить принадлежность той или иной переменной к конкретному фактору, остается применить другую статистическую процедуру (например, кластерный анализ).

Вернемся к нашим пяти факторам. Задача их описания и объяснения представляется не очень сложной. Так, можно заметить, что утверждения, входящие в первый фактор (q2, q3, q23, ql4, qlO, ql, q21, q5 и ql6), являются общими, то есть касаются всей авиакомпании и описывают отношение к ней со стороны авиапассажиров. Единственное исключение составила переменная q5, имеющая отношение скорее ко второму фактору. Коэффициент корреляции с фактором 2 -- 0,355 (см. рис. 5.40), что позволяет отнести его в данную группу из соображений логики. Фактор 2 (ql2, qll, q6, q8, q7 и q4) описывает отношение к авиакомпании X со стороны сотрудников. Третий фактор (ql7, q20 и ql8) описывает отношение респондентов к изменениям в авиакомпании (в него попали все утверждения, имеющие корень «мен» -- от слова «изменение»). Четвертый фактор (q9, q22 и q24) описывает отношение респондентов к имиджу авиакомпании. Наконец, пятый фактор (ql9, ql3 и ql5) объединяет утверждения, характеризующие отношение респондентов к визуальному образу авиакомпании X.

Таким образом, мы получили пять групп утверждений, описывающих текущую конкурентную позицию компании X на международном рынке авиаперевозок. На основании проведенного интерпретационного (семантического) анализа можно присвоить данным группам (факторам) следующие определения.

¦ Фактор 1 характеризует общее положение авиакомпании X в глазах ее клиентов.

¦ Фактор 2 характеризует внутреннее состояние авиакомпании X с точки зрения ее сотрудников.

¦ Фактор 3 характеризует изменения, происходящие в авиакомпании X.

¦ Фактор 4 характеризует имидж авиакомпании X.

¦ Фактор 5 характеризует визуальный образ авиакомпании X.

После того как мы успешно интерпретировали все полученные факторы, можно считать факторный анализ завершенным и удавшимся. Далее мы покажем, как можно использовать результаты факторного анализа для построения разрезов.

Вспомним о том, что мы сохранили факторные рейтинги (то есть принадлежность каждого респондента к определенному фактору) в исходном файле данных в виде новых переменных. Эти переменные имеют имена типа: facX_Y, где X -- это номер фактора, a Y -- порядковый номер факторной модели. Если мы строили факторную модель дважды и в результате в первый раз было извлечено три фактора, а во второй -- два, имена переменных будут следующими:

¦ facl_l, fac2_l, fac3_l (для трех факторов из первой построенной модели);

¦ facl_2, fac2_2 (для двух факторов из второй модели).

В нашем случае будет создано пять новых переменных (по числу извлеченных факторов). Эти факторные рейтинги в дальнейшем могут использоваться, например, для построения разрезов. Так, если необходимо выяснить, каким образом респонденты -- мужчины и женщины -- оценивают различные стороны деятельности авиакомпании X, это можно сделать при помощи анализа факторных рейтингов.

Наиболее частый способ использования факторных рейтингов в дальнейших расчетах -- это ранжирование и последующее разделение вновь созданных переменных, обозначающих извлеченные факторы, на четыре квартиля (25%-проценти-ля). Такой подход позволяет создать новые переменные с порядковой шкалой, описывающие четыре уровня каждого фактора. В нашем случае для утверждений, составляющих фактор 2, такими уровнями будут: не согласен (состояние внутренних дел компании не удовлетворяет сотрудников), скорее не согласен (оценка внутренней ситуации в компании ниже среднего), скорее согласен (оценка выше среднего), согласен (оценка отлично).

Чтобы создать переменные, по которым далее будут группироваться респонденты, вызовите меню Transform > Rank Cases. В открывшемся диалоговом окне (рис. 5.41) из левого списка выберите переменную, содержащую факторные рейтинги для фактора 2 (fac2_l), и поместите ее в поле Variables. Далее в области Assign Rank I to выберите пункт Smallest value, в нашем случае это означает, что первую группу (не согласен) составят респонденты, оценивающие состояние внутренних дел авиакомпании как плохое. Соответственно группы 2, 3 и 4 будут определены для категорий скорее не согласен, скорее согласен и согласен соответственно.

Рис. 5.41.

Щелкните на Rank Types > Types, отмените установленный по умолчанию параметр Rank и вместо него выберите Ntiles с предустановленным числом групп, равным 4 (рис. 5.42). Щелкните на кнопке Continue и затем в главном диалоговом окне на ОК. Данная процедура создаст в файле данных новую переменную nfac2_l (2 означает второй фактор), распределяющую респондентов на четыре группы.

Рис. 5.42.

Все респонденты в выборке характеризуются положительным, скорее положительным, скорее отрицательным или отрицательным отношением к текущему состоянию дел в авиакомпании X. Для повышения наглядности рекомендуется присвоить метки каждому из выделенных четырех уровней; можно переименовать и саму переменную. Теперь вы можете проводить перекрестный анализ при помощи новой порядковой переменной, а также строить другие статистические модели, предусмотренные в SPSS. Ниже будет показано, как использовать результаты построения факторной модели в кластерном анализе.

Для иллюстрации возможностей практического использования новой переменной проведем перекрестный анализ влияния пола респондентов на их оценку текущего состояния дел в авиакомпании X (рис. 5.43). Как следует из представленной таблицы, респонденты-мужчины в целом склонны ставить более низкие оценки рассматриваемому параметру авиакомпании по сравнению с женщинами. Так, в структуре оценок очень плохо, плохо и удовлетворительно доля мужчин преобладает; в оценках очень хорошо, напротив, преобладают женщины. При переходе в каждую следующую (более высокую) категорию оценок доля мужчин равномерно убывает, а доля женщин, соответственно, возрастает. Тест %2 показывает, что выявленная зависимость является статистически значимой.

Рис. 5.43. Перекрестное распределение: влияние пола респондентов на их оценку текущего состояния дел в авиакомпании X

Факторный анализ является одним из наиболее мощных статистических средств анализа данных. В его основе лежит процедура объединения групп коррелирующих друг с другом переменных («корреляционных плеяд» или «корреляционных узлов») в несколько факторов.

Иными словами, цель факторного анализа - сконцентрировать исходную информацию, выражая большое число рассматриваемых признаков через меньшее число более емких внутренних характеристик, которые, однако, не поддаются непосредственному измерению (и в этом смысле являются латентными).

Для примера гипотетически представим себе законодательный орган регионального уровня, состоящий из 100 депутатов. В числе разных вопросов повестки дня на голосование выносятся: а) законопроект, предлагающий восстановить памятник В.И. Ленину на центральной площади города - административного центра региона; б) обращение к Президенту РФ с требованием вернуть в государственную собственность все стратегические производства. Матрица сопряженности показывает следующее распределение голосов депутатов:

	Памятник Ленину (за)	Памятник Ленину (против)
Обращение к Президенту (за)	49	4
Обращение к Президенту (против)	6	41

Очевидно, что голосования статистически связаны: подавляющее большинство депутатов, поддерживающих идею восстановления памятника Ленину, поддерживают и возвращение в государственную собственность стратегических предприятий. Аналогичным образом большинство противников восстановления памятника являются в то же время и противниками возврата предприятий в госсобственность. При этом тематически голосования между собой совершенно не связаны.

Логично предположить, что выявленная статистическая связь обусловлена существованием некоторого скрытого (латентного) фактора. Законодатели, формулируя свою точку зрения по самым разнообразным вопросам, руководствуются ограниченным, небольшим набором политических позиций. В данном случае можно предположить наличие скрытого раскола депутатского корпуса по критерию поддержки/отвержения консервативно-социалистических ценностей. Выделяется группа «консерваторов» (согласно нашей таблице сопряженности - 49 депутатов) и их оппонентов (41 депутат). Выявив такие расколы, мы сможем описать большое число отдельных голосований через небольшое число факторов, которые являются латентными в том смысле, что мы не можем их обнаружить непосредственно: в нашем гипотетическом парламенте ни разу не проводилось голосование, в ходе которого депутатам предлагалось бы определить свое отношение к консервативно-социалистическим ценностям. Мы обнаруживаем наличие данного фактора, исходя из содержательного анализа количественных связей между переменными. Причем, если в нашем примере сознательно взяты номинальные переменные - поддержка законопроекта с категориями «за» (1) и «против» (0), - то в действительности факторный анализ эффективно обрабатывает интервальные данные.

Факторный анализ очень активно используется как в политической науке, так и в «соседних» социологии и психологии. Одна из важных причин большой востребованности данного метода состоит в разнообразии задач, которые можно решать с его помощью. Так, выделяются по крайней мере три «типовые» цели факторного анализа:

· уменьшение размерности (редукция) данных. Факторный анализ, выделяя узлы взаимосвязанных признаков и сводя их к неким обобщенным факторам, уменьшает исходный базис признаков описания. Решение этой задачи важно в ситуации, когда объекты измерены большим числом переменных и исследователь ищет способ сгруппировать их по смысловому признаку. Переход от множества переменных к нескольким факторам позволяет сделать описание более компактным, избавиться от малоинформативных и дублирующих переменных;

Выявление структуры объектов или признаков (классификация). Эта задача близка к той, которая решается методом кластер-анализа. Но если кластер-анализ принимает за «координаты» объектов их значения по нескольким переменным, то факторный анализ определяет положение объекта относительно факторов (связанных групп переменных). Иными словами, с помощью факторного анализа можно оценить сходство и различие объектов в пространстве их корреляционных связей, или в факторном пространстве. Координатными осями факторного пространства выступают полученные латентные переменные, на эти оси проецируются рассматриваемые объекты, что позволяет создать наглядное геометрическое представление изучаемых данных, удобное для содержательной интерпретации;

Косвенное измерение. Факторы, являясь латентными (эмпирически не наблюдаемыми), не поддаются непосредственному измерению. Однако факторный анализ позволяет не только выявить латентные переменные, но и оценить количественно их значение для каждого объекта.

Рассмотрим алгоритм и интерпретацию статистики факторного анализа на примере данных о результатах парламентских выборов в Рязанской области 1999 г. (общефедеральный округ). Для упрощения примера возьмем электоральную статистику только по тем партиям, которые преодолели 5%-ный барьер. Данные взяты в разрезе территориальных избирательных комиссий (по городам и районам области).

Первым шагом будет стандартизация данных путем перевода их в стандартные баллы (так называемые Л-баллы, рассчитываемые с помощью функции нормального распределения).

ТИК (территориальная избирательная комиссия)	«Яблоко»	«Единство»	Блок Жириновского	ОВР	КПРФ	СПС
Ермишинская	1,49	35,19	6,12	5,35	31,41	2,80
Захаровская	2,74	18,33	7,41	11,41	31,59	л б 3 "
Кадомская	1,09	29,61	8,36	5,53	35,87	1,94
Касимовская	1,30	39,56	5,92	5,28	29,96	2,37
Касимовская городская	3,28	39,41	5,65	6,14	24,66	4,61
То же в стандартизированных баллах (г-баллах)
Ермишинская	-0,83	1,58	-0,25	-0,91	-0,17	-0,74
Захаровская	-0,22	-1,16	0,97	0,44	-0,14	0,43
Кадомская	-1,03	0,67	1,88	-0,87	0,59	-1,10
Касимовская	-0,93	2,29	-0,44	-0,92	-0,42	-0,92
Касимовская городская	0,04	2,26	-0,70	-0,73	-1,32	0,01
И т.д. (всего 32 случая)

	«Яблоко»	«Единство»	БЖ	ОВР	КПРФ	СПС
«Яблоко»
«Единство»	-0,55
БЖ	-0,47	0,27
ОВР	0,60	-0,72	-0,47
КПРФ	-0,61	0,01	0,10	-0,48
СПС	0,94	-0,45	-0,39	0,52	-0,67

Уже визуальный анализ матрицы парных корреляций позволяет сделать предположения о составе и характере корреляционных плеяд. К примеру, положительные корреляции обнаруживаются для «Союза правых сил», «Яблока» и блока «Отечество - вся Россия» (пары «Яблоко» - ОВР, «Яблоко» - СПС и ОВР - СПС). Одновременно эти три переменные отрицательно коррелируют с КПРФ (поддержка КПРФ), в меньшей степени - с «Единством» (поддержка «Единства») и в еще меньшей - с переменной БЖ (поддержка «Блока Жириновского»). Таким образом, предположительно мы имеем две выраженные корреляционные плеяды:

(«Яблоко» + ОВР + СПС) - КПРФ;

(«Яблоко» + ОВР + СПС) - «Единство».

Это две разные плеяды, а не одна, так как между «Единством» и КПРФ связи нет (0,01). Относительно переменной БЖ предположение сделать сложнее, здесь корреляционные связи менее выражены.

Чтобы проверить наши предположения, необходимо ВЫЧИСлить собственные значения факторов (eigenvalues), факторные значения (factor scores) и факторные нагрузки (factor loadings) для каждой переменной. Такие расчеты достаточно сложны, требуют серьезных навыков работы с матрицами, поэтому здесь мы не станем рассматривать вычислительный аспект. Скажем лишь, что эти вычисления могут осуществляться двумя путями: методом главных компонент (principal components) и методом главных факторов (principal factors). Метод главных компонент более распространен, статистические программы используют его «по умолчанию».

Остановимся на интерпретации собственных значений, факторных значений и факторных нагрузок.

Собственные значения факторов для нашего случая таковы:

bgcolor=white>5

Фактор	Собственное значение	% общей вариации
1	3,52	58,75
2	1,14	19,08
3	0,76	12,64
4	0,49	S.22
0,05	0.80
6	0,03	0,51
Всего	6	100%

Чем больше собственное значение фактора, тем больше его объяснительная сила (максимальное значение равно количеству переменных, в нашем случае 6). Одним из ключевых элементов статистики факторного анализа является показатель «% общей вариации» (% total variance). Он показывает, какую долю вариации (изменчивости) переменных объясняет извлеченный фактор. В нашем случае вес первого фактора превосходит вес всех остальных факторов, вместе взятых: он объясняет почти 59% общей вариации. Второй фактор объясняет 19% вариации, третий - 12,6% и т.д. по убывающей.

Имея собственные значения факторов, мы можем приступить к решению задачи сокращения размерности данных. Редукция произойдет за счет исключения из модели факторов, обладающих наименьшей объяснительной силой. И здесь ключевой вопрос состоит в том, сколько факторов оставить в модели и какими критериями при этом руководствоваться. Так, явно лишними являются факторы 5 и 6, в совокупности объясняющие чуть более 1% всей вариации. А вот судьба факторов 3 и 4 уже не столь очевидна.

Как правило, в модели остаются факторы, собственное значение которых превышает единицу (критерий Кайзера). В нашем случае это факторы 1 и 2. Однако полезно проверить корректность удаления четырех факторов с помощью других критериев. Одним из наиболее широко используемых методов является анализ «графика осыпи» (scree plot). Для нашего случая он имеет вид:

График получил свое название из-за сходства со склоном горы. «Осыпь» - геологический термин, обозначающий обломки горных пород, скапливающиеся в нижней части скалистого склона. «Скала» - это по-настоящему влиятельные факторы, «осыпь» - статистический шум. Образно говоря, нужно найти место на графике, где кончается «скала» и начинается «осыпь» (где убывание собственных значений слева направо сильно замедляется). В нашем случае выбор нужно сделать из первого и второго перегибов, соответствующих двум и четырем факторам. Оставив четыре фактора, мы получим очень высокую точность модели (более 98% общей вариации), но сделаем ее достаточно сложной. Оставив два фактора, мы будем иметь значительную необъясненную часть вариации (около 22%), но модель станет лаконичной и удобной в анализе (в частности, визуальном). Таким образом, в данном случае лучше пожертвовать некоторой долей точности в пользу компактности, оставив первый и второй факторы.

Проверить адекватность полученной модели можно с помощью специальных матриц воспроизведенных корреляций (reproduced correlations) и остаточных коэффициентов (residual correlations). Матрица воспроизведенных корреляций содержит коэффициенты, которые удалось восстановить по двум оставленным в модели факторам. Особое значение в ней имеет главная диагональ, на которой расположены общности переменных (в таблице выделены курсивом), которые показывают, насколько точно модель воспроизводит корреляцию переменной с той же переменной, которая должна составлять единицу.

Матрица остаточных коэффициентов содержит разность между исходным и воспроизведенным коэффициентами. Например, воспроизведенная корреляция между переменными СПС и «Яблоко» составляет 0,88, исходная - 0,94. Остаток = 0,94 - 0,88 = 0,06. Чем ниже значения остатков, тем выше качество модели.

Воспроизведенные корреляции
	«Яблоко»	«Единство»	БЖ	ОВР	КПРФ	СПС
«Яблоко»	0,89
«Единство»	-0,53	0,80
БЖ	-0,47	0,59	0,44
ОВР	0,73	-0,72	-0,56	0,76
КПРФ	-0,70	0,01	0,12	-0,34	0,89
СПС	0,88 -0,43		-0,40	0,66	-0,77	0,88
Остаточные коэффициенты
	«Яблоко»	«Единство»	БЖ	ОВР	КПРФ	СПС
«Яблоко»	0,11
«Единство»	-0,02	0,20
БЖ	0,00	-0,31	0,56
ОВР	-0,13	-0,01	0,09	0,24
КПРФ	0,09	0,00	-0,02	-0,14	0,11
СПС	0,06	-0,03	0,01	-0,14	0,10	0,12

Как видно из матриц, двухфакторная модель, будучи в целом адекватной, плохо объясняет отдельные связи. Так, очень низкой является общность переменной БЖ (всего 0,56), слишком велико значение остаточного коэффициента связи БЖ и «Единства» (-0,31).

Теперь необходимо решить, насколько важным для данного конкретного исследования является адекватное представление переменной БЖ. Если важность высока (к примеру, если исследование посвящено анализу электората именно этой партии), корректно вернуться к четырехфакторной модели. Если нет, можно оставить два фактора.
Принимая во внимание учебный характер наших задач, оставим более простую модели.

Факторные нагрузки можно представить как коэффициенты корреляции каждой переменной с каждым из выявленных факторов 1ак, корреляция между значениями первой факторной переменной и значениями переменной «Яблоко» составляет -0,93. Все факторные нагрузки приводятся в матрице факторного отображения-

Чем теснее связь переменной с рассматриваемым фактором, тем выше значение факторной нагрузки. Положительный знак факторной нагрузки указывает на прямую, а отрицательный знак - на обратную связь переменной с фактором.

Имея значения факторных нагрузок, мы можем построить геометрическое представление результатов факторного анализа. По оси X отложим нагрузки переменных на фактор 1, по оси Y- нагрузки переменных на фактор 2 и получим двухмерное факторное пространство.

Перед тем как приступить к содержательному анализу полученных результатов, осуществим еще одну операцию - вращение (rotation). Важность этой операции продиктована тем, что существует не один, а множество вариантов матрицы факторных нагрузок, в равной степени объясняющих связи переменных (матрицу интеркорреляций). Необходимо выбрать такое решение, которое проще интерпретировать содержательно. Таковым считается матрица нагрузок, в которой значения каждой переменной по каждому фактору максимизированы или минимизированы (приближены к единице или к нулю).

Рассмотрим схематичный пример. Имеется четыре объекта, расположенных в факторном пространстве следующим образом:

Нагрузки на оба фактора для всех объектов существенно отличны от нуля, и мы вынуждены привлекать оба фактора для интерпретации положения объектов. Но если «повернуть» всю конструкцию по часовой стрелке вокруг пересечения осей координат, получим следующую картинку:

В данном случае нагрузки на фактор 1 будут близки к нулю, а нагрузки на фактор 2 - к единице (принцип простой структуры). Соответственно, для содержательной интерпретации положения объектов мы будем привлекать только один фактор - фактор 2.

Существует довольно большое количество методов вращения факторов. Так, группа методов ортогонального вращения всегда сохраняет прямой угол между координатными осями. К таковым относятся vanmax (минимизирует количество переменных с высокой факторной нагрузкой), quartimax (минимизирует количество факторов, необходимых для объяснения переменной), equamax (сочетание двух предыдущих методов). Методы косоугольного вращения не обязательно сохраняют прямой угол между осями (например, direct obiimin). Метод promax представляет собой сочетание ортогонального и косоугольного методов вращения. В большинстве случаев используется метод vanmax, который дает хорошие результаты применительно и к большинству задач политических исследований. Кроме того, как и в процессе применения многих других методов, рекомендуется поэкспериментировать с различными техниками вращения.

В нашем примере после вращения методом varimax получаем следующую матрицу факторных нагрузок:

Соответственно, геометрическое представление факторного пространства будет иметь вид:

Теперь можно приступить к содержательной интерпретации полученных результатов. Ключевую оппозицию - электоральный раскол - по первому фактору формируют КПРФ с одной стороны и «Яблоко» и СПС (в меньшей степени ОВР) - с другой. Содержательно - исходя из специфики идеологических установок названных субъектов избирательного процесса - мы можем интерпретировать данное размежевание как «лево-правый» раскол, являющийся «классическим» для политической науки.

Оппозицию по фактору 2 формируют ОВР и «Единство». К последнему примыкает «Блок Жириновского», но достоверно судить о его положении в факторном пространстве мы не можем в силу особенностей модели, которая плохо объясняет связи именно этой переменной. Чтобы объяснить такую конфигурацию, необходимо вспомнить политические реалии избирательной кампании 1999 г. Тогда борьба внутри политической элиты привела к формированию двух эшелонов «партии власти» - блоков «Единство» и «Отечество - вся Россия». Различие между ними не носило идеологического характера: фактически населению предложили выбирать не из двух идейных платформ, а из двух элитных групп, каждая из которых располагала существенными властными ресурсами и региональной поддержкой. Таким образом, этот раскол можно интерпретировать как «властно-элитный» (или, несколько упрощая, «власть - оппозиция»).

В целом мы получаем геометрическое представление некоего электорального пространства Рязанской области для данных выборов, если понимать электоральное пространство как пространство электорального выбора, структуру ключевых политических альтернатив («расколов»). Комбинация именно этих двух расколов была очень типична для парламентских выборов 1999 г.

Сопоставляя результаты факторного анализа для одного и того же региона на разных выборах, мы можем судить о наличии преемственности в конфигурации пространства электорального выбора территории. К примеру, факторный анализ федеральных парламентских выборов (1995, 1999 и 2003 гг.), проходивших в Татарстане, показал устойчивую конфигурацию электорального пространства. Для выборов 1999 г. в модели оставлен всего один фактор с объяснительной силой 83% вариации, что сделало невозможным построение двухмерной диаграммы. В соответствующем столбце приведены факторные нагрузки.

Если внимательно присмотреться к этим результатам, можно заметить, что в республике от выборов к выборам воспроизводится один и тот же основной раскол: «"партия власти” - все остальные». «Партией власти» в 1995 г. выступал блок «Наш дом - Россия» (НДР), в 1999 г. - ОВР, в 2003 г. - «Единая Россия». С течением времени меняются лишь «детали» - название «партии власти». Новый политический «лейбл» очень легко ложится в статичную матрицу одномерного политического выбора.

В заключение главы дадим один практический совет. Успешность освоения статистических методов по большому счету возможна только при интенсивной практической работе со специальными программами (уже неоднократно упомянутые SPSS, Statistica или хотя бы Microsoft Excel). Не случайно изложение статистических техник ведется нами в режиме алгоритмов работы: это позволяет студенту самостоятельно пройти все стадии анализа, сидя за компьютером. Без попыток практического анализа реальных данных представление о возможностях статистических методов в политическом анализе неизбежно останется общим и абстрактным. А на сегодняшний день умение применять статистику для решения и теоретических, и прикладных задач - принципиально важная составляющая модели специалиста-политолога.

Контрольные вопросы и задания

1. Каким уровням измерения соответствуют средние величины - мода, медиана, среднее арифметическое? Какие меры вариации характерны для каждой из них?

2. В силу каких причин необходимо учитывать форму распределения переменных?

3. Что означает утверждение: «Между двумя переменными имеется статистическая связь»?

4. Какую полезную информацию о связях между переменными можно получить на основе анализа таблиц сопряженности?

5. Что можно узнать о связи между переменными, исходя из значений статистических критериев хи-квадрат и лямбда?

6. Дайте определение понятию «ошибка» в статистических исследованиях. Каким образом по данному показателю можно судить о качестве построенной статистической модели?

7. Какова основная цель корреляционного анализа? Какие характеристики статистической связи выявляет данный метод?

8. Как интерпретировать значение коэффициента корреляции Пирсона?

9. Охарактеризуйте метод дисперсионного анализа. В каких других статистических методах используется статистика дисперсионного анализа и для чего?

10. Объясните значение понятия «нулевая гипотеза».

11. Что такое линия регрессии, каким методом она строится?

12. Что показывает коэффициент R в итоговой статистике регрессионного анализа?

13. Поясните термин «метод многомерной классификации».

14. Объясните основные различия между кластеризацией посредством иерархического кластер-анализа и методом К-средних.

15. Каким образом кластер-анализ может использоваться при изучении имиджа политических лидеров?

16. Какова основная задача, решаемая посредством дискриминантного анализа? Дайте определение дискриминантной функции.

17. Назовите три класса задач, решаемых с помощью факторного анализа. Конкретизируйте понятие «фактор».

18. Дайте характеристику трем основным методам проверки качества модели в факторном анализе (критерий Кайзера, критерий «осыпи», матрица воспроизведенных корреляций).

Міжнародна міграція фінансових ресурсів у контексті факторного аналізу

25. Ж.-Б. Сэй вошел в историю экономической науки как автор факторной теории стоимости. Каковы основные положения этой теории?

Технико-экономический анализ строительного проекта и анализ обеспечения по запрашиваемому строительному кредиту

Введение в факторный анализ

В течение последних лет факторный анализ нашел свое применение среди широкого круга исследователей в основном благодаря развитию высокоскоростных компьютеров и пакетов статистических программ (например, DATATEXT, BMD, OSIRIS, SAS и SPSS). Это также коснулось большой группы пользователей, не имеющих соответствующей математической подготовки, но, тем не менее, заинтересованных в использовании потенциальных возможностей факторного анализа в своих исследованиях (Harman, 1976; Horst, 1965; Lawley и Maxswel, 1971; Mulaik, 1972).

Факторный анализ предполагает, что изучаемые переменные представляют собой линейную комбинацию некоторых скрытых (латентных) ненаблюдаемых факторов. Иными словами, существует система факторов и система изучаемых переменных. Определенная зависимость между этими двумя системами позволяет посредством факторного анализа с учетом имеющейся зависимости получать выводы по изучаемым переменным (факторам). Логическая сущность этой зависимости состоит в том, что каузальная система факторов (система независимых и зависимых переменных) всегда имеет уникальную корреляционную систему изучаемых переменных, а не наоборот. Только при жестко ограниченных условиях, налагаемых на факторный анализ, возможна недвусмысленная интерпретация каузальных структур по факторам на наличие корреляции между изучаемыми переменными. Кроме этого, существуют проблемы и другой природы. Например, при сборе эмпирических данных возможно допущение разного рода ошибок и неточностей, что в свою очередь затрудняет работу по выделению скрытых ненаблюдаемых параметров и их дальнейшего исследования.

Что же такое факторный анализ? Факторный анализ относится к множеству статистических техник, основная задача которых состоит в представлении множества изучаемых признаков в виде сокращенной системы гипотетических переменных. Факторный анализ - исследовательский эмпирический метод, который преимущественно находит свое применение в социальных и психологических дисциплинах.

В качестве примера использования факторного анализа можно рассмотреть изучение свойств личности с помощью психологических тестов. Свойства личности не поддаются прямому измерению, о них можно судить только на основании поведения человека, ответов на те или иные вопросы и т.д. Для объяснения собранных эмпирических данных их результаты подвергаются факторному анализу, который и позволяет выявить те личностные свойства, которые оказывали влияние на поведение испытуемых в проведенных опытах.

Первым этапом факторного анализа, как правило, является выбор новых признаков, которые являются линейными комбинациями прежних и «вбирают» в себя большую часть общей изменчивости наблюдаемых данных, а поэтому передают большую часть информации, заключенной в первоначальных наблюдениях. Обычно это осуществляют с помощью метода главных компонент, хотя иногда используют и другие приемы (например, метод главных факторов, метод максимального правдоподобия).

Метод главных компонент– статистический прием, позволяющий преобразовывать исходные переменные в их линейную комбинацию (GeorgH.Dunteman). Цель метода – получить сокращенную систему исходных данных, которая намного проще для понимания и дальнейшей статистической обработки. Этот подход был предложен Пирсоном (1901) и независимо от него получил свое дальнейшее развитие у Хотеллинга (1933). Автор пытался минимизировать использование матричной алгебры при работе с данным методом.

Основная цель метода главных компонент – выделение первичных факторов и определение минимального числа общих факторов, которые удовлетворительно воспроизводят корреляции между изучаемыми переменными. Результат данного шага – матрица коэффициентов факторных нагрузок, представляющих собой в ортогональном случае коэффициенты корреляции между переменными и факторами. При определении числа выделяемых факторов используется следующий критерий: выделяются только факторы с собственными значениями больше указанной константы (как правило, единицы).

Однако обычно факторы, полученные методом главных компонент, не поддаются достаточно наглядной интерпретации. Поэтому следующим шагом факторного анализа является преобразование (вращение) факторов таким образом, чтобы облегчить их интерпретацию. Вращение факторов состоит в нахождении наиболее простой факторной структуры, то есть такого варианта оценки факторных нагрузок и остаточных дисперсий, который и дает возможность содержательно интерпретировать общие факторы и нагрузки.

Наиболее часто исследователями в качестве метода вращения используется метод варимакс. Это метод, позволяющий, с одной стороны, за счет минимизации разброса квадратов нагрузок для каждого фактора, получить упрощенную факторную структуру за счет увеличения больших и уменьшения малых факторных нагрузок, с другой стороны.

Итак, основные цели факторного анализа:

сокращение числа переменных (редукция данных);

определение структуры взаимосвязей между переменными, т.е. классификация переменных .

Поэтому факторный анализ используется или как метод сокращения данных или как метод классификации.

Практические примеры и советы по применению факторного анализа можно, найти в книге Стивенса (Stevens, 1986); более подробное описание приводят Кули и Лонес (Cooley, Lohnes, 1971); Харман (Harman, 1976); Ким и Мюллер (Kim, Mueller, 1978a, 1978b); Лоули и Максвелл (Lawley, Maxwell, 1971); Линдеман, Меренда и Голд (Lindeman, Merenda, Gold, 1980); Моррисон (Morrison, 1967) и Мулэйк (Mulaik, 1972). Интерпретация вторичных факторов в иерархическом факторном анализе, как альтернатива традиционному вращению факторов, дана Верри (Wherry, 1984).

Вопросы подготовки данных для применения

факторного анализа

Рассмотрим ряд вопросов и кратких ответов в рамках использования факторного анализа.

Какой уровень измерений требует факторный анализ или, иными словами, в каких шкалах измерений должны представляться данные для факторного анализа?

Факторный анализ требует, чтобы переменные были представлены в интервальной шкале (Stevens, 1946) и отвечали нормальному распределению. Это требование предполагает также, что в качестве входных данных используются ковариационные или корреляционные матрицы.

Должен ли исследователь избегать использования факторного анализа, когда метрическая основа переменных определена неточно, т.е. данные представлены в порядковой шкале?

Нет необходимости. Многие переменные, представляющие, например, измерения мнений испытуемых по большому количеству тестов, не имеют точно установленной метрической базы. Однако, в общем, предполагается, что многие «порядковые переменные» могут содержать числовые значения, не искажающие и даже сохраняющие основные свойства изучаемого признака. Задачи исследователя: а) правильно определить число рефлексивно выделяемых порядков (уровней); б) учесть, что сумма допущенных искажений будет включена в корреляционную матрицу, являющуюся основой входных данных факторного анализа; в) коэффициенты корреляции закрепляются в качестве «порядковых» искажений в измерениях (Labovitz, 1967, 1970;Kim, 1975).

Долгое время считалось, что искажения назначаются числовым значениям именно порядковых категорий. Однако это необоснованно, поскольку и для метрических величин возможны искажения, пусть даже минимальные, в процессе проведения эксперимента. В факторном анализе результаты зависят от возможного допущения ошибок, получаемых в процессе измерения, а не их происхождения и соотнесения к данным определенного типа шкал.

Можно ли использовать факторный анализ для номинальных (дихотомических) переменных?

Многие исследователи утверждают, что использовать факторный анализ для номинальных переменных очень удобно. Во-первых, дихотомические значения (значения, равные «0» и «1») исключают выбор каких-либо иных, отличных от них. Во-вторых, как результат, коэффициент связи является эквивалентом коэффициента корреляции Пирсона, который и выступает в качестве числового значения переменной для факторного анализа.

Однако однозначно положительного ответа на данный вопрос нет. Дихотомические переменные сложно выразить в рамках аналитической факторной модели: каждая переменная имеет значение весовой нагрузки, по крайней мере, двух основных факторов - общего и частного (Kim,Muller). Даже если эти факторы имеют два значения (что довольно редко встречается в реальных факторных моделях), то итоговые результаты в наблюдаемых переменных должны содержать, как минимум, четыре различных значения, которые, в свою очередь, и оправдывают противоречивость использования номинальных переменных. Поэтому факторный анализ для таких переменных используется с целью получения ряда эвристических критериев.

Сколько должно быть переменных для каждого гипотетически построенного фактора?

Предполагается, что для каждого фактора должно быть, по крайней мере, три переменные. Но это требование опускается, если факторный анализ используется для подтверждения какой-либо гипотезы. В общем, исследователи едины в том, что необходимо иметь, по крайней мере, вдвое больше переменных, чем факторов.

Еще один момент касательно данного вопроса. Чем больше размер выборки, тем достовернее значение критерия ХИ -квадрат. Результаты считаются статистически значимыми, если выборка включает как минимум 51 наблюдение. Таким образом:

N-n-150,(3.33)

где N – размер выборки (число измерений),

n – количество переменных (Lawley, Maxwell, 1971).

Это, конечно, только общее правило.

Какой смысл имеет знак факторной нагрузки?

Сам знак не имеет существенного значения и не существует пути для оценки значимости связи между переменной и фактором. Однако знаки переменных, входящих в фактор, имеют специфическое значение относительно знаков других переменных. Различные знаки просто означают, что переменные связаны с фактором в противоположных направлениях.

Например, по результатам факторного анализа было получено, что для пары качеств открытый-замкнутый (многофакторный опросник Кетелла) имеют место соответственно положительная и отрицательная весовые нагрузки. Тогда говорят, что доля качестваоткрытый, в выделенном факторе больше, чем доля качествазамкнутый.

Главные компоненты и факторный анализ

Факторный анализ как метод редукции данных

Предположим, что проводится (до некоторой степени "глупое") исследование, в котором измеряется рост ста людей в метрах и сантиметрах. Таким образом, имеются две переменные. Если далее исследовать, например, влияние разных пищевых добавок на рост, будет ли целесообразным использовать обе переменные? Вероятно, нет, т.к. рост является одной характеристикой человека, независимо от того, в каких единицах он измеряется.

Предположим, что измеряется удовлетворенность людей жизнью с помощью опросника, содержащего различные пункты. Задаются, например, вопросы: удовлетворены ли люди своим хобби (пункт 1) и как интенсивно они им занимаются (пункт 2). Результаты преобразуются так, что средние по уровню ответы (например, для удовлетворенности) соответствуют значению 100, в то время как ниже и выше средних ответов расположены меньшие и большие значения, соответственно. Две переменные (ответы на два разных пункта) коррелированы между собой. Из высокой коррелированности двух этих переменных можно сделать вывод об избыточности двух пунктов опросника. Это, в свою очередь, позволяет осуществить объединение двух переменных в один фактор.

Новая переменная (фактор) будет включать в себя наиболее существенные черты обеих переменных. Итак, фактически, выполнено сокращение исходного числа переменных и осуществлена замена двух переменных одной. Отметим, что новый фактор (переменная) в действительности является линейной комбинацией двух исходных переменных.

Пример, в котором две коррелированные переменные объединены в один фактор, показывает главную идею факторного анализа или, более точно, анализа главных компонент. Если же пример с двумя переменными распространить на большее число переменных, то вычисления становятся сложнее, однако основной принцип представления двух или более зависимых переменных одним фактором остается в силе.

Метод главных компонент

Анализ главных компонент является методом сокращения или редукции данных, т.е. методом сокращения числа переменных. Возникает естественный вопрос: сколько факторов следует выделять? Отметим, что в процессе последовательного выделения факторов они включают в себя все меньше и меньше изменчивости. Решение о том, когда следует остановить процедуру выделения факторов, главным образом зависит от точки зрения на то, что считать малой "случайной" изменчивостью. Это решение достаточно произвольно, однако имеются некоторые рекомендации, позволяющие рационально выбрать число факторов (см. раздел Собственные значения и число выделяемых факторов ).

В случае, когда имеются более двух переменных, можно считать, что они определяют трехмерное "пространство" точно так же, как две переменные определяют плоскость. Если имеется три переменные, то можно построить трехмерную диаграмму рассеяния (см. рис. 3.10).

Рис. 3.10. Трехмерная диаграмма рассеяния признака

Для случая более трех переменных, становится невозможным представить точки на диаграмме рассеяния, однако логика вращения осей с целью максимизации дисперсии нового фактора остается прежней.

После того, как найдена линия, для которой дисперсия максимальна, вокруг нее остается некоторый разброс данных и процедуру естественно повторить. В анализе главных компонент именно так и делается: после того, как первый фактор выделен , то есть, после того, как первая линия проведена, определяется следующая линия, максимизирующая остаточную вариацию (разброс данных вокруг первой прямой), и т.д. Таким образом, факторы последовательно выделяются один за другим. Так как каждый последующий фактор определяется так, чтобы максимизировать изменчивость, оставшуюся от предыдущих, то факторы оказываются независимыми друг от друга (некоррелированными или ортогональными ).

Собственные значения и число выделяемых факторов

Рассмотрим некоторые стандартные результаты анализа главных компонент. При повторных вычислениях выделяются факторы с все меньшей и меньшей дисперсией. Для простоты изложения считают, что обычно работа начинается с матрицы, в которой дисперсии всех переменных равны 1,0. Поэтому общая дисперсия равна числу переменных. Например, если имеется 10 переменных и дисперсия каждой из них равна 1, то наибольшая изменчивость, которая потенциально может быть выделена, равна 10 раз по 1.

Предположим, что при изучении степени удовлетворенности жизнью включено 10 пунктов для измерения различных аспектов удовлетворенности домашней жизнью и работой. Дисперсия, объясненная последовательными факторами, представлена в таблице 3.14:

Таблица 3. 14

Таблица собственных значений

STATISTICA ФАКТОРНЫЙ АНАЛИЗ	Собственные значения (factor.sta) Выделение: Главные компоненты
Значение	Собственные значения	% общей дисперсии	Кумулят. собств. знач.	Кумулят. %

Во втором столбце таблицы 3. 14. (Собственные значения) представлена дисперсия нового, только что выделенного фактора. В третьем столбце для каждого фактора приводится процент от общей дисперсии (в данном примере она равна 10) для каждого фактора. Как видно, первый фактор (значение 1) объясняет 61 процент общей дисперсии, фактор 2 (значение 2) – 18 процентов, и т.д. Четвертый столбец содержит накопленную (кумулятивную) дисперсию.

Итак, дисперсии, выделяемые факторами, названы собственными значениями . Это название происходит из использованного способа вычисления.

Как только получена информация о том, сколько дисперсии выделил каждый фактор, можно возвратиться к вопросу о том, сколько факторов следует оставить. Как говорилось выше, по своей природе это решение произвольно. Однако имеются некоторые общеупотребительные рекомендации, и на практике следование им дает наилучшие результаты.

Критерии выделения факторов

Критерий Кайзера. Сначала отбираются только те факторы, собственные значения которых больше 1. По существу, это означает, что если фактор не выделяет дисперсию, эквивалентную, по крайней мере, дисперсии одной переменной, то он опускается. Этот критерий предложен Кайзером (Kaiser, 1960), и является наиболее широко используемым. В приведенном выше примере (см. табл. 3.14) на основе этого критерия следует сохранить только 2 фактора (две главные компоненты).

Критерий каменистой осыпи является графическим методом, впервые предложенным Кэттелем (Cattell, 1966). Он позволяет изобразить собственные значения в виде простого графика:

Рис. 3. 11. Критерий каменистой осыпи

Оба критерия были изучены подробно Брауном (Browne, 1968), Кэттелем и Джасперсом (Cattell, Jaspers, 1967), Хакстианом, Рожерсом и Кэттелем (Hakstian, Rogers, Cattell, 1982), Линном (Linn, 1968), Тюкером, Купманом и Линном (Tucker, Koopman, Linn, 1969). Кэттель предложил найти такое место на графике, где убывание собственных значений слева направо максимально замедляется. Предполагается, что справа от этой точки находится только «факториальная осыпь» («осыпь» – геологический термин, обозначающий обломки горных пород, скапливающиеся в нижней части скалистого склона). В соответствии с этим критерием можно оставить в рассмотренном примере 2 или 3 фактора.

Какому критерию все-таки следует отдавать предпочтение на практике?Теоретически, можно вычислить характеристики путем генерации случайных данных для конкретного числа факторов. Тогда можно увидеть, обнаружено с помощью используемого критерия достаточно точное число существенных факторов или нет. С использованием этого общего метода первый критерий (критерий Кайзера ) иногда сохраняет слишком много факторов, в то время как второй критерий (критерий каменистой осыпи ) иногда сохраняет слишком мало факторов; однако оба критерия вполне хороши при нормальных условиях, когда имеется относительно небольшое число факторов и много переменных.

На практике возникает важный дополнительный вопрос, а именно: когда полученное решение может быть содержательно интерпретировано. Поэтому обычно исследуется несколько решений с большим или меньшим числом факторов, и затем выбирается одно наиболее "осмысленное". Этот вопрос далее будет рассматриваться в рамках вращений факторов.

Общности

На языке факторного анализа доля дисперсии отдельной переменной, принадлежащая общим факторам (и разделяемая с другими переменными) называется общностью . Поэтому дополнительной работой, стоящей перед исследователем при применении этой модели, является оценка общностей для каждой переменной, т.е. доли дисперсии, которая является общей для всех пунктов. Тогда доля дисперсии , за которую отвечает каждый пункт, равна суммарной дисперсии, соответствующей всем переменным, минус общность (Harman, Jones, 1966).

Главные факторы и главные компоненты

Термин факторный анализ включает как анализ главных компонент, так и анализ главных факторов. Предполагается, что, в целом, известно сколько факторов следует выделить. Можно узнать (1) значимость факторов, (2) можно ли интерпретировать их разумным образом и (3) как это сделать. Чтобы проиллюстрировать, каким образом это может быть сделано, производятся действия "в обратном порядке", то есть, начинают с некоторой осмысленной структуры, а затем смотрят, как она отражается на результатах.

Основное различие двух моделей факторного анализа состоит в том, что в анализе главных компонент предполагается, что должна быть использована вся изменчивость переменных, тогда как в анализе главных факторов используется только изменчивость переменной, общая и для других переменных.

В большинстве случаев эти два метода приводят к весьма близким результатам. Однако анализ главных компонент часто более предпочтителен как метод сокращения данных, в то время как анализ главных факторов лучше применять с целью определения структуры данных.

Факторный анализ как метод классификации данных

Корреляционная матрица

Первый этап факторного анализа предусматривает вычисление корреляционной матрицы (в случае нормального выборочного распределения). Вернемся к примеру об удовлетворенности и рассмотрим корреляционную матрицу для переменных, относящихся к удовлетворенности на работе и дома.

Функционирование любой социально-экономической системы (к которым относится и действующее предприятие) происходит в условиях сложного взаимодействия комплекса внутренних и внешних факторов. Фактор - это причина, движущая сила какого-либо процесса или явления, определяющая его характер или одну из основных черт.

Под факторным анализом понимается методика комплексного и системного изучения и измерения воздействия факторов на величину результативных показателей.

В общем случае можно выделить следующие основные этапы(задачи) факторного анализа:

Постановка цели анализа.

Отбор факторов, определяющих исследуемые результативные показатели.

Классификация и систематизация факторов с целью обеспечения комплексного и системного подхода к исследованию их влияния на результаты хозяйственной деятельности.

Определение формы зависимости между факторами и результативным показателем.

Моделирование взаимосвязей между результативным и факторными показателями.

Расчет влияния факторов и оценка роли каждого из них в изменении величины результативного показателя.

Работа с факторной моделью (практическое ее использование для управления экономическими процессами).

Иначе говоря, задача метода - переход от реального большого числа признаков или причин определяющих наблюдаемую изменчивость к небольшому числу наиболее важных переменных (факторов) с минимальной потерей информации (близкие по сути, но не по математическому аппарату методы - компонентный анализ, канонический анализ и др.).

Метод возник и первоначально разрабатывался в задачах психологии и антропологии (рубеж 19 и 20 вв.), но сейчас область его приложения значительно шире.

Назначение факторного анализа

Факторный анализ - определение влияния факторов на результат - является одним из сильнейших методических решений в анализе хозяйственной деятельности компаний для принятия решений. Для руководителей - дополнительный аргумент, дополнительный "угол зрения".

Целесообразность применения факторного анализа

Как известно, анализировать можно все и до бесконечности. Целесообразно на первом этапе реализовать анализ по отклонениям, а там где это необходимо и оправдано - применить факторный метод анализа. Во многих случаях простого анализа по отклонениям достаточно, чтобы понять, что отклонение «критическое», и когда совсем не обязательно знать степень его влияния.

Факторы делятся на внутренние и внешние , в зависимости от того, влияет на них деятельность данного предприятия или нет. При анализе основное внимание уделяется внутренним факторам, на которые предприятие может воздействовать.

Факторы подразделяются на объективные, не зависящие от воли и желаний людей, и субъективные, подверженные влиянию деятельности юридических и физических лиц.

По степени распространенности факторы делятся на общие и специфические. Общие факторы действуют во всех отраслях экономики. Специфические факторы действуют в пределах отдельной отрасли или конкретного предприятия.

Виды факторного анализа

Существуют следующие типы факторного анализа:

1) Детерминированный (функциональный) – результативный показатель представлен в виде произведения, частного или алгебраической суммы факторов.

2) Стохастический (корреляционный) – связь между результативным и факторными показателями является неполной или вероятностной.

3) Прямой (дедуктивный) – от общего к частному.

4) Обратный (индуктивный) – от частного к общему.

5) Одноступенчатый и многоступенчатый.

6) Статический и динамический.

7) Ретроспективный и перспективный.

В зависимости от типа факторной модели различают два основных вида факторного анализа - детерминированный и стохастический.

Детерминированный факторный анализ представляет собой методику исследования влияния факторов, связь которых с результативным показателем носит функциональный характер, т. е. когда результативный показатель факторной модели представлен в виде произведения, частного или алгебраической суммы факторов.

Данный вид факторного анализа наиболее распространен, поскольку, будучи достаточно простым в применении (по сравнению со стохастическим анализом), позволяет осознать логику действия основных факторов развития предприятия, количественно оценить их влияние, понять, какие факторы и в какой пропорции возможно и целесообразно изменить для повышения эффективности производства.

Детерминированный факторный анализ имеет достаточно жесткую последовательность выполняемых процедур:

1.построение экономически обоснованной детерминированной факторной модели;

2.выбор приема факторного анализа и подготовка условий для его выполнения;

3.реализация счетных процедур анализа модели;

Основные методы детерминированного факторного анализа

Метод цепных подстановок; Метод абсолютных разниц; Метод относительных разниц; Интегральный метод; Метод логарифмирования.

Стохастический анализ представляет собой методику исследования факторов, связь которых с результативным показателем в отличие от функциональной является неполной, вероятностной (корреляционной). Суть стохастического метода - измерение влияния стохастических зависимостей с неопределенными и приблизительными факторами. Стохастический метод целесообразно применять для экономических исследований с неполной (вероятностной) корреляцией: например, для задач маркетинга. Если при функциональной (полной) зависимости с изменением аргумента всегда происходит соответствующее изменение функции, то при корреляционной связи изменение аргумента может дать несколько значений прироста функции в зависимости от сочетания других факторов, определяющих данный показатель. Например, производительность труда при одном и том же уровне фондовооруженности может быть неодинаковой на разных предприятиях. Это зависит от оптимальности сочетания других факторов, воздействующих на этот показатель.

Стохастическое моделирование является в определенной степени дополнением и углублением детерминированного факторного анализа. В факторном анализе эти модели используются по трем основным причинам :

Необходимо изучить влияние факторов, по которым нельзя построить жестко детерминированную факторную модель (например, уровень финансового левериджа);

Необходимо изучить влияние сложных факторов, которые не поддаются объединению в одной и той же жестко детерминированной модели;

Необходимо изучить влияние сложных факторов, которые не могут быть выражены одним количественным показателем (например, уровень научно-технического прогресса).

Необходимо также различать статический и динамический факторный анализ. Первый вид применяется при изучении влияния факторов на результативные показатели на соответствующую дату. Другой вид представляет собой методику исследования причинно-следственных связей в динамике.

И, наконец, факторный анализ может быть ретроспективным, который изучает причины прироста результативных показателей за прошлые периоды, и перспективным, который исследует поведение факторов и результативных показателей в перспективе.

Факторный анализ может быть одноступенчатым и многоступенчатым . Первый тип используется для исследования факторов только одного уровня (одной ступени) подчинения без их детализации на составные части. Например, . При многоступенчатом факторном анализе проводится детализация факторов a и b на составные элементы с целью изучения их поведения. Детализация факторов может быть продолжена и дальше. В этом случае изучается влияние факторов различных уровней соподчиненности.

Необходимо также различать статический и динамический факторный анализ . Первый вид применяется при изучении влияния факторов на результативные показатели на соответствующую дату. Другой вид представляет собой методику исследования причинно-следственных связей в динамике.

Основные типы моделей, используемых в финансовом анализе и прогнозировании.

Прежде чем начать говорить об одном из видов финансового анализа – факторном анализе, напомним, что такое финансовый анализ и каковы его цели.

Финансовый анализ представляет собой метод оценки финансового состояния и эффективности работы хозяйствующего субъекта на основе изучения зависимости и динамики показателей финансовой отчетности.

Финансовый анализ преследует несколько целей:

оценку финансового положения;
выявление изменений в финансовом состоянии в пространственно-временном разрезе;
выявление основных факторов, вызвавших изменения в финансовом состоянии;
прогноз основных тенденций в финансовом состоянии.

Как известно, существуют следующие основные виды финансового анализа:

горизонтальный анализ;
вертикальный анализ;
трендовый анализ;
метод финансовых коэффициентов;
сравнительный анализ;
факторный анализ.

Каждый вид финансового анализа основан на применении какой-либо модели, дающей возможность оценить и проанализировать динамику основных показателей деятельности предприятия. Выделяют три основных типа моделей: дескриптивные, предикативные и нормативные.

Дескриптивные модели известны также, как модели описательного характера. Они являются основными для оценки финансового состояния предприятия. К ним относятся: построение системы отчетных балансов, представление финансовой отчетности в различных аналитических разрезах, вертикальный и горизонтальный анализ отчетности, система аналитических коэффициентов, аналитические записки к отчетности. Все эти модели основаны на использовании информации бухгалтерской отчетности.

В основе вертикального анализа лежит иное представление бухгалтерской отчетности – в виде относительных величин, характеризующих структуру обобщающих итоговых показателей. Обязательным элементом анализа являются динамические ряды этих величин, что позволяет отслеживать и прогнозировать структурные сдвиги в составе хозяйственных средств и источников их покрытия.

Горизонтальный анализ позволяет выявить тенденции изменения отдельных статей или их групп, входящих в состав бухгалтерской отчетности. В основе этого анализа лежит исчисление базисных темпов роста статей баланса и отчета о прибылях и убытках.

Система аналитических коэффициентов – основной элемент анализа финансового состояния, применяемый различными группами пользователей: менеджеры, аналитики, акционеры, инвесторы, кредиторы и др. Существуют десятки таких показателей, подразделяемых на несколько групп по основным направлениям финансового анализа:

показатели ликвидности;
показатели финансовой устойчивости;
показатели деловой активности;
показатели рентабельности.

Предикативные модели – это модели предсказательного характера. Они используются для прогнозирования доходов предприятия и его будущего финансового состояния. Наиболее распространенными из них являются: расчет точки критического объема продаж, построение прогнозных финансовых отчетов, модели динамического анализа (жестко детерминированные факторные модели и регрессионные модели), модели ситуационного анализа.

Нормативные модели. Модели этого типа позволяют сравнить фактические результаты деятельности предприятий с ожидаемыми, рассчитанными по бюджету. Эти модели используются в основном во внутреннем финансовом анализе. Их сущность сводится к установлению нормативов по каждой статье расходов по технологическим процессам, видам изделий, центрам ответственности и т. п. и к анализу отклонений фактических данных от этих нормативов. Анализ в значительной степени базируется на применении жестко детерминированных факторных моделей.

Как мы видим, моделирование и анализ факторных моделей занимают важное место в методологии финансового анализа. Рассмотрим этот аспект подробнее.

Основы моделирования.

Функционирование любой социально-экономической системы (к которым относится и действующее предприятие) происходит в условиях сложного взаимодействия комплекса внутренних и внешних факторов. Фактор - это причина, движущая сила какого-либо процесса или явления, определяющая его характер или одну из основных черт.

Классификация и систематизация факторов в анализе хозяйственной деятельности.

Классификация факторов представляет собой распределение их по группам в зависимости от общих признаков. Она позволяет глубже разобраться в причинах изменения исследуемых явлений, точнее оценить место и роль каждого фактора в формировании величины результативных показателей.

Исследуемые в анализе факторы могут быть классифицированы по разным признакам.

По своей природе факторы подразделяются на природные, социально-экономические и производственно-экономические.

Природные факторы оказывают большое влияние на результаты деятельности в сельском хозяйстве, в лесном хозяйстве и других отраслях. Учет их влияния дает возможность точнее оценить результаты работы субъектов хозяйствования.

К социально-экономическим факторам относятся жилищные условия работников, организация оздоровительной работы на предприятиях с вредным производством, общий уровень подготовки кадров и др. Они способствуют более полному использованию производственных ресурсов предприятия и повышению эффективности его работы.

Производственно-экономические факторы определяют полноту и эффективность использования производственных ресурсов предприятия и конечные результаты его деятельности.

По степени воздействия на результаты хозяйственной деятельности факторы делятся на основные и второстепенные. К основным относятся факторы, оказывающие решающее воздействие на результативный показатель. Второстепенными считаются те, которые не оказывают решающего воздействия на результаты хозяйственной деятельности в сложившихся условиях. Необходимо отметить, что в зависимости от обстоятельств один и тот же фактор может быть и основным, и второстепенным. Умение выделить из всего множества факторов главные обеспечивает правильность выводов по результатам анализа.

Факторы делятся на внутренние и внешние , в зависимости от того, влияет на них деятельность данного предприятия или нет. При анализе основное внимание уделяется внутренним факторам, на которые предприятие может воздействовать.

Факторы подразделяются на объективные , не зависящие от воли и желаний людей, и субъективные , подверженные влиянию деятельности юридических и физических лиц.

В процессе работы организации одни факторы оказывают воздействие на изучаемый показатель непрерывно на протяжении всего времени. Такие факторы называются постоянными . Факторы, воздействие которых проявляется периодически, называются переменными (это, например, внедрение новой технологии, новых видов продукции).

Большое значение для оценки деятельности предприятий имеет деление факторов по характеру их действия на интенсивные и экстенсивные . К экстенсивным относятся факторы, которые связаны с изменением количественных, а не качественных характеристик функционирования предприятия. В качестве примера можно привести увеличение объема производства продукции за счет увеличения числа рабочих. Интенсивные факторы характеризуют качественную сторону процесса производства. Примером может служить увеличение объема производства продукции за счет повышения уровня производительности труда.

Большинство изучаемых факторов по своему составу являются сложными, состоят из нескольких элементов. Однако есть и такие, которые не раскладываются на составные части. В связи с этим факторы делятся на сложные (комплексные) и простые (элементные) . Примером сложного фактора является производительность труда, а простого - количество рабочих дней в отчетном периоде.

По уровню соподчиненности (иерархии) различают факторы первого, второго, третьего и последующего уровней подчинения. К факторам первого уровня относятся те, которые непосредственно влияют на результативный показатель. Факторы, влияющие на результативный показатель косвенно, при помощи факторов первого уровня, называют факторами второго уровня и т. д.

Понятно, что при изучении влияния на работу предприятия какой-либо группы факторов необходимо их упорядочить, то есть проводить анализ с учетом их внутренних и внешних связей, взаимодействия и соподчиненности. Это достигается с помощью систематизации. Систематизация - это размещение изучаемых явлений или объектов в определенном порядке с выявлением их взаимосвязи и подчиненности.

Создание факторных систем является одним из способов такой систематизации факторов. Рассмотрим понятие факторной системы.

Факторные системы

Все явления и процессы хозяйственной деятельности предприятий находятся во взаимозависимости. Связь экономических явлений - это совместное изменение двух или более явлений. Среди многих форм закономерных связей важную роль играет причинно-следственная (детерминистская), при которой одно явление порождает другое.

В хозяйственной деятельности предприятия некоторые явления непосредственно связаны между собой, другие - косвенно. Например, на величину валовой продукции непосредственное влияние оказывают такие факторы, как численность рабочих и уровень производительности их труда. Множество других факторов косвенно воздействует на этот показатель.

Кроме того, каждое явление можно рассматривать как причину и как следствие. Например, производительность труда можно рассматривать, с одной стороны, как причину изменения объема производства, уровня ее себестоимости, а с другой - как результат изменения степени механизации и автоматизации производства, усовершенствования организации труда и т. д.

Количественная характеристика взаимосвязанных явлений осуществляется с помощью показателей. Показатели, характеризующие причину, называются факторными (независимыми); показатели, характеризующие следствие, называются результативными (зависимыми). Совокупность факторных и результативных признаков, связанных причинно-следственной связью, называется факторной системой .

Моделирование какого-либо явления - это построение математического выражения существующей зависимости. Моделирование - это один из важнейших методов научного познания. Существуют два типа зависимостей, изучаемых в процессе факторного анализа: функциональные и стохастические.

Связь называется функциональной, или жестко детерминированной, если каждому значению факторного признака соответствует вполне определенное неслучайное значение результативного признака.

Связь называется стохастической (вероятностной), если каждому значению факторного признака соответствует множество значений результативного признака, т. е. определенное статистическое распределение.

Модель факторной системы - это математическая формула, выражающая реальные связи между анализируемыми явлениями. В общем виде она может быть представлена так:

где - результативный признак;

Факторные признаки.

Таким образом, каждый результативный показатель зависит от многочисленных и разнообразных факторов. В основе экономического анализа и его раздела - факторного анализа - лежат выявление, оценка и прогнозирование влияния факторов на изменение результативного показателя. Чем детальнее исследуется зависимость результативного показателя от тех или иных факторов, тем точнее результаты анализа и оценка качества работы предприятий. Без глубокого и всестороннего изучения факторов нельзя сделать обоснованные выводы о результатах деятельности, выявить резервы производства, обосновать планы и управленческие решения.

Факторный анализ, его виды и задачи.

Под факторным анализом понимается методика комплексного и системного изучения и измерения воздействия факторов на величину результативных показателей.

В общем случае можно выделить следующие основные этапы факторного анализа :

Постановка цели анализа.
Отбор факторов, определяющих исследуемые результативные показатели.
Классификация и систематизация факторов с целью обеспечения комплексного и системного подхода к исследованию их влияния на результаты хозяйственной деятельности.
Определение формы зависимости между факторами и результативным показателем.
Моделирование взаимосвязей между результативным и факторными показателями.
Расчет влияния факторов и оценка роли каждого из них в изменении величины результативного показателя.
Работа с факторной моделью (практическое ее использование для управления экономическими процессами).

Отбор факторов для анализа того или иного показателя осуществляется на основе теоретических и практических знаний в конкретной отрасли. При этом обычно исходят из принципа: чем больший комплекс факторов исследуется, тем точнее будут результаты анализа. Вместе с тем необходимо иметь в виду, что если этот комплекс факторов рассматривается как механическая сумма, без учета их взаимодействия, без выделения главных, определяющих, то выводы могут быть ошибочными. В анализе хозяйственной деятельности (АХД) взаимосвязанное исследование влияния факторов на величину результативных показателей достигается с помощью их систематизации, что является одним из основных методологических вопросов этой науки.

Важным методологическим вопросом в факторном анализе является определение формы зависимости между факторами и результативными показателями: функциональная она или стохастическая, прямая или обратная, прямолинейная или криволинейная. Здесь используется теоретический и практический опыт, а также способы сравнения параллельных и динамичных рядов, аналитических группировок исходной информации, графический и др.

Моделирование экономических показателей также представляет собой сложную проблему в факторном анализе, решение которой требует специальных знаний и навыков.

Расчет влияния факторов - главный методологический аспект в АХД. Для определения влияния факторов на конечные показатели используется множество способов, которые будут подробнее рассмотрены ниже.

Последний этап факторного анализа - практическое использование факторной модели для подсчета резервов прироста результативного показателя, для планирования и прогнозирования его величины при изменении ситуации.

В зависимости от типа факторной модели различают два основных вида факторного анализа - детерминированный и стохастический.

представляет собой методику исследования влияния факторов, связь которых с результативным показателем носит функциональный характер, т. е. когда результативный показатель факторной модели представлен в виде произведения, частного или алгебраической суммы факторов.

Стохастический анализ представляет собой методику исследования факторов, связь которых с результативным показателем в отличие от функциональной является неполной, вероятностной (корреляционной). Если при функциональной (полной) зависимости с изменением аргумента всегда происходит соответствующее изменение функции, то при корреляционной связи изменение аргумента может дать несколько значений прироста функции в зависимости от сочетания других факторов, определяющих данный показатель. Например, производительность труда при одном и том же уровне фондовооруженности может быть неодинаковой на разных предприятиях. Это зависит от оптимальности сочетания других факторов, воздействующих на этот показатель.

необходимо изучить влияние факторов, по которым нельзя построить жестко детерминированную факторную модель (например, уровень финансового левериджа);

необходимо изучить влияние сложных факторов, которые не поддаются объединению в одной и той же жестко детерминированной модели;
необходимо изучить влияние сложных факторов, которые не могут быть выражены одним количественным показателем (например, уровень научно-технического прогресса).

В отличие от жестко детерминированного стохастический подход для реализации требует ряда предпосылок:

наличие совокупности;
достаточный объем наблюдений;
случайность и независимость наблюдений;
однородность;
наличие распределения признаков, близкого к нормальному;
наличие специального математического аппарата.

Построение стохастической модели проводится в несколько этапов:

качественный анализ (постановка цели анализа, определение совокупности, определение результативных и факторных признаков, выбор периода, за который проводится анализ, выбор метода анализа);
предварительный анализ моделируемой совокупности (проверка однородности совокупности, исключение аномальных наблюдений, уточнение необходимого объема выборки, установление законов распределения изучаемых показателей);
построение стохастической (регрессионной) модели (уточнение перечня факторов, расчет оценок параметров уравнения регрессии, перебор конкурирующих вариантов моделей);
оценка адекватности модели (проверка статистической существенности уравнения в целом и его отдельных параметров, проверка соответствия формальных свойств оценок задачам исследования);
экономическая интерпретация и практическое использование модели (определение пространственно-временной устойчивости построенной зависимости, оценка практических свойств модели).

Кроме деления на детерминированный и стохастический, различают следующие типы факторного анализа:

прямой и обратный;
одноступенчатый и многоступенчатый;
статический и динамичный;
ретроспективный и перспективный (прогнозный).

При прямом факторном анализе исследование ведется дедуктивным способом - от общего к частному. Обратный факторный анализ осуществляет исследование причинно-следственных связей способом логичной индукции - от частных, отдельных факторов к обобщающим.

Факторный анализ может быть одноступенчатым и многоступенчатым . Первый тип используется для исследования факторов только одного уровня (одной ступени) подчинения без их детализации на составные части. Например, . При многоступенчатом факторном анализе проводится детализация факторов a и b на составные элементы с целью изучения их поведения. Детализация факторов может быть продолжена и дальше. В этом случае изучается влияние факторов различных уровней соподчиненности.

Детерминированный факторный анализ.

Детерминированный факторный анализ имеет достаточно жесткую последовательность выполняемых процедур:

построение экономически обоснованной детерминированной факторной модели;
выбор приема факторного анализа и подготовка условий для его выполнения;
реализация счетных процедур анализа модели;
формулирование выводов и рекомендаций по результатам анализа.

Первый этап особенно важен, так как неправильно построенная модель может привести к логически неоправданным результатам. Смысл этого этапа состоит в следующем: любое расширение жестко детерминированной факторной модели не должно противоречить логике связи “причина – следствие”. В качестве примера рассмотрим модель, связывающую объем реализации (Р), численность (Ч) и производительность труда (ПТ). Теоретически можно исследовать три модели:

Все три формулы верны с позиции арифметики, однако с позиции факторного анализа только первая имеет смысл, поскольку в ней показатели, стоящие в правой части формулы, являются факторами, т. е. причиной, порождающей и определяющей значение показателя, стоящего в левой части (следствие).

На втором этапе выбирается один из приемов факторного анализа: интегральный, цепных подстановок, логарифмический и др. Каждый из этих приемов имеет свои достоинства и недостатки. Краткую сравнительную характеристику этих способов мы рассмотрим ниже.

Виды детерминированных факторных моделей.

Существуют следующие модели детерминированного анализа:

аддитивная модель , т. е. модель, в которую факторы входят в виде алгебраической суммы, в качестве примера можно привести модель товарного баланса:

где Р - реализация;

Запасы на начало периода;

П - поступление товаров;

Запасы на конец периода;

В - прочее выбытие товаров;

мультипликативная модель , т. е. модель, в которую факторы входят в виде произведения; примером может служить простейшая двухфакторная модель:

где Р - реализация;

Ч - численность;

ПТ - производительность труда;

кратная модель , т. е. модель, представляющая собой отношение факторов, например:

где - фондовооруженность;

ОС

Ч - численность;

смешанная модель , т. е. модель, в которую факторы входят в различных комбинациях, например:

где Р - реализация;

Рентабельность;

ОС - стоимость основных средств;
Об - стоимость оборотных средств.

Жестко детерминированная модель, имеющая более двух факторов, называется многофакторной .

Типовые задачи детерминированного факторного анализа.

В детерминированном факторном анализе можно выделить четыре типовые задачи:

Оценка влияния относительного изменения факторов на относительное изменение результативного показателя.
Оценка влияния абсолютного изменения i-го фактора на абсолютное изменение результативного показателя.
Определение отношения величины изменения результативного показателя, вызванного изменением i-го фактора, к базовой величине результативного показателя.
Определение доли абсолютного изменения результативного показателя, вызванного изменением i-го фактора, в общем изменении результативного показателя.

Охарактеризуем эти задачи и рассмотрим решение каждой из них на конкретном простом примере.

Пример.

Объем валовой продукции (ВП) зависит от двух основных факторов первого уровня: численности работников (ЧР) и среднегодовой выработки (ГВ). Имеем двухфакторную мультипликативную модель: . Рассмотрим ситуацию, когда и выработка, и численность рабочих в отчетном периоде отклонились от запланированных значений.

Данные для расчетов приведены в таблице 1.

Таблица 1. Данные для факторного анализа объема валовой продукции.

Задача 1.

Задача имеет смысл для мультипликативных и кратных моделей. Рассмотрим простейшую двухфакторную модель . Очевидно, что при анализе динамики этих показателей будет выполняться следующее соотношение между индексами:

где значение индекса находится отношением значения показателя в отчетном периоде к базисному.

Рассчитаем индексы валовой продукции, численности работников и среднегодовой выработки для нашего примера:

;

Согласно вышеприведенному правилу, индекс валовой продукции равен произведению индексов численности работников и среднегодовой выработки, т. е.

Очевидно, что если мы рассчитаем непосредственно индекс валовой продукции, то получим то же самое значение:

Мы можем сделать вывод: в результате увеличения численности работников в 1,2 раза и увеличения среднегодовой выработки в 1,25 раза объем валовой продукции увеличился в 1,5 раза.

Таким образом, относительные изменения факторных и результативного показателей связаны той же зависимостью, что и показатели в исходной модели. Данная задача решается при ответе на вопросы типа: "Что будет, если i-й показатель изменится на n%, а j-й показатель изменится на k%?".

Задача 2.

Является основной задачей детерминированного факторного анализа; ее общая постановка имеет вид:

Пусть - жестко детерминированная модель, характеризующая изменение результативного показателя y от n факторов; все показатели получили приращение (например, в динамике, по сравнению с планом, по сравнению с эталоном):

Требуется определить, какой частью приращение результативного показателя y обязано приращению i-го фактора, т. е. расписать следующую зависимость:

где - общее изменение результативного показателя, складывающееся под одновременным влиянием всех факторных признаков;

Изменение результативного показателя под влиянием только фактора .

В зависимости от того, какой метод анализа модели выбран, факторные разложения могут различаться. Поэтому рассмотрим в контексте данной задачи основные методы анализа факторных моделей.

Основные методы детерминированного факторного анализа.

Одним из важнейших методологических в АХД является определение величины влияния отдельных факторов на прирост результативных показателей. В детерминированном факторном анализе (ДФА) для этого используются следующие способы: выявления изолированного влияния факторов, цепной подстановки, абсолютных разниц, относительных разниц, пропорционального деления, интегральный, логарифмирования и др.

Первые три способа основываются на методе элиминирования. Элиминировать - значит устранить, отклонить, исключить воздействие всех факторов на величину результативного показателя, кроме одного. Этот метод исходит из того, что все факторы изменяются независимо друг от друга: сначала изменяется один, а все другие остаются без изменения, потом изменяются два, затем три и т. д., при неизменности остальных. Это позволяет определить влияние каждого фактора на величину исследуемого показателя в отдельности.

Дадим краткую характеристику наиболее распространенным способам.

Способ цепной подстановки является весьма простым и наглядным методом, наиболее универсальным из всех. Он используется для расчета влияния факторов во всех типах детерминированных факторных моделей: аддитивных, мультипликативных, кратных и смешанных. Этот способ позволяет определить влияние отдельных факторов на изменение величины результативного показателя путем постепенной замены базисной величины каждого факторного показателя в объеме результативного показателя на фактическую в отчетном периоде. С этой целью определяют ряд условных величин результативного показателя, которые учитывают изменение одного, затем двух, затем трех и т. д. факторов, допуская, что остальные не меняются. Сравнение величины результативного показателя до и после изменения уровня того или иного фактора позволяет определить воздействие конкретного фактора на прирост результативного показателя, исключив влияние остальных факторов. При использовании этого метода достигается полное разложение.

Напомним, что при использовании этого способа большое значение имеет очередность изменения значений факторов, так как от этого зависит количественная оценка влияния каждого фактора.

Прежде всего нужно отметить, что не существует и не может существовать единой методики определения этого порядка - существуют модели, в которых он может быть определен произвольно. Лишь для небольшого числа моделей можно использовать формализованные подходы. На практике эта проблема не имеет большого значения, поскольку в ретроспективном анализе важны тенденции и относительная значимость того или иного фактора, а не точные оценки их влияния.

Тем не менее для соблюдения более или менее единого подхода к определению порядка замены факторов в модели можно сформулировать общие принципы. Введем некоторые определения.

Признак, непосредственно относящийся к изучаемому явлению и характеризующий его количественную сторону, называется первичным или количественным . Эти признаки: а) абсолютные (объемные); б) их можно суммировать в пространстве и времени. В качестве примера можно привести объем реализации, численность, стоимость оборотных средств и т. д.

Признаки, относящиеся к изучаемому явлению не непосредственно, а через один или несколько других признаков и характеризующие качественную сторону изучаемого явления, называются вторичными или качественными . Эти признаки: а) относительные; б) их нельзя суммировать в пространстве и времени. Примерами могут служить фондовооруженность, рентабельность и др. В анализе выделяют вторичные факторы 1-го, 2-го и т. д. порядков, получаемые путем последовательной детализации.

Жестко детерминированная факторная модель называется полной, если результативный показатель количественный, и неполной, если результативный показатель качественный. В полной двухфакторной модели один фактор всегда количественный, второй - качественный. В этом случае замену факторов рекомендуют начинать с количественного показателя. Если же имеется несколько количественных и несколько качественных показателей, то сначала следует изменить величину факторов первого уровня подчинения, а потом более низкого. Таким образом, применение способа цепной подстановки требует знания взаимосвязи факторов, их соподчиненности, умения правильно их классифицировать и систематизировать.

Теперь рассмотрим на нашем примере порядок применения способа цепных подстановок.

Алгоритм расчета способом цепной подстановки для данной модели выглядит следующим образом:

Как видим, второй показатель валовой продукции отличается от первого тем, что при его расчете принята фактическая численность рабочих вместо запланированной. Среднегодовая выработка одним рабочим в том и другом случае плановая. Значит, за счет увеличения количества рабочих выпуск продукции увеличился на 32 000 млн. руб. (192 000 - 160 000).

Третий показатель отличается от второго тем, что при расчете его величины выработка рабочих принята по фактическому уровню вместо плановой. Количество же работников в обоих случаях фактическое. Отсюда за счет повышения производительности труда объем валовой продукции увеличился на 48 000 млн. руб. (240 000 - 192 000).

Таким образом, перевыполнение плана по объему валовой продукции явилось результатом влияния следующих факторов:

Алгебраическая сумма факторов при использовании данного метода обязательно должна быть равна общему приросту результативного показателя:

Отсутствие такого равенства свидетельствует о допущенных ошибках в расчетах.

Другие методы анализа, такие как интегральный и логарифмический, позволяют достичь более высокой точности расчетов, однако эти методы имеют более ограниченную сферу применения и требуют проведения большого объема вычислений, что неудобно для проведения оперативного анализа.

Задача 3.

Является в определенном смысле следствием второй типовой задачи, поскольку базируется на полученном факторном разложении. Необходимость решения этой задачи обусловлена тем обстоятельством, что элементы факторного разложения составляют абсолютные величины, которые трудно использовать для пространственно-временных сопоставлений. При решении задачи 3 факторное разложение дополняется относительными показателями:

Экономическая интерпретация: коэффициент показывает, на сколько процентов к базисному уровню изменился результативный показатель под влиянием i-го фактора.

Рассчитаем коэффициенты α для нашего примера, используя факторное разложение, полученное ранее методом цепных подстановок:

;

Таким образом, объем валовой продукции повысился на 20% за счет увеличения численности рабочих и на 30% за счет увеличения выработки. Суммарный прирост валовой продукции составил 50%.

Задача 4.

Также решается на основе базовой задачи 2 и сводится к расчету показателей:

Экономическая интерпретация: коэффициент показывает долю прироста результативного показателя, обусловленную изменением i-го фактора. Здесь не возникает вопроса, если все факторные признаки изменяются однонаправленно (либо возрастают, либо убывают). Если это условие не выполняется, решение задачи может быть осложнено. В частности, в наиболее простой двухфакторной модели в подобном случае расчет по приведенной формуле не выполняется и считается, что 100% прироста результативного показателя обусловлены изменением доминирующего факторного признака, т. е. признака, изменяющегося однонаправленно с результативным показателем.

Рассчитаем коэффициенты γ для нашего примера, используя факторное разложение, полученное методом цепных подстановок:

Таким образом, увеличение численности работников обусловило 40% общего повышения объема валовой продукции, а увеличение выработки - 60%. Значит, увеличение выработки в данной ситуации является определяющим фактором.