Множество главных компонент представляет собой удобную систему координат, а их вклад в общую дисперсию характеризует статистические свойства главных компонент. Из общего числа главных компонент для исследования, как правило, оставляют наиболее весомых, т.е. вносящих максимальный вклад в объясняемую часть общей дисперсии.
Таким образом, несмотря на то, что в методе главных компонент надо для точного воспроизведения корреляции и дисперсии между переменными найти все компоненты, большая доля дисперсии объясняется небольшим числом главных компонент. Кроме того, можно по признакам описать факторы, а по факторам (главным компонентам) описать признаки.
Интерпретация результатов исследования
Для исследования использовались следующие данные:
Исходные данные для анализа |N |Y2 |X4 |X5 |X6 |X7 |X8 |X9 | |1 |13.26 |0.23 |0.78 |0.40 |1.37 |1.23 |0.23 | |2 |10.16 |0.24 |0.75 |0.26 |1.49 |1.04 |0.39 | |3 |13.72 |0.19 |0.68 |0.40 |1.44 |1.80 |0.43 | |4 |12.85 |0.17 |0.70 |0.50 |1.42 |0.43 |0.18 | |5 |10.63 |0.23 |0.62 |0.40 |1.35 |0.88 |0.15 | |6 |9.12 |0.43 |0.76 |0.19 |1.39 |0.57 |0.34 | |7 |25.83 |0.31 |0.73 |0.25 |1.16 |1.72 |0.38 | |8 |23.38 |0.26 |0.71 |0.44 |1.27 |1.70 |0.09 | |9 |14.68 |0.49 |0.69 |0.17 |1.16 |0.84 |0.14 | |10 |10.05 |0.36 |0.73 |0.39 |1.25 |0.60 |0.21 | |11 |13.99 |0.37 |0.68 |0.33 |1.13 |0.82 |0.42 | |12 |9.68 |0.43 |0.74 |0.25 |1.10 |0.84 |0.05 | |13 |10.03 |0.35 |0.66 |0.32 |1.15 |0.67 |0.29 | |14 |9.13 |0.38 |0.72 |0.02 |1.23 |1.04 |0.48 | |15 |5.37 |0.42 |0.68 |0.06 |1.39 |0.66 |0.41 | |16 |9.86 |0.30 |0.77 |0.15 |1.38 |0.86 |0.62 | |17 |12.62 |0.32 |0.78 |0.08 |1.35 |0.79 |0.56 | |18 |5.02 |0.25 |0.78 |0.20 |1.42 |0.34 |1.76 | |19 |21.18 |0.31 |0.81 |0.20 |1.37 |1.60 |1.31 | |20 |25.17 |0.26 |0.79 |0.30 |1.41 |1.46 |0.45 | |21 |19.1 |0.37 |0.77 |0.24 |1.35 |1.27 |0.50 | |22 |21.0 |0.29 |0.78 |0.10 |1.48 |1.58 |0.77 | |23 |6.57 |0.34 |0.72 |0.11 |1.24 |0.68 |1.20 | |24 |14.19 |0.23 |0.79 |0.47 |1.40 |0.86 |0.21 | |25 |15.81 |0.17 |0.77 |0.53 |1.45 |1.98 |0.25 | |26 |5.23 |0.29 |0.80 |0.34 |1.40 |0.33 |0.15 | |27 |7.99 |0.41 |0.71 |0.20 |1.28 |0.45 |0.66 | |28 |17.5 |0.41 |0.79 |0.24 |1.33 |0.74 |0.74 | |29 |17.16 |0.22 |0.76 |0.54 |1.22 |1.03 |0.32 | |30 |14.54 |0.29 |0.78 |0.40 |1.28 |0.99 |0.89 |
Далее был проведен на исходные данные корреляционный анализ. Были получены следующие результаты.
Матрица
+-----+-------+-------+-------+-------+-------+-------+-------+
| N | 1 | 2 | 3 | 4 | 5 | 6 | 7 | | | | | | | | | |
| x4 | 1.00 | -0.14 | -0.65 | -0.54 | -0.38 | 0.01 | -0.21 |
| x5 | -0.14 | 1.00 | -0.05 | 0.39 | 0.13 | 0.35 | 0.24 |
| x6 | -0.65 | -0.05 | 1.00 | 0.06 | 0.20 | -0.43 | 0.24 |
| x7 | -0.54 | 0.39 | 0.06 | 1.00 | 0.15 | 0.20 | -0.02 |
| x8 | -0.38 | 0.13 | 0.20 | 0.15 | 1.00 | -0.09 | 0.76 |
| x9 | 0.01 | 0.35 | -0.43 | 0.20 | -0.09 | 1.00 | -0.09 |
| y2 | -0.21 | 0.24 | 0.24 | -0.02 | 0.76 | -0.09 | 1.00 |
+-----+-------+-------+-------+-------+-------+-------+-------+ t-значения
| N | 1 | 2 | 3 | 4 | 5 | 6 | 7 |
| x4 | 1.00 | 0.75 | 4.51 | 3.42 | 2.18 | 0.05 | 1.14 |
| x5 | 0.75 | 1.00 | 0.25 | 2.25 | 0.68 | 2.00 | 1.32 |
| x6 | 4.51 | 0.25 | 1.00 | 0.29 | 1.09 | 2.49 | 1.30 |
| x7 | 3.42 | 2.25 | 0.29 | 1.00 | 0.82 | 1.06 | 0.13 |
| x8 | 2.18 | 0.68 | 1.09 | 0.82 | 1.00 | 0.46 | 6.12 |
| x9 | 0.05 | 2.00 | 2.49 | 1.06 | 0.46 | 1.00 | 0.48 |
| y2 | 1.14 | 1.32 | 1.30 | 0.13 | 6.12 | 0.48 | 1.00 |
Кpитические значения t-pаспpеделения пpи 28 степенях свободы веpоятность t-значение
0.950 1.706
0.990 2.470
0.999 3.404
Доверительные интервалы
| x4 | 0.00 | 0.17 | -0.43 | -0.28 | -0.08 | 0.32 | 0.10 |
| x4 | 0.00 | -0.43 | -0.80 | -0.73 | -0.62 | -0.30 | -0.49 |
| x5 | 0.17 | 0.00 | 0.26 | 0.62 | 0.42 | 0.60 | 0.51 |
| x5 | -0.43 | 0.00 | -0.35 | 0.10 | -0.19 | 0.05 | -0.07 |
| x6 | -0.43 | 0.26 | 0.00 | 0.36 | 0.48 | -0.14 | 0.51 |
| x6 | -0.80 | -0.35 | 0.00 | -0.26 | -0.11 | -0.65 | -0.07 |
| x7 | -0.28 | 0.62 | 0.36 | 0.00 | 0.44 | 0.48 | 0.28 |
| x7 | -0.73 | 0.10 | -0.26 | 0.00 | -0.16 | -0.12 | -0.33 |
| x8 | -0.08 | 0.42 | 0.48 | 0.44 | 0.00 | 0.23 | 0.86 |
| x8 | -0.62 | -0.19 | -0.11 | -0.16 | 0.00 | -0.38 | 0.59 |
| x9 | 0.32 | 0.60 | -0.14 | 0.48 | 0.23 | 0.00 | 0.22 |
| x9 | -0.30 | 0.05 | -0.65 | -0.12 | -0.38 | 0.00 | -0.39 |
| y2 | 0.10 | 0.51 | 0.51 | 0.28 | 0.86 | 0.22 | 0.00 |
| y2 | -0.49 | -0.07 | -0.07 | -0.33 | 0.59 | -0.39 | 0.00 |
прогноз по регрессии НЕТ
+1----+--------------------------------------------------+--------+
| N | kkkkkkkkkk?k°кdYь | .Ў5 |
+-----+--------------------------------------------------+--------+
| x4 | 0.87 | 10.12 |
| x5 | 0.60 | 1.74 |
| x6 | 0.84 | 7.37 |
| x7 | 0.74 | 3.83 |
| x8 | 0.82 | 6.35 |
| x9 | 0.64 | 2.19 |
| y2 | 0.81 | 6.11 |
Анализируя полученные результаты, при tкр=1,706 с вероятностью 0,95 можно утверждать, что рентабельность имеет наибольшую зависимость от следующих факторов: удельного веса покупных изделий, коэффициента сменности оборудования и от премий и вознаграждений на одного работника в % к заработной плате и меньше всего зависит от удельного веса потерь от брака и от удельного веса рабочих в составе промышленно-производственного персонала.
Потом провели анализ с помощью линейной регрессии. Приведем протокол множественной линейной регрессии.
*** Протокол множественной линейной регрессии ***
Зависимая переменная Y - y2 Функция Y = -12.728+12.035*x4+28.237*x5+8.948*x6- 8.160*x7+9.757*x8+0.259*x9 Оценки коэффициентов линейной регрессии
+---+----------+-----------+---------------+-----------+--------+--------- + | N | Значение | Дисперсия | Средне- | t - | Нижняя | Верхняя |
| | | | квадатическое | значение | оценка | оценка | | | | | отклонение | | | | +---+----------+-----------+---------------+-----------+--------+--------- + | 1 | -12.73 | 337.23 | 18.36 | -0.69 | -44.29 | 18.83 | | 2 | 12.04 | 285.68 | 16.90 | 0.71 | -17.01 | 41.08 | | 3 | 28.24 | 301.19 | 17.35 | 1.63 | -1.59 | 58.06 | | 4 | 8.95 | 76.52 | 8.75 | 1.02 | -6.09 | 23.98 | | 5 | -8.16 | 88.27 | 9.39 | -0.87 | -24.31 | 7.99 | | 6 | 9.76 | 2.95 | 1.72 | 5.68 | 6.80 | 12.71 | | 7 | 0.26 | 5.56 | 2.36 | 0.11 | -3.79 | 4.31 | +---+----------+-----------+---------------+-----------+--------+--------- +
Кpитические значения t-pаспpеделения пpи 23 степенях свободы веpоятность t-значение
0.900 1.323
0.950 1.719
0.990 2.503
Т.к. значение t при х9 (самое маленькое из полученных) меньше tкр – мы его исключаем. И проводим анализ еще раз.
ШАГ 2
Зависимая переменная Y - y2
Функция Y = -12.473+11.313*x4+28.935*x5+8.418*x6-8.337*x7+9.719*x8
Оценки коэффициентов линейной регрессии +---+----------+-----------+---------------+-----------+--------+---------+ | N | Значение | Дисперсия | Средне- | t - | Нижняя | Верхняя | | | | | квадатическое | значение | оценка | оценка | | | | | отклонение | | | | +---+----------+-----------+---------------+-----------+--------+---------+ | 1 | -12.47 | 318.15 | 17.84 | -0.70 | -43.07 | 18.13 | | 2 | 11.31 | 232.53 | 15.25 | 0.74 | -14.85 | 37.48 | | 3 | 28.93 | 250.19 | 15.82 | 1.83 | 1.80 | 56.07 | | 4 | 8.42 | 51.07 | 7.15 | 1.18 | -3.84 | 20.68 | | 5 | -8.34 | 82.14 | 9.06 | -0.92 | -23.89 | 7.21 | | 6 | 9.72 | 2.71 | 1.65 | 5.90 | 6.89 | 12.54 | +---+----------+-----------+---------------+-----------+--------+---------+
Кpитические значения t-pаспpеделения пpи 24 степенях свободы веpоятность t-значение
0.900 1.321
0.950 1.716
0.990 2.495
Т.к. значение t при х4 (самое маленькое из полученных на втором шаге) меньше tкр – мы его исключаем. И проводим анализ еще раз.
ШАГ 3
Функция Y = -2.485+30.026*x5+4.567*x6-12.718*x7+9.316*x8
Оценки коэффициентов линейной регрессии +---+----------+-----------+---------------+-----------+--------+--------- + | N | Значение | Дисперсия | Средне- | t - | Нижняя | Верхняя | | | | | квадатическое | значение | оценка | оценка | | | | | отклонение | | | | +---+----------+-----------+---------------+-----------+--------+--------- + | 1 | -2.49 | 134.48 | 11.60 | -0.21 | -22.35 | 17.38 | | 2 | 30.03 | 243.57 | 15.61 | 1.92 | 3.29 | 56.76 | | 3 | 4.57 | 23.69 | 4.87 | 0.94 | -3.77 | 12.90 | | 4 | -12.72 | 46.42 | 6.81 | -1.87 | -24.39 | -1.05 | | 5 | 9.32 | 2.37 | 1.54 | 6.05 | 6.68 | 11.96 | +---+----------+-----------+---------------+-----------+--------+--------- +
Кpитические значения t-pаспpеделения пpи 25 степенях свободы веpоятность t-значение
0.900 1.319
0.950 1.713
0.990 2.488
Т.к. значение t при х6 (самое маленькое из полученных на третьем шаге) меньше tкр – мы его исключаем. И проводим анализ еще раз.
ШАГ 4
Функция Y = -0.990+28.691*x5-12.346*x7+9.610*x8
Оценки коэффициентов линейной регрессии +---+----------+-----------+---------------+-----------+--------+--------- + | N | Значение | Дисперсия | Средне- | t - | Нижняя | Верхняя | | | | | квадатическое | значение | оценка | оценка | | | | | отклонение | | | | +---+----------+-----------+---------------+-----------+--------+--------- + | 1 | -0.99 | 131.34 | 11.46 | -0.09 | -20.59 | 18.61 | | 2 | 28.69 | 240.44 | 15.51 | 1.85 | 2.17 | 55.21 | | 3 | -12.35 | 46.05 | 6.79 | -1.82 | -23.95 | -0.74 | | 4 | 9.61 | 2.27 | 1.51 | 6.38 | 7.04 | 12.18 | +---+----------+-----------+---------------+-----------+--------+--------- +
Страницы: 1, 2, 3