1. Средняя арифметическая
2. Средне гармоническая
3. Средне квадратическая, кубическая
4. Средне геометрическое
Правило мажерантности средних. [pic] Структурные средние Мода – Мо Медиана – Ме В рядах динамики рассчитывается средняя арифметическая, средняя хронологическая. Средней арифметической называется такое среднее значение признака при вычислении которого общий объем признака не изменяется. Пример: вес. [pic] [pic] - ср. арифметическое простое xi – индивидуальное значение признака n – общее число изучаемой совокупности [pic] ср. арифметическое взвешенное Свойства ср. арифметической.
1. Сумма отклонений индивидуальных значений признака от его средней величины равно нулю
[pic]
2. если каждое индивидуальное значение признака умножить или разделить на одно и тоже постоянное число, то среднее увеличится или уменьшится во столько же раз.
3. если к каждому индивидуальному значению признака прибавить одно и тоже постоянное число, то средняя величина изменится соответственно на тоже самое число.
Доказательство
4. если веса f средней взвешенной умножить или разделить на одно и тоже число, то средняя не изменится.
5. сумма квадратов отклонений признака меньше чем от любого другого числа.
Другие виды средних |Вид средней |Простая средняя |Взвешенная средняя | |гармоническая |[pic] |[pic] | |геометрическое|[pic] |[pic] | |Квадратическая|[pic] |[pic] |
§5.
Очень трудно охарактеризовать группировку по одному признаку и мало остается информации в памяти.
Сохранить сложность описания групп и одновременно преодолеть недостатки комбинированной группировки позволяют многомерные группировки. Простейшим вариантом многомерной группировки является многомерная средняя.
Многомерная средняя – средняя величина для нескольких признаков Е.С.С.
Т.к. нельзя рассчитать ср. величину абсолютных значений разных признаков выраженных в разных единицах измерения, то многомерная средняя вычисляется из относительных величин.
Из отношений значений признака для Е.С. к средним значениям этих признаков.
[pic] - многомерная средняя для i единицы xij – значение признака j для i единицы
[pic] - среднее значение признака j k – число признаков j – номер признака и номер его совокупности
тема 5: Вариационный анализ
§1. Вариация признаков и ее причины §2. Ряды распределения §3. Структурные характеристики вариационного ряда. §4. Показатели силы вариации. §5. Показатели интенсивности вариации §6. виды дисперсии. Правило сложения дисперсии.
§1.
Вариацией значения какого-либо признака в совокупности называется различие его значений у разных единиц данной совокупности в один и тот же период или момент времени.
Причина вариации: разные условия существования ЕСС именно вариация порождает необходимость в такой науке как статистика.
§2.
Проведение вариационного анализа начинается с построения вариационного ряда – упорядоченное распределение единиц совокупности по возрастающим или по убывающим признакам и подсчет соответствующих частот.
Ряды распределения
V ранжированные
V дискретные
V интервальные
Ранжированный вариационный ряд – перечень отдельных ед. совокупности в порядке возрастания убывания ранжированного признака |БАНК |Капитал тыс. | | |руб. | |СБ РФ |96007237 | |Внешторгбанк|47991724 |
Дискретный вариационный ряд – таблица состоящая из 2х строк – полимерных значений варьирующего признака и кол-во единиц с данным значением признака. |Кол-во |0 |1 |2 |3 |4| |детей в | | | | | | |семье | | | | | | |Кол-во |20|40|45|10|5| |семей | | | | | |
Интервальный вариационный ряд строится в случаях:
1. признак принимает дискретные значения , но кол-во их слишком велико
2. признака принимает любые значения в определенном диапазоне |Размер |0 - 10000 |10000-50000 |Свыше 50000 | |собственного | | | | |капитала тыс. | | | | |руб. | | | | |Количество банков|20 |40 |10 |
При построении интервального вариационного ряда необходимо выбрать оптимальное количество групп, самый распространенный способ по формуле Стерджесса k=1+3.32lgn k – количество интервалов n – объем совокупности
При расчетах почти всегда получают дробные значения, округления производить до целого числа.
Длина интервала – l
Виды интервалов 1. нижняя граница последующего интервала повторяет верхнюю границу последующего интервала
|0 - |10 - |20 - 30| |10 |20 | | | | | |
2. С индивидуальными границами в интервал входят верхняя и нижняя границы
|0 - 9|10 - |20 - 29| | |19 | | | | | |
3. открытый интервал, интервал с одной границей
|До 5 |5 - 10|10 – 15| | | | |
В случае открытого интервала l принимается равной длине смежного с ним интервала, либо исходя из логических соображений.
|Стаж |До 5 |5-7|7-9| |Кол-во | | | | |рабочих| | | |
При расчетах по интервальному вариационному ряду за xi принимается середина интервала.
Интервалы могут быть как равные так и нет. При изучении вариационного ряда существенную помощь оказывает графическое изображение. Дискретный вариационный ряд изображается с помощью полигона.
Интервальный вариационный ряд изображается с помощью гистограммы. Накопленная частота |xi |0 |1 |2 |3 |4| |fi |20 |40 |45|10|5|
NME=60 медиана = 1 Кумулята – распределение меньше чем Огива – распределение больше чем
§3. Медиана – значение признака делящее всю совокупность на две равные части. Для дискретного вариационного ряда расчет медианы: если n-четное, то №Ме медианой единицы [pic] [pic] Интервальный вариационный ряд: [pic] k – количество интервалов х0 – нижняя граница медианного интервала l – длина медианного интервала [pic] - сумма частот [pic] - накопленная частота интервала предшествующая медианному. [pic] - частота медианного интервала Медианный интервал – первый интервал накопленная частота которого превышает половину от общей суммы частот. |0-5 |5-10 |10-15|15-20| |15 |20 |40 |25 |
Графически медиана находится по кумуляте. 2. Квартили – значение признака делящее совокупность на 4 равные части. 1ый квартиль [pic] 3ий квартиль [pic] 2ой квартиль – медиана. xQ1 xQ3 – нижняя граница интервала содержащего 1го и 3го квартили. l – длина интервала [pic] и [pic] - накопленные частоты интервалов предшествующих интервалов содержащих 1 и 3 квартили. [pic] - частоты квартильных интервалов. Для характеристики вариационного ряда используются: Децили – делят совокупность на 10 равных частей, Перцитили – делят совокупность на 100 равных частей. 3. Мода – часто встречающаяся характеристика признака. Для дискретного вариационного ряда – наибольшая частота. Для интервального вариационного ряда мода рассчитывается по следующей формуле:
[pic] - нижняя граница модального интервала l – длина модального интервала fMo – частота модального интервала fMo+1 – частота интервала следующего за модальным
Модальный интервал – интервал с наибольшей частотой. Графически мода находится по гистограмме.
§4. 1. Размах вариации [pic] 2. Среднее линейное отклонение [pic] [pic] - взвешенная 3. Дисперсия: [pic] [pic] - взвешенная 4. Средне квадратическое отклонение [pic] Свойство дисперсии. 1. [pic] [pic] 1. уменьшение всех значений признака на одну и ту же величину не меняет величину дисперсии. [pic] 2. Уменьшение всех значений признаков в к раз уменьшает величину дисперсии в к2 раз, а СКО в к раз 3. если исчислить средний квадрат отклонений от любой величины А отличающийся от средней арифметической, то он всегда будет больше среднего квадрата отклонений исчисленного из средней арифметической.
Таким образом [pic] от средней всегда меньше [pic] исчисленной от любой другой величины т.е. она имеет свойство минимальности. СКО=1,25[pic]
-при распределениях близких к нормальному.
В условиях нормального распределения существует следующая зависимость между [pic] и количеством наблюдений в пределах [pic]находится 68,3% наблюдений.
В пределах [pic] находится 95,4% наблюдений
В пределах [pic] находится 99,7% наблюдений
§5. Для сравнения вариации признаков в разных совокупностях или для сравнения вариации разных признаков в одной совокупности используются относительные показатели, базой служит средняя арифметическая. 1. Относительный размах вариации. [pic] 2. Относительное линейное отклонение [pic] 3. Коэффициент вариации [pic] данные показатели дают не только сравнительную оценку но и образуют однородность совокупности. Совокупность считается однородной если коэффициент вариации не превышает 33%.
§6
На ряду с изучением вариации признака по всей совокупности в целом, часто бывает необходимо проследить количественные изменения признака, но группам, на которые делится совокупность и между ними. Эта достигается путем вычисления [pic]разных видов.
Виды дисперсии: 1. Общая дисперсия [pic] 2. Межгрупповая дисперсия [pic] 3. Внутригрупповая дисперсия (остаточная) [pic]
1. измеряет вариацию признака во всей совокупности под влиянием все факторов обусловивших данную вариацию Пример: потребление йогурта: при выборке 100 человек
Возраст Доход Социальное положение [pic] xi –индивидуальное значение признака
[pic] - среднее значение признака по всей совокупности
[pic] - частота этого признака. 2. характеризует вариацию признака под влиянием признака фактора положенного в основу группировки. [pic] [pic] - средняя по группе [pic] - общая средняя по группе [pic] - частота по группе 3. [pic] характеризует вариацию признака под влиянием факторов не включенных в группировку [pic] xij – i значение признака в j группе [pic] - среднее значение признака в j группе fij – частота i-го признака в j группе
Существует правило которое связывает 3 вида дисперсии, оно называется правило сложения дисперсии. [pic] [pic] [pic] - остаточная дисперсия по j группе [pic] - сумма частот по j группе n – общая сумма частот
§7 основная задача анализа вариационных рядов – выявление закономерности распределения частот. Кривая распределения – графическое изображение в виде непрерывной линии изменения частот в вариационном ряду в функционально связанным изменением значения признака.
Кривую распределения можно построить с помощью полигона и гистограммы. Целесообразно свести эмпирическое распределение к теоретическому, к одному из хорошо изученных виду. Кривая нормального распределения.
1. одновершинные
2. много вершинные
Для однородных совокупностей характерны одновершинные кривые, много вершинная кривая говорит о неоднородности совокупности и необходимости перегруппировки.
Выяснение общего характера распределения предполагает оценку его однородности, и расчет асимметрии и эксцесса. Для симметричных распределений [pic] Для сравнительного изучения асимметрии различных распределений вычисляется коэффициент асимметрии As. [pic] где [pic] [pic] - центральный момент третьего порядка; [pic] - СКО в кубе; Если [pic], то асимметрия значительная Если As0, то As – правосторонняя. Если [pic], то As незначительная. Для симметричных и умеренно асимметричных рассчитывается показатель эксцесса: [pic], если Ек>0, то распределение островершинное, если Ek[pic], то распределение не является нормальным, т.е. гипотеза о нормальном распределении отменяется. Если [pic]
Страницы: 1, 2, 3