Какая величина характеризует закономерные колебания вариации средней арифметической величины

Обновлено: 02.07.2024

Информация о средних уровнях исследуемых показателей обычно бывает недостаточной для глубокого анализа изучаемого процесса или явления. Необходимо учитывать и разброс или вариацию значений отдельных единиц.

Основными показателями, характеризующими вариацию, являются: размах, дисперсия, среднее квадратическое отклонение и коэффициент вариации.

Размах вариации – простейший показатель, разность между максимальным и минимальным значениями признака.

\[ \begin R=x_-x_ \end \] Недостатком является то, что он оценивает только границы варьирования признака и не отражает его колеблемость внутри этих границ.

Дисперсия – средний квадрат отклонений значений признака от их средней величины и определяется по формулам простой

и взвешенной средней величины. \[ \begin \sigma^2=\frac >)^2 f_i> > \end \] Наиболее удобным и широко распространенным на практике показателем является среднее квадратическое отклонение. Оно определяется как квадратный корень из дисперсии и имеет ту же размерность, что и изучаемый признак.

\[ \begin \sigma=\sqrt< \frac< \sum<(x_i-\overline>)^2> > \text < и >\sigma=\sqrt < \frac >)^2 f_i> > > \end \] Рассмотренные показатели позволяют получить абсолютное значение вариации, т.е. оценивают ее в единицах измерения исследуемой совокупности. В отличие от них, коэффициент вариации измеряет колеблемость в относительном выражении, относительно среднего уровня, что во многих случаях является предпочтительнее:

Если коэффициент вариации не превышает 33%, то совокупность по рассматриваемому признаку можно считать однородной.

Показатели вариации могут быть использованы не только в анализе изменчивости изучаемого признака, но и для оценки степени воздействия одного признака на вариацию другого признака, т.е.е в анализе взаимосвязей между показателями.

При проведении такого анализа совокупность должна представлять собой множество единиц, каждая из которых характеризуется двумя признаками – факторным и результативным.

Для выявления взаимосвязи исходная совокупность делится на две или более групп по факторному признаку. Выводы о степени взаимосвязи базируются на анализе вариации результативного признака. При этом применяется правило сложения дисперсий:

  • \(\sigma_o^2\) - общая дисперсия;
  • \(\overline^2\) - средняя из внутригрупповых дисперсий;
  • \(\delta^2\) - межгрупповая дисперсия.

Межгрупповая дисперсия отражает ту часть вариации результативного признака, которая обусловлена воздействием факторного признака. Это воздействие проявляется в отклонении групповых средних от общей средней:

  • \(\overline_i\) - среднее значение результативного признака по i-ой группе;
  • \(\overline_o\) - общая средняя по совокупности в целом;
  • \(n_i\) - объем (численность) i-ой группы.

Если факторный признак, по которому производится группировка, не оказывает никакого влияния на результативный признак, то групповые средние будут равны между собой и совпадут с общей средней. В этом случае межгрупповая средняя будет равна нулю.

Средняя из внутригрупповых дисперсий отражает ту часть вариации результативного признака, которая обусловлена действием всех прочих неучтенных факторов, кроме фактора, по которому осуществлялась группировка:

  • \(\sigma_i^2\) - дисперсия результативного признака в i-ой группе;
  • \(n_i\) - объем (численность) i-ой группы.

Теснота связи между факторным и результативным признаком оценивается на основе эмпирического корреляционного отношения:

\[ \begin \eta_э = \sqrt < \frac > \end \] Данный показатель может принимать значения от 0 до 1. Чем ближе к 1 будет его величина, тем сильнее взаимосвязь между рассматриваемыми признаками.

Среди множества варьирующих признаков, изучаемых статистикой, существуют признаки, которыми обладают одни единицы совокупности и не обладают другие. Эти признаки называются альтернативными. Альтернативный признак принимает всего два значения – 0 и 1 с весами соответственно p и q. Поэтому среднее значение альтернативного признака равно р. А дисперсия альтернативного признака равна pq. Дисперсия альтернативного признака равна произведению доли признака, обладающего характеристикой на долю признака, не обладающего характеристикой. Предельное значение дисперсии для альтернативного признака равно 0,25 при р=0,5.

Дисперсия альтернативного признака широко применяется в выборочном обследовании.

Изменения частот в вариационных рядах изменяются закономерно в связи с изменением варьирующего признака. Такие закономерности называются закономерностями распределения.

Основная задача анализа вариационных рядов заключается в выявлении подлинной закономерности распределения путем исключения влияния второстепенных, случайных для данного распределения факторов.

Если увеличить объем совокупности и уменьшить интервал в группах, то графическое изображение приближается к некоторой плавной кривой, которая называется кривой распределения.

Кривая распределения – графическое изображение в виде непрерывной линии изменения частот в вариационном ряду, функционально связанного с изменением вариант.

Теоретическая кривая распределения – кривая, выражающая общую закономерность данного типа распределения в чистом виде, исключающего влияние случайных для него факторов.

Выяснение общего характера распределения предполагает оценку его однородности, а также расчет показателей асимметрии и эксцесса.

При сравнительном изучении асимметрии нескольких распределений с разными единицами измерения вычисляется относительный показатель асимметрии:

Его величина может быть положительной (для правосторонней асимметрии) и отрицательной (для левосторонней асимметрии).

Применение данного показателя дает возможность определить не только величину асимметрии, но и проверить ее наличие в генеральной совокупности. Принято считать, что асимметрия выше 0,5 (независимо от знака) считается значительной. Если асимметрия меньше 0,25, она считается незначительной.

Если коэффициент асимметрии находится в интервале от 0,25 до 0,5, то наличие асимметрии в генеральной совокупности проверяется с помощью определения оценки существенности на основе средней квадратической ошибки:

\[ \begin \sigma_ = \sqrt < \frac < (n+1) (n+3) >> \end \] В случае, если \( <\large \frac <|A_s|><\sigma_> > 3 >\) , асимметрия считается существенной и распределение признака в генеральной совокупности несимметрично и неслучайно, а закономерно.

Для симметричных распределений может быть рассчитан показатель эксцесса, который показывает, насколько резкий скачок имеет изучаемое явление. Показатель эксцесса определяется на основе центрального момента четвертого порядка по формуле:

Если показатель эксцесса больше нуля, то распределение островершинное и скачок считается значительным, если коэффициент эксцесса меньше нуля, то распределение считается плосковершинным и скачок считается незначительным. Среднеквадратическая ошибка эксцесса показывает, насколько существенен скачок в явлении и рассчитывается по формуле:

\[ \begin \sigma_ = \sqrt < \frac > \end \] К структурным характеристикам ряда распределения относятся мода, медиана, квартили, децили и перцентили.

Квартили представляют собой значение признака, делящее ранжированную совокупность на четыре равновеликие части. Различают квартиль первого порядка (нижний квартиль) и квартиль третьего порядка (верхний квартиль). Каждый из них отсекает соответственно ¼ и ¾ совокупности. Для расчета квартилей используются следующие формулы:

Децили – варианты, делящие ранжированный ряд на десять равных частей. Первый дециль отсекает 1/10 часть совокупности, а девятый дециль отсекает 9/10 частей. Рассчитываются децили по аналогичным формулам:

Перцентили – варианты, которые делят ранжированную совокупность на 100 частей.

Тема 5: Средние величины

5.1 Сущность средних величин

5.2 Виды средних величин и способы их расчета

5.3 Математические свойства средней арифметической. Упрощеный метод расчета средней арифметической.

5.4 Структурные средние

5.5 Показатели вариации.

5.1.Сущность средних величин.

Средняя величина – это обобщающий количественный показатель, характеризующий типичный уровень совокупности по определенному признаку. Средняя величина является наиболее распространеной формой статистических показателей, используемых в экономических исследованиях.

Основные черты средней величины, как типичной характеристики явления:

1.Средняя величина отражает то общее, что присуще всем единицам исследуемой совокупности.

2. Средняя величина представляет значения оприделенного признака совокупности одним числом, несмотря на количественные различия у отдельных единиц совокупности.

3. Средняя величина абстрагируется от индивидуальных значений признака отдельных единиц совокупности и отражает то общее, что содержится в каждом отдельном единичном.

4. Средние величины тесно связаны с законом больших чисел.

5.2. Виды средних величин и способы их расчета

Виды средних величин:

1) Самый распространенный вид средней величины - это средняя арифметическая.

В общем случае ее расчет сводится к суммированию всех значений варьирующего признака и делению полученной суммы на количество единиц совокупности.

Средняя арифметическая может быть:

а) средняя арифметическая простая

xi - варианты осередняемого признака

n- число единиц совокупности

Средняя арифметическая простая применяется в тех случаях, когда значение каждого варианта встречается по одному разу

б) В тех случаях, когда значение вариантов встречаются несколько раз, для расчет применяют среднюю арифметическую взвешанную.

fi - частота этих вариантов.

В случае определения средней величины в интервальном ряду распределения сначала переходят от интервального к дискретному ряду, т.е. находят середину интервалов в каждой группе, как полусумму нижней и верхней границ в каждой группе.

2) Средняя гармоническая применяется в тех случаях, когда известны варианты осередняемого признака (xi) и показатели, представляющие произведение вариантов на частоты или веса средней арифметич.

Это произведение x*f=F и служит в качестве весов или частот средней гармонической.

Средняя гармоническая может быть простой и взвешанной.

а) средняя гармоническая простая

xi - варианты осередняемого признака

n- число вариантов осередняемого признака

Средняя гармоническая простая применятся в тех случаях, когда веса всех вариантов равны. В тех случаях, когда веса не равны, применяется средняя гармоническая взвешанная.

б) средняя гармоническая взвешанная

Средняя гармоническая - это средняя из обратных величин, поэтому ее применяют для расчета средней трудоемксти, которая является обратной величиной производительности труда (выработки).

На практике чаще всего применяются средняя арифметическая и средняя гармоническая. Чтобы правильно выбрать формулу средней, необходимо руководствоваться следующими правилами:

1. Средняя гармоническая применяется для расчета в тех случаях, когда показатеь, величина которого не известна находится в знаменателе исходного отношения (это экономическое содержание расчитываемое показателем)

ЗП=ФондЗП/ЧР

2. Если в искомом отношении не известен числитель, то для расчета применяют среднюю арифметическую взвешенную.

а) средняя геометрическая простая

xi - варианты осередняемого признака; n- число вариантов осередняемого признака

Применяется, когда варианты встречаются по одному разу.

В тех случаях, когда разное число вариантов, применяется

б) средняя геометрическая взвешенная

Ср. геом. простая применяется в экономических исследованиях для расчета среднего коэффициента роста. Ср. геом. взвешенная применяется для расчета средних величин, когда значения признака заключены в групповые интервалы. В этих случаях в качестве значения признака необходимо брать не значение их середины интервала, а log их полусуммы.

4) Средняя квадратичная применяется при осереднении величин, выраженных в виде квадратичной функции.

Применяется, когда варианты встречаются по одному разу. Применяется на практике редко. Ее используют в основном для расчета средних диаметров труб, средних сторон квадрата.

Между перечисленными средними величинами, рассчитанными по одной и той же совокупности единиц и по одному и тому же признаку существует следующая взаимосвязь:

5) Средняя хронологическая применяется для расчета средних величин в моментных рядах, когда значения признака представлены в хронологическом порядке через равные промежутки времени.

5.3 Математические свойства средней арифметической. Упрощеный метод расчета средней арифметической.

Определение средней арифметической в ряде случаев связано (при очень большой численности совокупности) с большими затратами времени и средств. Однако процедуру расчета средней можно упростить, если использовать некоторые ее свойства. Приведем без доказательства основные свойства средней арифметической:

1) средняя арифметическая от постоянной величины равна ей самой

2) произведение средней на сумму частот равно сумме произведения вариантов на их частоты

3) изменение каждого варианта на одно и тоже число и на одну и ту же величину изменяет среднюю на ту же величину

4) изменение каждого из весов (частот) в одно и тоже число раз не меняет величины средней

5) изменение каждого варианта в одно и тоже число раз изменяет среднюю во столько же раз

6) сумма отклонений каждого варианта от их средней равна нулю

7) средняя суммы равна сумме средних величин

Рассмотренные свойства средней арифметической используются для упрощения расчетов связанных с вычислением средней величины.

Метод упрощения вычисления средней арифметической называется методом условных моментов или методом отчета от условного нуля.

Согласно этому методу средняя рассчитывается по следующей формуле.

x0 – значение условного нуля

h – ширина интервала

m1 – условный момент первого порядка

Расчет средней арифметической способом условных моментов применяется для расчета средних в интервальных вариационных рядах.

5.4 Структурные средние.

В статистическом анализе кроме рассмотренных средних используют величины конкретных вариантов, которые занимают в упорядоченном ряду значений признака определенное положение. Это мода, медиана, квартири, децили, процентили. Эти средние называют структурными средними.

1) Медиана - это вариант расположенный в центре ранжированного ряда. Медиана делит ряд на две равные части, таким образом, что у одной половины единиц совокупности значения варьирующего признака меньше медианы, а у другой - больше.

Рассмотрим расчет медианы в вариационных рядах (дискретный и интервальный).

а) В дискретном вариационном ряду с четном числом вариантов медиана рассчитывается как среднее значение двух вариантов, имеющие порядковые номера n/2 и n/2+1.

В этих рядах с нечетным числом членов медиана рассчитывается по формуле n+1/2

б) В интервальных рядах медиана начинается с определения интервала, в котором находится медиана. Этот интервал называется медианный интервал. Этот интервал характерен тем, что его кумулятивная частота (сумма накопленных частот) равна или превышает полусумму всех частот ряда. После того, как нашли медианный интервал, значение медианы рассчитывается по следующей формуле:

XME – нижняя граница медианного интервала

h – ширина медианного интервала

SME-1 – кумулятивная частота, накопленная до медианного интервала.

2) Мода – это вариант, который чаще всего встречается в данной совокупности. Рассмотрим расчет моды в вариационных рядах:

а) В дискретном вариационом ряду модой является вариант обладающий наибольшей частотой.

б) в интервальном вариационном ряду расчет моды осуществляется в следующем порядке:

1. определяем модальный интервал, т.е. интервал обладающей наибольшей частотой;

2. производим расчет моды по формуле

XM0 – нижняя граница модального интервала

h – ширина модального интервала

fM0 – частота модального интервала

fM0-1 – частота предмодального интервала

fM0+1 – частота послемодального интервала

3) Наряду с медианой для полной характеристики изучаемой совокупности применяют:

а) квартири - делят ряд на 4-е равные части, из будет 3.

б) децили - делят ряд на 10 равных частей, их будет 9.

в) процентили - делят ряд на 100 равных частей, их будет 99

5.5 Показатели вариации.

Вариация – это такие количественные изменения величины исследуемого признака в пределах статистической совокупности, которые обусловлены перекрещивающимся влиянием действия различных факторов.

Например: размер зарплаты рабочих зависит от ряда факторов (специальность, разряд, стаж работы). Чем больше различия между значениями указанных факторов, тем больше вариаций в уровне заработной платы рабочих. Для характеристики вариации используют абсолютные и относительные показатели вариации.

1) Абсолютные (размах вариации) показатели – R – рассчитывается, как разница (..).

Чем меньше значение этого показателя, тем совокупность однороднее. Недостаток этого показателя в том, что он не учитывает изменения значений признака внутри предельных значений вариантов.

Вместе с тем для характеристики вариации признака необходимо знать не только размах предельных значений отклонений но и уметь обобщить отклонения всех значений от какой-либо типичной для изучаемой совокупности величины(средней). Такую характеристику вариаций дает среднее линейное отклонение.

Среднее линейное отклонение представляет собой среднюю арифметическую из абсолютных значений отклонений отдельных вариантов от их средней арифметической.

- это невзвешенное среднее линейное уравнение.

Применяется для вариационного ряда с равными частотами.

- это взвешенное.

Дисперсия - это средний квадрат отклонений вариантов от их средней арифметической.

- это простая дисперсия, которая применяется для в вариационных рядах с равными частотами.

В вариационных рядах с неравными частотами рассчитывают дисперсию взвешенную.

Для интервальных вариационных рядов с равными интервалами дисперсия рассчитывается способом условных моментов.

h – ширина интервала

m1 – условный момент 1-го порядка

m2 – условный момент второго порядка

2) Относительные показатели.

В статистической практике часто возникает необходимость сравнения вариации различных признаков. Например, сравнение вариации возраста рабочих и их квалификации, стажа работы и размера из з/п. Для таких сопоставлений абсолютные показатели вариации нельзя и использовать, тюк нельзя сравнивать вариацию стажа работы, выраженного в годах с вариацией з/п, выраженной в леях. Для таких сравнений используют относительный показатель вариации, который наз-ся коэффициентом вариации.

Коэффициент вариации применяется не только для сравнительной оценки вариации, но и для характеристики однородности совокупности. Если к.в. меньше 30 %, то совокупность является однородной.

Читайте также: