Структурные (позиционные) средние – это средние величины, которые занимают определенное место (позицию) в ранжированном вариационном ряду.

Мода (Mo ) — это значение признака, наиболее часто встречающееся в исследуемой совокупности.

Для дискретных вариационных рядов модой будет значение варианты с наибольшей частотой

Пример . Определить моду по имеющимся данным (табл. 7.5).

Таблица 7.5 – Распределение женской обуви, проданной в обувном магазине N , февраль 2013 г.

По данным табл. 5 видно, что наибольшая частота f max = 28, ей соответствует значение признака x = 37 размер. Следовательно, Mo = 37 размер обуви, т.е. именно этот размер обуви пользовался наибольшим спросом, наиболее часто покупали обувь 37-го размера.

В сначала определяется модальный интервал , т.е. содержащий моду – интервал с наибольшей частотой (в случае интервального распределения с равными интервалами, в случае с неравными интервалами – по наибольшей плотности).

Модой приближенно считается середина модального интервала. Конкретное значение моды для интервального ряда определяется по формуле:

где x Mo – нижняя граница модального интервала;

i Mo – величина модального интервала;

f Mo – частота модального интервала;

f Mo -1 – частота интервала, предшествующего модальному;

f Mo +1 – частота интервала, следующего за модальным.

Пример . Определить моду по имеющимся данным (табл. 7.6).

Таблица 7.6 – Распределение работников по стажу

По данным табл. 6 видно, что наибольшая частота f max = 35, ей соответствует интервал: 6-8 лет (модальный интервал). Определим моду по формуле:

лет.

Следовательно, Mo = 6,8 лет, т.е. большинство работников имеют стаж 6,8 лет.

Название медианы взято из геометрии, где им именуется отрезок, соединяющий одну из вершин треугольника с серединой противоположной стороны и разделяющий, таким образом, сторону треугольника на две равные части.

Медиана () это значение признака, приходящееся на середину ранжированной совокупности. Иначе медиана – это величина, которая делит численность упорядоченного вариационного ряда на две равные части – одна часть имеет значения варьирующего признака меньшие, чем средний вариант, а другая – большие.

Для ранжированного ряда (т.е.упорядоченного — построенного в порядке возрастания или убывания индивидуальных значений признака) с нечетным числом членов (n= нечет) медианой является варианта, расположенная в центре ряда. Порядковый номер медианы (N Me ) определяется следующим образом:

N Me =(n +1)/ 2.

Пример. В ряду из 51 члена номер медианы (51+1)/2 = 26, т.е. медианой является вариант, стоящий в ряду 26-ым по порядку.

Дляранжированного ряда с четным числом членов (n= чет) – медианой будет средняя арифметическая из двух значений признака, расположенных в середине ряда. Порядковые номера двух центральных вариант определяются следующим образом:

N Me 1 =n/ 2; N Me 2 =(n/ 2)+ 1.

Пример. При n=50; N Me1 = 50/2 = 25; N Me2 = (50/2)+1 = 26, т.е. медианой является средняя из вариант, стоящих в ряду 25-ой и 26-ой по порядку.

В дискретных вариационных рядах медиана находится по накопленной частоте, соответствующей порядковому номеру медианы или впервые его превышающей. Иначе по накопленной частоте равной или впервые превышающей половину суммы всех частот ряда.

Пример . Определить медиану по имеющимся данным (табл. 7.7).

Таблица 7.7 – Распределение женской обуви, проданной в обувном магазине N , февраль 2013 г.

По данным табл. 7 определим порядковый номер медианы: N Me =(67+1)/2=34.

Мода. Медиана. Способы их расчета (стр. 1 из 2)

Накопленная частота, впервые превышающая это значение, S = 41, ей соответствует значение признака x = 37 размер. Следовательно, Me = 37 размер обуви, т.е. половина пар покупается меньше 37-го размера, а другая половина – больше.

В этом примере мода и медиана совпадают, но они могут и не совпадать.

В интервальном вариационном ряду определяются накопленные частоты, по данным о накопленных частотах находят медианный интервал – интервал, в котором накопленная частота составляет половину или впервые превышает половину всей суммы частот. Формула для определения медианы в интервальном ряду распределения имеет следующий вид:

.

где x Me – нижняя граница медианного интервала;

i Me – величина медианного интервала;

f i – сумма частот ряда;

S Me -1 – сумма накопленных частот интервала, предшествующего медианному;

f Me – частота медианного интервала.

Пример . Определить медиану по имеющимся данным (табл. 7.8).

Таблица 7.8 – Распределение работников по стажу

По данным табл. 8 определим порядковый номер медианы: N Me =100 /2=50. Накопленная частота, впервые превышающая это значение, S = 82, ей соответствует интервал 6-8 лет (медианный интервал). В этом примере модальный и медианный интервал совпадают, но они могут и не совпадать. Определим медиану по формуле:

лет

Следовательно, Me = 6,2 года, т.е. половина работников имеют стаж менее 6,2 года, а другая половина – более.

Мода и медиана находят широкое применение в разных областях экономики. Так, исчисление модальной производительности труда, модальной себестоимости и т.д. дает возможность экономисту судить о преобладающем в данный момент их уровне. Эта характеристика должна быть использована для выявления резервов нашей экономики. Мода имеет значение для решения практических задач. Так, при планировании массового выпуска одежды и обуви устанавливается размер продукции, который пользуется наибольшим спросом (модальный размер). Мода может быть использована в качестве приближенной характеристики уровня изучаемого признака вместо средней арифметической, если распределения частот близко к симметричному и имеет одну неплоскую вершину.

Медиану следует применять в качестве средней величины в тех случаях, где нет достаточной уверенности в однородности изучаемой совокупности. На медиану влияют не столько сами значения, сколько число случаев на том или ином уровне. Следует также отметить, что медиана всегда конкретна (при большом числе наблюдений или в случае нечетного числа членов совокупности), т.к. под Ме подразумевается некоторый действительный реальный элемент совокупности, тогда как арифметическая средняя часто принимает такое значение, которое не может принимать ни одна из единиц совокупности.

Главное свойство Ме в том, что сумма абсолютных отклонений значений признака от медианы меньше, чем от любой другой величины: . Это свойство Ме может быть использовано, например, при определении места строительства общественных зданий, т.к. Ме определяет точку, дающую наименьшее расстояние, допустим, детских садов от местожительства родителей, жителей населенного пункта от кинотеатра, при проектировке трамвайных, троллейбусных остановок и т.д.

В системе структурных показателей в качестве показателей особенностей формы распределения выступают варианты, занимающие определенное место в ранжированном вариационном ряду (каждое четвертое, пятое, десятое, двадцать пятое и т.д.). Аналогично с нахождением медианы в вариационных рядах можно отыскать значение признака у любой по порядку единицы ранжированного ряда.

Квартили – значения признака, делящие ранжированную совокупность на четыре равные части. Различают квартиль нижний (Q 1 ), средний (Q 2 ) и верхний (Q 3 ). Нижний квартиль отделяет 1/4 часть совокупности с наименьшими значениями признака, верхний — 1/4 часть с наибольшими значениями признака. Это означает, что 25% единиц совокупности будут меньше по величине Q 1 ; 25% единиц будут заключены между Q 1 и Q 2 ; 25% – между Q 2 и Q 3 ; остальные 25% превосходят Q 3 . Средним квартилем (Q 2 ) является медиана.

Для расчета квартилей по интервальному ряду используют формулы:

;

.

где x Q1 – нижняя граница интервала, содержащего нижний квартиль (интервал определяется по накопленной частоте, первой превышающей 25%);

x Q3 – нижняя граница интервала, содержащего верхний квартиль (интервал определяется по накопленной частоте, первой превышающей 75%);

S Q 1-1 – накопленная частота интервала, предшествующего интервалу, содержащему нижний квартиль;

S Q 3-1 – накопленная частота интервала, предшествующего интервалу, содержащему верхний квартиль;

f Q1 – частота интервала, содержащего нижний квартиль;

f Q3 – частота интервала, содержащего верхний квартиль.

Децили – это значения вариант, которые делят ранжированный ряд на десять равных частей: 1-ый дециль (d 1 ) делит совокупность в соотношении 1/10 к 9/10, 2-ой дециль (d 2 ) — в соотношении 2/10 к 8/10 и т.д. Вычисляются децили по той же схеме, что и медиана, и квартили:

;

.

Использование в анализе вариационных рядов распределения рассмотренных выше характеристик позволяет глубоко и детально охарактеризовать изучаемую совокупность.

ПОСМОТРЕТЬ ЕЩЕ:

Структурные средние величины

Наряду со степенными средними широкое распространение получили структурные средние.

Структура статистических совокупностей бывает разной. При этом чем симметричнее распределение единиц совокупности, чем качественно однороднее ее состав по изучаемому признаку, тем лучше, надежнее средняя величина признака характеризует изучаемое явление. Но для случаев резкой скошенности (асимметрия) ряда распределения средняя арифметическая уже не так типична. Например, средний размер вклада в сбербанках не представляет особого интереса, так как основная масса вкладов находится ниже этого уровня, а на среднюю оказывают существенное влияние крупные вклады, которых мало и которые не характерны для массы вкладов.

Мода (статистика)

В таких случаях статистика применяет другую систему – систему вспомогательных структурных средних. К их числу относятся мода, медиана, а также квартели, квинтели, децели, перцентели.

Мода (Мо) – наиболее часто встречающаяся величина признака, а в дискретном вариационном ряду – это варианта с наибольшей частотой.

В статистической практике мода используется при изучении доходов населения, покупательского спроса, регистрации цен и при анализе некоторых технико-экономических показателей работы предприятий.

В отдельных случаях именно мода представляет интерес, а не средняя арифметическая. Иногда она применяется вместо арифметической средней, например, для характеристики структуры рядов распределения.

Порядок определения моды зависит от вида ряда распределения. Если варьирующий признак представлен в виде дискретного ряда, то для определения моды не требуется никаких вычислений. В таком ряду модой будет то значение признака, которое обладает наибольшей частотой.

Если значение признака представлены в виде интервального вариационного ряда с равными интервалами, то моду определяют расчетным путем по формуле:

где х Мо – нижняя граница модального интервала,

i Мо – величина модального интервала,

f Мо , f Мо-1 , f Мо+1 – соответственно частоты модального, предмодального (предыдущего) и послемодального (следующего за модальным) интервалов.

Медиана (Ме) – это величина признака, которая находится в середине ранжированного вариационного ряда, где отдельные значения признака (варианты) расположены в порядке их возрастания или убывания (по рангу).

Медиану следует применять в качестве средней величины в тех случаях, где нет достаточной уверенности в однородности изучаемой совокупности. Медиана находит применение в маркетинговой деятельности. Например, размещение элеваторов, заводов первичного виноделия, консервных заводов, сумма расстояний до которых от поставщиков сырья должна быть наименьшей.

Медиана, как и мода, определяется по-разному. Это зависит от строения ряда распределения.
Для определения медианы в дискретных вариационных рядах:

1) находят ее порядковый номер по формуле

N Me =
2) строят ряд накопленных частот

3) находят накопленную частоту, которая равна порядковому номеру медианы или его превышает

4) варианта, соответствующая данной накопленной частоте, является медианой.

Если число членов дискретного ряда нечетное, то медиана находится в середине ряда и делит этот ряд пополам на две равные части по числу членов ряда. Порядковый номер медианы в этом случае вычисляется по формуле:

N Me =(f + 1)2,

где f число членов ряда.

В интервальных рядах сначала определяют медианный интервал. Для этого так же, как и в дискретных рядах, рассчитывают порядковый номер медианы . Накопленной частоте, которая равна номеру медианы или первая его превышает, в интервальном вариационном ряду соответствует медианный интервал. Обозначим эту накопленную частоту S Me . Непосредственно расчет медианы проводят по формуле:

,
где — нижняя граница медианного интервала

— величина медианного интервала

— накопленная частота интервала, предшествующего медианному

— частота медианного интервала

Графическое определение моды и медианы
Моду и медиану в интервальном ряду можно определить графически.

Мода определяется по гистограмме распределения. Для этого выбирается самый высокий прямоугольник, который является в данном случае модальным. Затем правую вершину модального прямоугольника соединяем с правым верхним углом предыдущего прямоугольника. А левую вершину модального прямоугольника – с левым верхним углом последующего прямоугольника. Далее из точки их пересечения опускают перпендикуляр на ось абсцисс. Абсцисса точки пересечения этих прямых и будет модой распределения (рис. 1). Медиана рассчитывается по кумуляте (рис. 2). Для ее определения из точки на шкале накопленных частот (частостей), соответствующей 50%, проводится прямая, параллельная оси абсцисс, до пересечения с кумулятой. Затем из точки пересечения указанной прямой с кумулятой опускается перпендикуляр на ось абсцисс. Абсцисса точки пересечения является медианой.

Показатели вариации в статистике.

В процессе статистического анализа может сложиться ситуация, когда значения средних величин совпадают, а совокупности, на основе которых они рассчитаны, состоят из единиц, значения признака у которых достаточно резко различают между собой. В этом случае рассчитывают показатели вариации.

Каталог: downloads -> Sotrudniki
downloads -> Н. Л. Иванова М. Ф. Луканина
downloads -> Лекция для специалистов доу и родителей «Профилактика агрессивного поведения дошкольников»
downloads -> Психологическая профессиональная адаптация личности
downloads -> Департамент образования и науки кемеровской области кемеровский областной психолого-валеологический центр
downloads -> Федеральная служба РФ по контролю за оборотом наркотиков управление по кемеровской области
Sotrudniki -> Боу чувашской Республики спо «чэтк» Минобразования Чувашии
downloads -> Особенности психолого-педагогического сопровождения развития детей дошкольного возраста
downloads -> Мишина М. М. Развитие мышления в зависимости от включенности в семейно-родовые отношения
Sotrudniki -> Формирование профессионально-значимых качеств у обучающихся с нарушениями интеллекта по профессии

КОНТРОЛЬНАЯ РАБОТА

На тему: "Мода. Медиана. Способы их расчета"

Введение

Средние величины и связанные с ними показатели вариации играют в статистике очень большую роль, что обусловлено предметом ее изучения. Поэтому данная тема является одной из центральных в курсе.

Средняя является очень распространенным обобщающим показателям в статистике. Это объясняется тем, что только с помощью средней можно охарактеризовать совокупность по количественно варьирующему признаку. Средней величиной в статистике называется обобщающая характеристика совокупности однотипных явлений по какому-либо количественно варьирующему признаку. Средняя показывает уровень этого признака, отнесенный к единице совокупности.

Изучая общественные явления и стремясь выявить их характерные, типичные черты в конкретных условиях места и времени, статистики широко используют средние величины. С помощью средних можно сравнивать между собой различные совокупности по варьирующим признакам.

Средние, которые применяются в статистике, относятся к классу степенных средних. Из степенных средних наиболее часто применяется средняя арифметическая, реже – средняя гармоническая; средняя гармоническая применяется только при исчислении средних темпов динамики, а средняя квадратическая – только при исчислении показателей вариации.

Средняя арифметическая есть частное от деления суммы вариант на их число. Она применяется в тех случаях, когда объем варьирующего признака для всей совокупности образуется как сумма значений признака у отдельных ее единиц. Средняя арифметическая – наиболее распространенный вид средних, так как она соответствует природе общественных явлений, где объем варьирующих признаков в совокупности чаще всего образуется именно как сумма значений признака у отдельных единиц совокупности.

По своему определяющему свойству средняя гармоническая должна применяться тогда, когда общий объем признака образуется как сумма обратных значений вариант. Ее применяют тогда, когда в зависимости от имеющего материала веса приходиться не умножать, а делить на варианты или, что то же самое, умножать на обратное их значение. Средняя гармоническая в этих случаях – это величина обратная средней арифметической из обратных значений признака.

К средней гармонической следует прибегать в тех случаях, когда в качестве весов применяются не единицы совокупности – носители признака, а произведения этих единиц на значение признака.

1. Определение моды и медианы в статистике

Средние арифметическая и гармоническая являются обобщающими характеристиками совокупности по тому или иному варьирующему признаку. Вспомогательными описательными характеристиками распределения варьирующего признака являются мода и медиана.

Модой в статистике называется величина признака (варианта), которая чаще всего встречается в данной совокупности. В вариационном ряду это будет варианта, имеющая наибольшую частоту.

Медианной в статистике называется варианта, которая находится в середине вариационного ряда. Медиана делит ряд пополам, по обе стороны от нее (вверх и вниз) находится одинаковое количество единиц совокупности.

Мода и медиана в отличии от степенных средних являются конкретными характеристиками, их значение имеет какая-либо конкретная варианта в вариационном ряду.

Мода применяется в тех случаях, когда нужно охарактеризовать наиболее часто встречающуюся величину признака.

5.5 Мода и медиана. Их вычисление в дискретных и интервальных вариационных рядах

Если надо, например, узнать наиболее распространенный размер заработной платы на предприятии, цену на рынке, по которой было продано наибольшее количество товаров, размер ботинок, пользующийся наибольшим спросом у потребителей, и т.д., в этих случаях прибегают к моде.

Медиана интересна тем, что показывает количественную границу значение варьирующего признака, которую достигла половина членов совокупности. Пусть средняя заработная плата работников банка составила 650000 руб. в месяц. Эта характеристика может быть дополнена, если мы скажем, что половина работников получила заработную плату 700000 руб. и выше, т.е. приведем медиану. Мода и медиана являются типичными характеристиками в тех случаях, когда взяты совокупности однородные и большой численности.

Нахождение моды и медианы в дискретном вариационном ряду

Найти моду и медиану в вариационном ряду, где значения признака заданы определенными числами, не представляет большой трудности. Рассмотрим таблицу 1. с распределение семей по числу детей.

Таблица 1. Распределение семей по числу детей

Очевидно, в этом примере модой будет семья, имеющая двоих детей, так как этому значению варианты соответствует наибольшее число семей. Могут быть распределения, где все варианты встречаются одинаково часто, в этом случае моды нет или, иначе, можно сказать, что все варианты одинаково модальны. В других случаях не одна, а две варианты могут быть наибольшей частоты. Тогда будет две моды, распределение будет бимодальным. Бимодальные распределения могут указывать на качественную неоднородность совокупности по исследуемому признаку.

Чтобы найти медиану в дискретном вариационном ряд, нужно сумму частот разделить пополам и к полученному результату добавить ½. Так, в распределении 185 семьи по числу детей медианой будет: 185/2 + ½ = 93, т.е. 93-я варианта, которая делит упорядоченный ряд пополам. Каково же значение 93-ей варианты? Для того чтобы это выяснить, нужно накапливать частоты, начиная, от наименьшей варианты. Сумма частот 1-й и 2-й вариант равна 40. Ясно, что здесь 93 варианты нет. Если прибавить к 40 частоту 3-й варианты, то получим сумму, равную 40 + 75 = 115. Следовательно, 93-я варианта соответствует третьему значению варьирующего признака, и медианой будет семья, имеющая двоих детей.

Мода и медиана в данном примере совпали. Если бы у нас была четная сумма частот (например, 184), то, применяя указанную выше формулу, получим номер медианной варианты, 184/2 + ½ =92,5. Поскольку варианты с дробным номером не существует, полученный результат указывает, что медиана находится посередине между 92 и 93 вариантами.

3. Расчет моды и медианы в интервальном вариационном ряду

Описательный характер моды и медианы связан с тем, что в них не погашаются индивидуальные отклонения. Они всегда соответствуют определенной варианте. Поэтому мода и медиана не требуют для своего нахождения расчетов, если известны все значения признака. Однако в интервальном вариационном ряду для нахождения приближенного значения моды и медианы в пределах определенного интервала прибегают к расчетам.

Для расчета определенного значения модальной величины признака, заключенного в интервале, применяют формулу:

М о = Х Мо + i Мо *(f Мо – f Мо-1)/((f Мо – f Мо-1) + (f Мо – f Мо+1)),

Где Х Мо – минимальная граница модального интервала;

i Мо – величина модального интервала;

f Мо – частота модального интервала;

f Мо-1 – частота интервала, предшествующего модальному;

f Мо+1 – частота интервала, следующего за модальным.

Покажем расчет моды на примере, приведенном в таблице 2.

Таблица 2. Распределение рабочих предприятия по выполнению норм выработки

Чтобы найти моду, первоначально определим модальный интервал данного ряда. Из примера видно, что наибольшая частота соответствует интервалу, где варианта лежит в пределах от 100 до 105. Это и есть модальный интервал. Величина модального интервала равна 5.

Подставляя числовые значения из таблицы 2. в указанную выше формулу, получим:

М о = 100 + 5 * (104 -12)/((104 – 12) + (104 – 98)) = 108,8

Смысл этой формулы заключается в следующем: величину той части модального интервала, которую нужно добавить к его минимальной границе, определяют в зависимости от величины частот предшествующего и последующего интервалов. В данном случае к 100 прибавляем 8,8, т.е. больше половины интервала, потому что частота предшествующего интервала меньше частоты последующего интервала.

Исчислим теперь медиану. Для нахождения медианы в интервальном вариационном ряду определяем сначала интервал, в котором она находится (медианный интервал). Таким интервалом будет такой, комулятивная частота которого равна или превышает половину суммы частот. Комулятивные частоты образуются путем постепенного суммирования частот, начиная от интервала с наименьшим значением признака. Половина суммы частот у нас равна 250 (500:2). Следовательно, согласно таблицы 3. медианным интервалом будет интервал со значением заработной платы от 350000 руб. до 400000 руб.

Таблица 3. Расчет медианы в интервальном вариационном ряду

До этого интервала сумма накопленных частот составила 160. Следовательно, чтобы получить значение медианы, необходимо прибавить еще 90 единиц (250 – 160).

При определении значения медианы предполагают, что значение единиц в границах интервала распределяется равномерно. Следовательно, если 115 единиц, находящихся в этом интервале, распределяются равномерно в интервале, равном 50, то 90 единицам будет соответствовать следующая его величина:

Мода в статистике

Медиана (статистика)

Медиана (статистика) , в математической статистике — число, характеризующее выборку (например, набор чисел). Если все элементы выборки различны, то медиана — это такое число выборки, что ровно половина из элементов выборки больше него, а другая половина меньше него.

В более общем случае медиану можно найти, упорядочив элементы выборки по возрастанию или убыванию и взяв средний элемент. Например, выборка {11, 9, 3, 5, 5} после упорядочивания превращается в {3, 5, 5, 9, 11} и её медианой является число 5. Если в выборке чётное число элементов, медиана может быть не определена однозначно: для числовых данных чаще всего используют полусумму двух соседних значений (то есть медиану набора {1, 3, 5, 7} принимают равной 4).

Другими словами, медианой в статистике называется значение, которое делит ряд пополам таким образом, что по обе стороны от нее (вниз или вверх) расположено одинаковое число единиц данной совокупности. Из-за этого свойства данный показатель имеет еще несколько названий: 50-й перцентиль или квантиль 0,5.

Медиану используют вместо средней арифметической, когда крайние варианты ранжированного ряда (наименьшая и наибольшая) по сравнению с остальными оказываются чрезмерно большими или чрезмерно малыми.

Функция МЕДИАНА измеряет центральную тенденцию, которая является центром множества чисел в статистическом распределении. Существует три наиболее распространенных способа определения центральной тенденции:

  • Среднее значение — среднее арифметическое, которое вычисляется сложением множества чисел с последующим делением полученной суммы на их количество.
    Например , средним значением для чисел 2, 3, 3, 5, 7 и 10 будет 5, которое является результатом деления их суммы, равной 30, на их количество, равное 6.
  • Медиана — число, которое является серединой множества чисел: половина чисел имеют значения большие, чем медиана, а половина чисел — меньшие.
    Например , медианой для чисел 2, 3, 3, 5, 7 и 10 будет 4.
  • Мода — число, наиболее часто встречающееся в данном множестве чисел.

    Например , модой для чисел 2, 3, 3, 5, 7 и 10 будет 3.

4. Мода. Медиана. Генеральная и выборочная средняя

Мода на экране, медиана в треугольнике, а средние – это температура по больнице и в палате. Продолжаем наш практический курс занимательной статистики (Занятие 1) изучением центральных характеристик статистической совокупности , названия которых вы видите в заголовке. И начнём мы с его конца, поскольку о средних величинах речь зашла практически с первых же абзацев темы. Для подготовленных читателей оглавление :

  • Генеральная и выборочная средняя – вычисление по первичным данным и для сформированного дискретного вариационного ряда;
  • Мода – определение и нахождение для дискретного случая;
  • Медиана – общее определение, как найти медиану;
  • Средняя, мода и медиана интервального вариационного ряда – вычисление по первичным данным и по готовому ряду. Формулы моды и медианы,
  • Квартили, децили, перцентили – коротко о главном.

ну а «чайникам» лучше ознакомиться с материалом по порядку:

Итак, пусть исследуется некоторая генеральная совокупность объёма , а именно её числовая характеристика , не важно, дискретная или непрерывная (Занятия 2, 3 ).

Генеральной средней называется среднее арифметическое всех значений этой совокупности:

Если среди чисел есть одинаковые (что характерно для дискретного ряда ) , то формулу можно записать в более компактном виде:
, где
варианта повторяется раз;
варианта – раз;
варианта – раз;

варианта – раз.

Живой пример вычисления генеральной средней встретился в Примере 2 , но чтобы не занудничать, я даже не буду напоминать его содержание.

Далее. Как мы помним, обработка всей генеральной совокупности часто затруднена либо невозможна, и поэтому из неё организуют представительную выборку объема , и на основании исследования этой выборки делают вывод обо всей совокупности.

Выборочной средней называется среднее арифметическое всех значений выборки:

и при наличии одинаковых вариант формула запишется компактнее:
– как сумма произведений вариант на соответствующие частоты .

Выборочная средняя позволяет достаточно точно оценить истинное значение , чего вполне достаточно для многих исследований. При этом, чем больше выборка, тем точнее будет эта оценка.

Практику начнём, а точнее продолжим, с дискретного вариационного ряда и знакомого условия:

Пример 8

По результатам выборочного исследования рабочих цеха были установлены их квалификационные разряды: 4, 5, 6, 4, 4, 2, 3, 5, 4, 4, 5, 2, 3, 3, 4, 5, 5, 2, 3, 6, 5, 4, 6, 4, 3.

Как решать задачу? Если нам даны первичные данные (исходные необработанные значения), то их можно тупо просуммировать и разделить результат на объём выборки:
– среднестатистический квалификационный разряд рабочих цеха.

Но во многих задачах требуется составить вариационный ряд (см. Пример 4 ) :

– или же этот ряд предложен изначально (что бывает чаще). И тогда, мы, конечно, используем «цивилизованную» формулу:

Мода . Мода дискретного вариационного ряда – это варианта с максимальной частотой. В данном случае . Моду легко отыскать по таблице, и ещё легче на полигоне частот – это абсцисса самой высокой точки:


Иногда таковых значений несколько (с одинаковой максимальной частотой), и тогда модой считают каждое из них.

Если все или почти все варианты различны (что характерно для интервального ряда ), то модальное значение определяется несколько другим способом, о котором во 2-й части урока.

Медиана . Медиана вариационного ряда* – это значение, которая делит его на две равные части (по количеству вариант).

Но теперь нам нужно найти среднюю, моду и медиану.

Решение : чтобы найти среднюю по первичным данным, лучше всего просуммировать все варианты и разделить полученный результат на объём совокупности:
ден. ед.

Эти подсчёты, кстати, займут не так много времени и при использовании оффлайн калькулятора. Но если есть Эксель, то, конечно, забиваем в любую свободную ячейку =СУММ(, выделяем мышкой все числа, закрываем скобку ) , ставим знак деления / , вводим число 30 и жмём Enter . Готово.

Что касается моды, то её оценка по исходным данным, становится непригодна. Хоть мы и видим среди чисел одинаковые, но среди них запросто может найтись пять так шесть-семь вариант с одинаковой максимальной частотой, например, частотой 2. Кроме того, цены могут быть округлёнными. Поэтому модальное значение рассчитывается по сформированному интервальному ряду (о чём чуть позже) .

Чего не скажешь о медиане: забиваем в Эксель =МЕДИАНА(, выделяем мышью все числа, закрываем скобку ) и жмём Enter : . Причём, здесь даже ничего не нужно сортировать.

Но в Примере 6 была проведена сортировка по возрастанию (вспоминаем и сортируем – ссылка выше) , и это хорошая возможность повторить формальный алгоритм отыскания медианы. Делим объём выборки пополам:

И поскольку она состоит из чётного количества вариант, то медиана равна среднему арифметическому 15-й и 16-й варианты упорядоченного (!) вариационного ряда:

ден. ед.

Ситуация вторая . Когда дан готовый интервальный ряд (типичная учебная задача).

Продолжаем анализировать тот же пример с ботинками, где по исходным данным был составлен ИВР . Для вычисления средней потребуются середины интервалов:

– чтобы воспользоваться знакомой формулой дискретного случая:

– отличный результат! Расхождение с более точным значением (), вычисленным по первичным данным, составляет всего 0,04.

По сути дела, здесь мы приблизили интервальный ряд дискретным, и это приближение оказалось весьма эффективным. Впрочем, особой выгоды тут нет, т.к. при современном программном обеспечении не составляет труда вычислить точное значение даже по очень большому массиву первичных данных. Но это при условии, что они нам известны:)

С другими центральными показателями всё занятнее.

Чтобы найти моду, нужно найти модальный интервал (с максимальной частотой) – в данной задаче это интервал с частотой 11, и воспользоваться следующей страшненькой формулой:
, где:

– нижняя граница модального интервала;
– длина модального интервала;
– частота модального интервала;
– частота предыдущего интервала;
– частота следующего интервала.

Таким образом:
ден. ед. – как видите, «модная» цена на ботинки заметно отличается от средней арифметической .

Не вдаваясь в геометрию формулы, просто приведу гистограмму относительных частот и отмечу :


откуда хорошо видно, что мода смещена относительно центра модального интервала в сторону левого интервала с бОльшей частотой. Логично.

Справочно разберу редкие случаи:

– если модальный интервал крайний, то либо ;

– если обнаружатся 2 модальных интервала, которые находятся рядом, например, и , то рассматриваем модальный интервал , при этом близлежащие интервалы (слева и справа) по возможности тоже укрупняем в 2 раза.

– если между модальными интервалами есть расстояние, то применяем формулу к каждому интервалу, получая тем самым 2 или бОльшее количество мод.

Вот такой вот депеш мод:)

И медиана. Если дан готовый интервальный ряд, то медиана рассчитывается чуть по менее страшной формуле, но сначала нудно (описка по Фрейду:)) найти медианный интервал – это интервал, содержащий варианту (либо 2 варианты), которая делит вариационный ряд на две равные части.

Выше я рассказал, как определить медиану, ориентируясь на относительные накопленные частоты , здесь же сподручнее рассчитать «обычные» накопленные частоты . Вычислительный алгоритм точно такой же – первое значение сносим слева (красная стрелка) , и каждое следующее получается как сумма предыдущего с текущей частотой из левого столбца (зелёные обозначения в качестве примера) :

Всем понятен смысл чисел в правом столбце? – это количество вариант, которые успели «накопиться» на всех «пройденных» интервалах, включая текущий.

Поскольку у нас чётное количество вариант (30 штук), то медианным будет тот интервал, который содержит 30/2 = 15-ю и 16-ю варианту. И ориентируясь по накопленным частотам, легко прийти к выводу, что эти варианты содержатся в интервале .

Формула медианы:
, где:
– объём статистической совокупности;
– нижняя граница медианного интервала;
– длина медианного интервала;
частота медианного интервала;
накопленная частота предыдущего интервала.

Таким образом:
ден. ед. – заметим, что медианное значение, наоборот, оказалось смещено правее, т.к. по правую руку находится значительное количество вариант:


И справочно особые случаи.

Функция МЕДИАНА в Excel используется для анализа диапазона числовых значений и возвращает число, которое является серединой исследуемого множества (медианой). То есть, данная функция условно разделяет множество чисел на два подмножества, первое из которых содержит числа меньше медианы, а второе – больше. Медиана является одним из нескольких методов определения центральной тенденции исследуемого диапазона.

Примеры использования функции МЕДИАНА в Excel

При исследовании возрастных групп студентов использовались данные случайно выбранной группы учащихся в ВУЗе. Задача – определить срединный возраст студентов.

Исходные данные:

Формула для расчета:


Описание аргумента:

  • B3:B15 – диапазон исследуемых возрастов.

Полученный результат:

То есть в группе есть студенты, возраст которых меньше 21 года и больше этого значения.



Сравнение функций МЕДИАНА и СРЗНАЧ для вычисления среднего значения

Во время вечернего обхода в больнице каждому больному была замерена температура тела. Продемонстрировать целесообразность использования параметра медиана вместо среднего значения для исследования ряда полученных значений.

Исходные данные:

Формула для нахождения среднего значения:

Формула для нахождения медианы:

Как видно из показателя среднего значения, в среднем температура у пациентов выше нормы, однако это не соответствует действительности. Медиана показывает, что как минимум у половины пациентов наблюдается нормальная температура тела, не превышающая показатель 36,6.

Внимание! Еще одним методом определения центральной тенденции является мода (наиболее часто встречающееся значение в исследуемом диапазоне). Чтобы определить центральную тенденцию в Excel следует использовать функцию МОДА. Обратите внимание: в данном примере значения медианы и моды совпадают:

То есть срединная величина, делящая одно множество на подмножества меньших и больших значений также является и наиболее часто встречающимся значением в множестве. Как видно, у большинства пациентов температура составляет 36,6.

Пример расчета медианы при статистическом анализе в Excel

Пример 3. В магазине работают 3 продавца. По результатам последних 10 дней необходимо определить работника, которому будет выдана премия. При выборе лучшего работника учитывается степень эффективности его работы, а не число проданных товаров.

Исходная таблица данных:


Для характеристики эффективности будем использовать сразу три показателя: среднее значение, медиана и мода. Определим их для каждого работника с использованием формул СРЗНАЧ, МЕДИАНА и МОДА соответственно:


Для определения степени разброса данных используем величину, которая является суммарным значением модуля разницы среднего значения и моды, среднего значения и медианы соответственно. То есть коэффициент x=|av-med|+|av-mod|, где:

  • av – среднее значение;
  • med – медиана;
  • mod – мода.

Рассчитаем значение коэффициента x для первого продавца:

Аналогично проведем расчеты для остальных продавцов. Полученные результаты:


Определим продавца, которому будет выдана премия:

Примечание: функция НАИМЕНЬШИЙ возвращает первое минимальное значение из рассматриваемого диапазона значений коэффициента x.


Коэффициент x является некоторой количественной характеристикой стабильности работы продавцов, которую ввел экономист магазина. С его помощью удалось определить диапазон с наименьшими отклонениями значений. Этот способ демонстрирует, как можно использовать сразу три метода определения центральной тенденции для получения наиболее достоверных результатов.

Особенности использования функции МЕДИАНА в Excel

Функция имеет следующий синтаксис:

МЕДИАНА(число1; [число2];...)

Описание аргументов:

  • число1 – обязательный аргумент, характеризующий первое числовое значение, содержащееся в исследуемом диапазоне;
  • [число2] – необязательный второй (и последующие аргументы, всего до 255 аргументов), характеризующий второе и последующие значения исследуемого диапазона.

Примечания 1:

  1. При расчетах удобнее передавать сразу весь диапазон исследуемых значений вместо последовательного ввода аргументов.
  2. В качестве аргументов принимаются данные числового типа, имена, содержащие числа, данные ссылочного типа и массивы (например, =МЕДИАНА({1;2;3;5;7;10})).
  3. При расчете медианы учитываются ячейки, содержащие пустые значения или логические ИСТИНА, ЛОЖЬ, которые будут интерпретированы как числовые значения 1 и 0 соответственно. Например, результат выполнения функции с логическими значениями в аргументах (ИСТИНА;ЛОЖЬ) эквивалентен результату выполнения с аргументами (1;0) и равен 0,5.
  4. Если один или несколько аргументов функции принимают текстовые значения, которые не могут быть преобразованы в числовые, или содержат коды ошибок, результатом выполнения функции будет код ошибки #ЗНАЧ!.
  5. Для определения медианы выборки могут быть использованы другие функции Excel: ПРОЦЕНТИЛЬ.ВКЛ, КВАРТИЛЬ.ВКЛ, НАИБОЛЬШИЙ Примеры использования:
  • =ПРОЦЕНТИЛЬ.ВКЛ(A1:A10;0,5), поскольку по определению медиана – 50-я процентиль.
  • =КВАРТИЛЬ.ВКЛ(A1:A10;2), так как медиана – 2-я квартиль.
  • =НАИБОЛЬШИЙ(A1:A9;СЧЁТ(A1:A9)/2), но только если количество чисел в диапазоне является нечетным числом.

Примечания 2:

  1. Если в исследуемом диапазоне все числа распределены симметрично относительно среднего значения, среднее арифметическое и медиана для данного диапазона будут эквивалентны.
  2. При больших отклонениях данных в диапазоне («разбросе» значений) медиана лучше отражает тенденцию распределения значений, чем среднее арифметическое. Отличным примером является использование медианы для определения реального уровня зарплат у населения государства, в котором чиновники получают на порядок больше обычных граждан.
  3. Диапазон исследуемых значений может содержать:
  • Нечетное количество чисел. В этом случае медианой будет являться единственное число, разделяющее диапазон на два подмножества больших и меньших значений соответственно;
  • Четное количество чисел. Тогда медиана вычисляется как среднее арифметическое для двух числовых значений, разделяющих множество на два указанных выше подмножества.

Зарплат в различных отраслях экономики, температуру и уровень осадков на одной и той же территории за сопоставимые периоды времени, урожайность выращиваемых культур в разных географических регионах и т. д. Впрочем, средняя является отнюдь не единственным обобщающим показателем - в ряде случае для более точной оценки подходит такая величина как медиана. В статистике она широко применяется в качестве вспомогательной описательной характеристики распределения какого-либо признака в отдельно взятой совокупности. Давайте разберемся, чем она отличается от средней, а также чем вызвана необходимость ее использования.

Медиана в статистике: определение и свойства

Представьте себе следующую ситуацию: на фирме вместе с директором работают 10 человек. Простые работники получают по 1000 грн., а их руководитель, который, к тому же, является собственником, - 10000 грн. Если вычислить среднее арифметическое, то получится, что в среднем зарплата на данном предприятии равна 1900 грн. Будет ли справедливым данное утверждение? Или возьмем такой пример, в одной и той же больничной палате находится девять человек с температурой 36,6 °С, и один человек, у которого она равна 41 °С. Арифметическое среднее в этом случае равно: (36,6*9+41)/10 = 37,04 °С. Но это вовсе не означает, что каждый из присутствующих болен. Все это наталкивает на мысль, что одной средней часто бывает недостаточно, и именно поэтому в дополнение к ней используется медиана. В статистике этим показателем называют вариант, который расположен ровно посередине упорядоченного вариационного ряда. Если посчитать ее для наших примеров, то получится соответственно 1000 грн. и 36,6 °С. Другими словами, медианой в статистике называется значение, которое делит ряд пополам таким образом, что по обе стороны от нее (вниз или вверх) расположено одинаковое число единиц данной совокупности. Из-за этого свойства данный показатель имеет еще несколько названий: 50-й перцентиль или квантиль 0,5.

Как найти медиану в статистике

Способ расчета данной величины во многом зависит от того, какой тип вариационного ряда мы имеем: дискретный или интервальный. В первом случае, медиана в статистике находится довольно просто. Все, что нужно сделать, это найти сумму частот, разделить ее на 2 и затем прибавить к результату ½. Лучше всего будет пояснить принцип расчета на следующем примере. Предположим, у нас есть сгруппированные данные по рождаемости, и требуется выяснить, чему равна медиана.

Номер группы семей по кол-ву детей

Кол-во семей

Проведя нехитрые подсчеты, получим, что искомый показатель равен: 195/2 + ½ = варианта. Для того чтобы выяснить, что это означает, следует последовательно накапливать частоты, начиная с наименьшей варианты. Итак, сумма первых двух строк дает нам 30. Ясно, что здесь 98 варианты нет. Но если прибавить к результату частоту третьей варианты (70), то получится сумма, равная 100. В ней как раз и находится 98-я варианта, а значит медианой будет семья, у которой есть двое детей.

Что же касается интервального ряда, то здесь обычно используют следующую формулу:

М е = Х Ме + i Ме * (∑f/2 - S Me-1)/f Ме, в которой:

  • Х Ме - первое значение медианного интервала;
  • ∑f - численность ряда (сумма его частот);
  • i Ме - величина медианного диапазона;
  • f Ме - частота медианного диапазона;
  • S Ме-1 - сумма кумулятивных частот в диапазонах, предшествующих медианному.

Опять же, без примера здесь разобраться довольно сложно. Предположим, есть данные по величине

Зарплата, тыс. руб.

Накопленные частоты

Чтобы воспользоваться вышеприведенной формулой, вначале нам нужно определить медианный интервал. В качестве такого диапазона выбирают тот, накопленная частота которого превышает половину всей суммы частот или равна ей. Итак, разделив 510 на 2, получаем, что этому критерию соответствует интервал со значением зарплаты от 250000 руб. до 300000 руб. Теперь можно подставлять все данные в формулу:

М е = Х Ме + i Ме * (∑f/2 - S Ме-1)/f Ме = 250 + 50 * (510/2 - 170) / 115 = 286,96 тыс. руб.

Надеемся, наша статья оказалась полезной, и теперь вы имеете ясное представление о том, что такое медиана в статистике и как ее следует рассчитывать.

Медиана - это такое значение признака, которое разделяет ранжированный ряд распределения на две равные части - со значениями признака меньше медианы и со значениями признака больше медианы. Для нахождения медианы, нужно отыскать значение признака, которое находится на середине упорядоченного ряда.

Посмотреть решение задачи на нахождение моды и медианы Вы можете

В ранжированных рядах несгруппированные данные для нахождения медианы сводятся к поиску порядкового номера медианы. Медиана может быть вычислена по следующей формуле:

где Хm - нижняя граница медианного интервала;
im - медианный интервал;
Sme- сумма наблюдений, которая была накоплена до начала медианного интервала;
fme - число наблюдений в медианном интервале.

Свойства медианы

  1. Медиана не зависит от тех значений признака, которые расположены по обе стороны от нее.
  2. Аналитические операции с медианой весьма ограничены, поэтому при объединении двух распределений с известными медианами невозможно заранее предсказать величину медианы нового распределения.
  3. Медиана обладает свойством минимальности. Его суть заключается в том, что сумма абсолютных отклонений значений х, от медианы представляет собой минимальную величину по сравнению с отклонением X от любой другой величины

Графическое определение медианы

Для определения медианы графическим методом используют накопленные частоты, по которым строится кумулятивная кривая. Вершины ординат, соответствующих накопленным частотам, соединяют отрезками прямой. Разделив поп олам последнюю ординату, которая соответствует общей сумме частот и проведя к ней перпендикуляр пересечения с кумулятивной кривой, находят ординату искомого значения медианы.

Определение моды в статистике

Мода - значение признака , имеющее наибольшую частоту в статистическом ряду распределения.

Определение моды производится разными способами, и это зависит от того, представлен ли варьирующий признак в виде дискретного или интервального ряда.

Нахождение моды и медианы происходит путем обычного просматривания столбца частот. В этом столбце находят наибольшее число, характеризующее наибольшую частоту. Ей соответствует определенное значение признака, которое и является модой. В интервальном вариационном ряду модой приблизительно считают центральный вариант интервала с наибольшей частотой. В таком ряду распределения мода вычисляется по формуле :

где ХМо - нижняя граница модального интервала;
imo - модальный интервал;
fм0, fм0-1, fм0+1 — частоты в модальном, предыдущем и следующем за модальным интервалах.

Модальный интервал определяется по наибольшей частоте.

Мода широко используется в статистической практике при анализе покупательного спроса, регистрации цен и т. д.

Соотношения между средней арифметической, медианой и модой

Для одномодального симметричного ряда распределения , медиана и мода совпадают. Для асимметричных распределений они не совпадают.

К. Пирсон на основе выравнивания различных типов кривых определил, что для умеренно асимметричных распределений справедливы такие приближенные соотношения между средней арифметической, медианой и модой: