Среднее квадратичное отклонение информатика. Стандартное отклонение процентов. Что такое стандартное отклонение

Дисперсия - это средняя арифметическая квадратов отклонений каждого значения признака от общей средней. В зависимости от исходных данных дисперсия может быть невзвешенной (простой) или взвешенной.

Дисперсия рассчитывается по следующим формулам:

· для несгруппированных данных

· для сгруппированных данных

Порядок расчета дисперсии взвешенную:

1. определяют среднюю арифметическую взвешенную

2. определяются отклонения вариант от средней

3. возводят в квадрат отклонение каждой варианты от средней

4. умножают квадраты отклонений на веса (частоты)

5. суммируют полученные произведения

6. полученную сумму делят на сумму весов

Формула для определения дисперсии может быть преобразована в следующую формулу:

Простая

Порядок расчета дисперсии простой:

1. определяют среднюю арифметическую

2. возводят в квадрат среднюю арифметическую

3. возводят в квадрат каждую варианту ряда

4. находим сумму квадратов вариант

5. делят сумму квадратов вариант на их число, т.е. определяют средний квадрат

6. определяют разность между средним квадратом признака и квадратом средней

Также формула для определения дисперсии взвешенной может быть преобразована в следующую формулу:

т.е. дисперсия равна разности средней из квадратов значений признака и квадрата средней арифметической. При пользовании преобразованной формулой исключается дополнительная процедура по расчету отклонений индивидуальных значений признака от х и исключается ошибка в расчете, связанная с округлением отклонений

Дисперсия обладает рядом свойств, некоторые из них позволяют упростить ее вычисления:

1) дисперсия постоянной величины равна нулю;

2) если все варианты значений признака уменьшить на одно и то же число, то дисперсия не уменьшится;

3) если все варианты значений признака уменьшить в одно и то же число раз ( раз), то дисперсия уменьшится в раз

Среднее квадратичное отклонение S - представляет собой корень квадратный из дисперсии:

· для несгруппированных данных:

· для вариационного ряда:

Размах вариации, среднее линейное и среднее квадратичное отклонение являются величинами именованными. Они имеют те же единицы измерения, что и индивидуальные значения признака.

Дисперсия и среднее квадратическое отклонение наиболее широко применяемые показатели вариации. Объясняется это тем, что они входят в большинство теорем теории вероятности, служащей фундаментом математической статистики. Кроме того, дисперсия может быть разложена на составные элементы, позволяющие оценить влияние различных факторов, обусловливающих вариацию признака.

Расчет показателей вариации для банков, сгруппированных по размеру прибыли, показан в таблице.

Размер прибыли, млн. руб. Число банков расчетные показатели
3,7 - 4,6 (-) 4,15 8,30 -1,935 3,870 7,489
4,6 - 5,5 5,05 20,20 - 1,035 4,140 4,285
5,5 - 6,4 5,95 35,70 - 0,135 0,810 0,109
6,4 - 7,3 6,85 34,25 +0,765 3,825 2,926
7,3 - 8,2 7,75 23,25 +1,665 4,995 8,317
Итого: 121,70 17,640 23,126

Среднее линейное и среднее квадратичное отклонение показывают на сколько в среднем колеблется величина признака у единиц и исследуемой совокупности. Так, в данном случае средняя величина колеблености размера прибыли составляет: по среднему линейному отклонению 0,882 млн. руб.; по среднему квадратическому отклонению - 1,075 млн. руб. Среднее квадратическое отклонение всегда больше среднего линейного отклонения. Если распределение признака, близко к нормальному, то между S и d существует взаимосвязь: S=1,25d, или d=0,8S. Среднее квадратическое отклонение показывает как расположена основная масса единиц совокупности относительно средней арифметической. Независимо от формы распределения 75 значений признака попадают в интервал х 2S, а по крайне мере 89 всех значений попадают интервал х 3S (теорема П.Л.Чебышева).

  • 6. План статистического исследования, его содержание. 7. Программа статистического исследования, ее содержание.
  • 8. Статистическая совокупность, ее групповые свойства, виды. Требования к выборочной совокупности.
  • 25. Статистические таблицы, их виды и требования, предъявляемые к ним.
  • 9. Сбор статистического материала.
  • 10. Основные операции разработки статистического материала.
  • 11. Анализ результатов статистического исследования.
  • 12. Внедрение результатов статистического исследования в практику
  • 13. Абсолютные величины, их применение в здравоохранении.
  • 14. Относительные величины, их применение в анализе деятельности
  • 15. Вариационные ряды, их виды, значение. 16. Величины, характеризующие вариационный ряд.
  • 17. Методы расчета средних величин, значение.
  • 18. Среднее квадратическое отклонение, методика расчета, значение.
  • 19. Ошибка репрезентативности средних величин, методика расчета, значение. 20. Ошибка репрезентативности относительных величин, методика расчета, значение.
  • 21. Оценка достоверности разности статистических величин.
  • 23. Понятие о корреляционном анализе.
  • 24. Графические изображения результатов статистического исследования, виды.
  • 26. Динамические ряды, показатели, вычисление и применение в медицине.
  • 27. Общественное здоровье населения, показатели, значение. 28. Факторы, влияющие на здоровье населения. Формула здоровья.
  • 29. Разделы демографии, её значение для здравоохранения.
  • 30. Статика населения, показатели, их значение. 31. Возрастная структура населения, типы, социальное значение.
  • 33. Динамика населения, виды, показатели, медико-социальное значение.
  • 34. Естественное движение населения, показатели, закономерности, медико-социальное значение.
  • 35. Рождаемость, уровни, методика расчета, анализ и медико-социальные аспекты ее регулирования.
  • 36. Смертность населения, показатели, уровни, методика расчета, анализ и медико-социальное значение.
  • 37. Младенческая смертность, причины, возрастные особенности, методика расчета.
  • 38. Перинатальная смертность, методика расчета, уровни, структура, причины, медико-социальное значение.
  • 40. Воспроизводство населения, типы, показатели, методика расчета.
  • 42. Заболеваемость, показатели, структура, методы изучения.
  • 43. Международная статистическая классификация болезней и проблем, связанных со здоровьем, значение, принципы построения.
  • 3) Заболевания у госпитализированных больных
  • 4) Заболевания с временной утратой трудоспособности (см. Вопрос 58).
  • 45. Заболеваемость с временной утратой трудоспособности, причины, показатели. 46. Изучение заболеваемости с временной утратой трудоспособности.Полицевой учет заболеваемости.
  • 47. Профилактические медицинские осмотры, виды, порядок проведения, документы.
  • 48. Изучение заболеваемости по обращаемости за медицинской помощью.
  • 51. Физическое развитие, методика изучения, медико-социальное значение.
  • 52. Инвалидность населения, причины, показатели, медико-социальное значение. 102. Инвалидность, порядок установления и документы оформления.
  • 54. Болезни системы кровообращения, их медико-социальная значимость и обусловленность. Организация кардиологической службы. Первичная профилактика.
  • 55. Новообразования, их медико-социальная значимость и обусловленность. Организация онкологической службы. Первичная профилактика.
  • 59. Психические расстройства, их медико-социальная значимость и обусловленность. Организация психоневрологической помощи. Первичная профилактика.
  • 60. Алкоголизм и наркомания, их медико-социальная значимость и обусловленность. Организация наркологической помощи. Первичнаяпрофилактика.
  • 61. Принципы государственной политики Республики Беларусь в области здравоохранения.
  • 62. Виды, формы, условия медицинской помощи.
  • 63. Первичная медицинская помощь, принципы, организационная структура, значение, перспективы развития.
  • 65. Регистратура, ее функции. Формы записи на прием к врачу.
  • 68. Врач общей практики, функции, содержание работы, особенности втэ.
  • 76. Приемное отделение, задачи, организационная структура.
  • 80. Стационарзамещающие технологии, виды, принципы работы, значение
  • 103. Медико-реабилитационная экспертная комиссия, ее состав и функции.
  • 104. Медицинская, социальная и трудовая реабилитация инвалидов.
  • II этап – территориальное медицинское объединение (тмо).
  • III этап – областная больница и медицинские учреждения области.
  • 109. Профилактика – важнейший принцип здравоохранения, ее формы и уровни.
  • 113. Здоровый образ жизни, его компоненты, медико-социальное значение. 114. Формирование здорового образа жизни, направления.
  • 115. Методы и средства гигиенического воспитания и обучения населения. 116. Характеристика методов гигиенического воспитания, преимущества и недостатки.
  • 117. Охрана материнства и детства, ее социальное значение, государственные мероприятия в рб.
  • 122. Детская больница, особенности госпитализации, структуры и организация работы. 123. Анализ деятельности детской больницы.
  • 124. Женская консультация, ее структура, задачи и организация работы. 125. Основная медицинская документация и показатели работы женской консультации.
  • 126. Родильный дом, структура, организация приема беременных, рожениц и родильниц. 127. Основная медицинская документация и показатели работы родильного дома.
  • 18. Среднее квадратическое отклонение, методика расчета, значение.

    Приближенный метод оценки колеблемости вариационного ряда - определение лимита и амплитуды, однако не учитывают значений вариант внутри ряда. Основной общепринятой мерой колеблемости количественного приз­нака в пределах вариационного ряда является среднее квадратичес­кое отклонение (σ - сигма) . Чем больше среднее квадратическое отклонение, тем степень ко­леблемости данного ряда выше.

    Методика расчета среднего квадратического отклонения включает следующие этапы:

    1. Находят среднюю арифметическую величину (Μ).

    2. Определяют отклонения отдельных вариант от средней арифмети­ческой (d=V-M). В медицинской статистике отклонения от средней обозначаются как d (deviate). Сумма всех от­клонений равняется нулю.

    3. Возводят каждое отклонение в квадрат d 2 .

    4. Перемножают квадраты отклонений на соответствующие частоты d 2 *p.

    5. Находят сумму произведений (d 2 *p)

    6. Вычисляют среднее квадратическое отклонение по формуле:

    при n больше 30, или при n меньше либо равно 30, где n - число всех вариант.

    Значение среднего квадратичного отклонения:

    1. Среднее квадратическое отклонение характеризует разброс вариант относительно средней величины (т.е. колеблемость вариационного ряда). Чем больше сигма, тем степень разнообразия данного ряда выше.

    2. Среднее квадратичное отклонение используется для сравнительной оценки степени соответствия средней арифметической величины тому вариационному ряду, для которого она вычислена.

    Вариации массовых явлений подчиняются закону нормального распределения. Кривая, отображающая это распределение, имеет вид плавной колоколообразной симметричной кривой (кривая Гаусса). Согласно теории вероятности в явлениях, подчиняющихся закону нормального распределения, между значениями средней арифметической и среднего квадратического отклонения существует строгая математическая зависимость. Теоретическое распределение вариант в однородном вариационном ряду подчиняется правилу трех сигм.

    Если в системе прямоугольных координат на оси абсцисс отложить значения количественного признака (варианты), а на оси ординат - частоты встречаемости вариант в вариационном ряду, то по сторонам от средней арифметической равномерно располагаются варианты с большими и меньшими значениями.

    Установлено, что при нормальном распределении признака:

    68,3% значений вариант находится в пределах М1

    95,5% значений вариант находится в пределах М2

    99,7% значений вариант находится в пределах М3

    3. Среднее квадратическое отлонение позволяет установить значения нормы для клинико-биологических показателей. В медицине интервал М1 обычно принимается за пределы нормы для изучаемого явления. Отклонение оцениваемой величины от средней арифметической больше, чем на 1 указывает на отклонение изучаемого параметра от нормы.

    4. В медицине правило трех сигм применяется в педиатрии для индивидуальной оценки уровня физического развития детей (метод сигмальных отклонений), для разработки стандартов детской одежды

    5. Среднее квадратическое отклонение необходимо для характеристики степени разнообразия изучаемого признака и вычисления ошибки средней арифметической величины.

    Величина среднего квадра­тического отклонения обычно используется для сравнения колеблемости однотипных рядов. Если сравниваются два ряда с разными признаками (рост и масса тела, средняя длительность лечения в стационаре и больничная летальность и т.д.), то непосредственное сопоставление размеров сигм невозможно, т.к. среднеквадратичес­кое отклонение - именованная величина, выраженная в абсолютных числах. В этих случаях применяют коэффициент вариации (Cv) , представляющий собой относительную величину: процентное отноше­ние среднего квадратического отклонения к средней арифметической.

    Коэффициент вариации вычисляется по формуле:

    Чем выше коэффициент вариации, тем большая изменчивость данно­го ряда. Считают, что коэффициент вариации свыше 30 % свиде­тельствует о качественной неоднородности совокупности.

    "

    Математическое ожидание и дисперсия

    Пусть мы измеряем случайную величину N раз, например, десять раз измеряем скорость ветра и хотим найти среднее значение. Как связано среднее значение с функцией распределения?

    Будем кидать игральный кубик большое количество раз. Количество очков, которое выпадет на кубике при каждом броске, является случайной величиной и может принимать любые натуральные значения от 1 до 6. Среднее арифметическое выпавших очков, подсчитанных за все броски кубика, тоже является случайной величиной, однако при больших N оно стремится ко вполне конкретному числу – математическому ожиданию M x . В данном случае M x = 3,5.

    Каким образом получилась эта величина? Пусть в N испытаниях раз выпало 1 очко, раз – 2 очка и так далее. Тогда При N → ∞ количество исходов, в которых выпало одно очко, Аналогично, Отсюда

    Модель 4.5. Игральные кости

    Предположим теперь, что мы знаем закон распределения случайной величины x , то есть знаем, что случайная величина x может принимать значения x 1 , x 2 , ..., x k с вероятностями p 1 , p 2 , ..., p k .

    Математическое ожидание M x случайной величины x равно:

    Ответ. 2,8.

    Математическое ожидание не всегда является разумной оценкой какой-нибудь случайной величины. Так, для оценки средней заработной платы разумнее использовать понятие медианы, то есть такой величины, что количество людей, получающих меньшую, чем медиана, зарплату и большую, совпадают.

    Медианой случайной величины называют число x 1/2 такое, что p (x < x 1/2) = 1/2.

    Другими словами, вероятность p 1 того, что случайная величина x окажется меньшей x 1/2 , и вероятность p 2 того, что случайная величина x окажется большей x 1/2 , одинаковы и равны 1/2. Медиана определяется однозначно не для всех распределений.

    Вернёмся к случайной величине x , которая может принимать значения x 1 , x 2 , ..., x k с вероятностями p 1 , p 2 , ..., p k .

    Дисперсией случайной величины x называется среднее значение квадрата отклонения случайной величины от её математического ожидания:

    Пример 2

    В условиях предыдущего примера вычислить дисперсию и среднеквадратическое отклонение случайной величины x .

    Ответ. 0,16, 0,4.

    Модель 4.6. Стрельба в мишень

    Пример 3

    Найти распределение вероятности числа очков, выпавших на кубике с первого броска, медиану, математическое ожидание, дисперсию и среднеквадратичное отклонение.

    Выпадение любой грани равновероятно, так что распределение будет выглядеть так:

    Среднеквадратичное отклонение Видно, что отклонение величины от среднего значения очень велико.

    Свойства математического ожидания:

    • Математическое ожидание суммы независимых случайных величин равно сумме их математических ожиданий:

    Пример 4

    Найти математическое ожидание суммы и произведения очков, выпавшей на двух кубиках.

    В примере 3 мы нашли, что для одного кубика M (x ) = 3,5. Значит, для двух кубиков

    Свойства дисперсии:

    • Дисперсия суммы независимых случайных величин равно сумме дисперсий:

    D x + y = D x + D y .

    Пусть за N бросков на кубике выпало y очков. Тогда

    Этот результат верен не только для бросков кубика. Он во многих случаях определяет точность измерения математического ожидания опытным путем. Видно, что при увеличении количества измерений N разброс значений вокруг среднего, то есть среднеквадратичное отклонение, уменьшается пропорционально

    Дисперсия случайной величины связана с математическим ожиданием квадрата этой случайной величины следующим соотношением:

    Найдём математические ожидания обеих частей этого равенства. По определению,

    Математическое же ожидание правой части равенства по свойству математических ожиданий равно

    Среднее квадратическое отклонение

    Среднеквадратическое отклонение равно квадратному корню из дисперсии:
    При определении среднего квадратического отклонения при достаточно большом объеме изучаемой совокупности (n > 30) применяются формулы:

    Полученные из опыта величины неизбежно содержат погрешности, обусловленные самыми разнообразными причинами. Среди них следует различать погрешности систематические и случайные. Систематические ошибки обусловливаются причинами, действующими вполне определенным образом, и могут быть всегда устранены или достаточно точно учтены. Случайные ошибки вызываются весьма большим числом отдельных причин, не поддающихся точному учету и действующих в каждом отдельном измерении различным образом. Эти ошибки невозможно совершенно исключить; учесть же их можно только в среднем, для чего необходимо знать законы, которым подчиняются случайные ошибки.

    Будем обозначать измеряемую величину через А, а случайную ошибку при измерении х. Так как ошибка х может принимать любые значения, то она является непрерывной случайной величиной, которая вполне характеризуется своим законом распределения.

    Наиболее простым и достаточно точно отображающим действительность (в подавляющем большинстве случаев) является так называемый нормальный закон распределения ошибок :

    Этот закон распределения может быть получен из различных теоретических предпосылок, в частности, из требования, чтобы наиболее вероятным значением неизвестной величины, для которой непосредственным измерением получен ряд значений с одинаковой степенью точности, являлось среднее арифметическое этих значений. Величина 2 называется дисперсией данного нормального закона.

    Среднее арифметическое

    Определение дисперсии по опытным данным. Если для какой-либо величины А непосредственным измерением получено n значений a i с одинаковой степенью точности и если ошибки величины А подчинены нормальному закону распределения, то наиболее вероятным значением А будет среднее арифметическое :

    a - среднее арифметическое,

    a i - измеренное значение на i-м шаге.

    Отклонение наблюдаемого значения (для каждого наблюдения) a i величины А от среднего арифметического : a i - a.

    Для определения дисперсии нормального закона распределения ошибок в этом случае пользуются формулой:

    2 - дисперсия,
    a - среднее арифметическое,
    n - число измерений параметра,

    Среднеквадратическое отклонение

    Среднеквадратическое отклонение показывает абсолютное отклонение измеренных значений от среднеарифметического . В соответствии с формулой для меры точности линейной комбинации средняя квадратическая ошибка среднего арифметического определяется по формуле:

    , где


    a - среднее арифметическое,
    n - число измерений параметра,
    a i - измеренное значение на i-м шаге.

    Коэффициент вариации

    Коэффициент вариации характеризует относительную меру отклонения измеренных значений от среднеарифметического :

    , где

    V - коэффициент вариации,
    - среднеквадратическое отклонение,
    a - среднее арифметическое.

    Чем больше значение коэффициента вариации , тем относительно больший разброс и меньшая выравненность исследуемых значений. Если коэффициент вариации меньше 10%, то изменчивость вариационного ряда принято считать незначительной, от 10% до 20% относится к средней, больше 20% и меньше 33% к значительной и если коэффициент вариации превышает 33%, то это говорит о неоднородности информации и необходимости исключения самых больших и самых маленьких значений.

    Среднее линейное отклонение

    Один из показателей размаха и интенсивности вариации - среднее линейное отклонение (средний модуль отклонения) от среднего арифметического. Среднее линейное отклонение рассчитывается по формуле:

    , где

    _
    a - среднее линейное отклонение,
    a - среднее арифметическое,
    n - число измерений параметра,
    a i - измеренное значение на i-м шаге.

    Для проверки соответствия исследуемых значений закону нормального распределения применяют отношение показателя асимметрии к его ошибке и отношение показателя эксцесса к его ошибке.

    Показатель асимметрии

    Показатель асимметрии (A) и его ошибка (m a) рассчитывается по следующим формулам:

    , где

    А - показатель асимметрии,
    - среднеквадратическое отклонение,
    a - среднее арифметическое,
    n - число измерений параметра,
    a i - измеренное значение на i-м шаге.

    Показатель эксцесса

    Показатель эксцесса (E) и его ошибка (m e) рассчитывается по следующим формулам:

    , где

    Для расчетов средней геометрической простой используется формула:

    Геометрическая взвешенная

    Для определения средней геометрической взвешенной применяется формула:

    редние диаметры колес, труб, средние стороны квадратов определяются при помощи средней квадратической.

    Среднеквадратические величины используются для расчета некоторых показателей, например коэффициент вариации, характеризующего ритмичность выпуска продукции. Здесь определяют среднеквадратическое отклонение от планового выпуска продукции за определенный период по следующей формуле:

    Эти величины точно характеризуют изменение экономических показателей по сравнению с их базисной величиной, взятое в его усредненной величине.

    Квадратическая простая

    Средняя квадратическая простая вычисляется по формуле:

    Квадратическая взвешенная

    Средняя квадратическая взвешенная равна:

    22. Абсолютные показатели вариации включают:

    размах вариации

    среднее линейное отклонение

    дисперсию

    среднее квадратическое отклонение

    Размах вариации (r)

    Размах вариации - это разность между максимальным и минимальным значениями признака

    Он показывает пределы, в которых изменяется величина признака в изучаемой совокупности.

    Опыт работы у пяти претендентов на предшествующей работе составляет: 2,3,4,7 и 9 лет. Решение: размах вариации = 9 - 2 = 7 лет.

    Для обобщенной характеристики различий в значениях признака вычисляют средние показатели вариации, основанные на учете отклонений от средней арифметической. За отклонение от средней принимается разность .

    При этом во избежании превращения в нуль суммы отклонений вариантов признака от средней (нулевое свойство средней) приходится либо не учитывать знаки отклонения, то есть брать эту сумму по модулю , либо возводить значения отклонений в квадрат

    Среднее линейное и квадратическое отклонение

    Среднее линейное отклонение - этосредняя арифметическая из абсолютных отклонений отдельных значений признака от средней.

    Среднее линейное отклонение простое:

    Опыт работы у пяти претендентов на предшествующей работе составляет: 2,3,4,7 и 9 лет.

    В нашем примере: лет;

    Ответ: 2,4 года.

    Среднее линейное отклонение взвешенное применяется для сгруппированных данных:

    Среднее линейное отклонение в силу его условности применяется на практике сравнительно редко (в частности, для характеристики выполнения договорных обязательств по равномерности поставки; в анализе качества продукции с учетом технологических особенностей производства).

    Среднее квадратическое отклонение

    Наиболее совершенной характеристикой вариации является среднее квадратическое откложение, которое называют стандартом (или стандартным отклонение). Среднее квадратическое отклонение () равно квадратному корню из среднего квадрата отклонений отдельных значений признака отсредней арифметической:

    Среднее квадратическое отклонение простое:

    Среднее квадратическое отклонение взвешенное применяется для сгруппированных данных:

    Между средним квадратическим и средним линейным отклонениями в условиях нормального распределения имеет место следующее соотношение: ~ 1,25.

    Среднее квадратическое отклонение, являясь основной абсолютной мерой вариации, используется при определении значений ординат кривой нормального распределения, в расчетах, связанных с организацией выборочного наблюдения и установлением точности выборочных характеристик, а также при оценке границ вариации признака в однородной совокупности.