Нормальное распределение p. Стандартное нормальное распределение. Плотность нормального распределения

Во многих задачах, связанных с нормально распределенными случайными величинами, приходится определять вероятность попадания случайной величины , подчиненной нормальному закону с параметрами , на участок от до . Для вычисления этой вероятности воспользуемся общей формулой

где - функция распределения величины .

Найдем функцию распределения случайной величины , распределенной по нормальному закону с параметрами . Плотность распределения величины равна:

Отсюда находим функцию распределения

. (6.3.3)

Сделаем в интеграле (6.3.3) замену переменной

и приведем его к виду:

(6.3.4)

Интеграл (6.3.4) не выражается через элементарные функции, но его можно вычислить через специальную функцию, выражающую определенный интеграл от выражения или (так называемый интеграл вероятностей), для которого составлены таблицы. Существует много разновидностей таких функций, например:

;

и т.д. Какой из этих функций пользоваться – вопрос вкуса. Мы выберем в качестве такой функции

. (6.3.5)

Нетрудно видеть, что эта функция представляет собой не что иное, как функцию распределения для нормально распределенной случайной величины с параметрами .

Условимся называть функцию нормальной функцией распределения. В приложении (табл. 1) приведены таблицы значений функции .

Выразим функцию распределения (6.3.3) величины с параметрами и через нормальную функцию распределения . Очевидно,

Теперь найдем вероятность попадания случайной величины на участок от до . Согласно формуле (6.3.1)

Таким образом, мы выразили вероятность попадания на участок случайной величины , распределенной по нормальному закону с любыми параметрами, через стандартную функцию распределения , соответствующую простейшему нормальному закону с параметрами 0,1. Заметим, что аргументы функции в формуле (6.3.7) имеют очень простой смысл: есть расстояние от правого конца участка до центра рассеивания, выраженное в средних квадратических отклонениях; - такое же расстояние для левого конца участка, причем это расстояние считается положительным, если конец расположен справа от центра рассеивания, и отрицательным, если слева.

Как и всякая функция распределения, функция обладает свойствами:

3. - неубывающая функция.

Кроме того, из симметричности нормального распределения с параметрами относительно начала координат следует, что

Пользуясь этим свойством, собственно говоря, можно было бы ограничить таблицы функции только положительными значениями аргумента, но, чтобы избежать лишней операции (вычитание из единицы), в таблице 1 приложения приводятся значения как для положительных, так и для отрицательных аргументов.

На практике часто встречается задача вычисления вероятности попадания нормально распределенной случайной величины на участок, симметричный относительно центра рассеивания . Рассмотрим такой участок длины (рис. 6.3.1). Вычислим вероятность попадания на этот участок по формуле (6.3.7):

Учитывая свойство (6.3.8) функции и придавая левой части формулы (6.3.9) более компактный вид, получим формулу для вероятности попадания случайной величины, распределенной по нормальному закону на участок, симметричный относительно центра рассеивания:

. (6.3.10)

Решим следующую задачу. Отложим от центра рассеивания последовательные отрезки длиной (рис. 6.3.2) и вычислим вероятность попадания случайной величины в каждый из них. Так как кривая нормального закона симметрична, достаточно отложить такие отрезки только в одну сторону.

По формуле (6.3.7) находим:

(6.3.11)

Как видно из этих данных, вероятности попадания на каждый из следующих отрезков (пятый, шестой и т.д.) с точностью до 0,001 равны нулю.

Округляя вероятности попадания в отрезки до 0,01 (до 1%), получим три числа, которые легко запомнить:

0,34; 0,14; 0,02.

Сумма этих трех значений равна 0,5. Это значит, что для нормально распределенной случайной величины все рассеивания (с точностью до долей процента) укладывается на участке .

Это позволяет, зная среднее квадратическое отклонение и математическое ожидание случайной величины, ориентировочно указать интервал её практически возможных значений. Такой способ оценки диапазона возможных значений случайной величины известен в математической статистике под названием «правило трех сигма». Из правила трех сигма вытекает также ориентировочный способ определения среднего квадратического отклонения случайной величины: берут максимальное практически возможное отклонение от среднего и делят его на три. Разумеется, этот грубый прием может быть рекомендован, только если нет других, более точных способов определения .

Пример 1. Случайная величина , распределенная по нормальному закону, представляет собой ошибку измерения некоторого расстояния. При измерении допускается систематическая ошибка в сторону завышения на 1,2 (м); среднее квадратическое отклонения ошибки измерения равно 0,8 (м). Найти вероятность того, что отклонение измеренного значения от истинного не превзойдет по абсолютной величине 1,6 (м).

Решение. Ошибка измерения есть случайная величина , подчиненная нормальному закону с параметрами и . Нужно найти вероятность попадания этой величины на участок от до . По формуле (6.3.7) имеем:

Пользуясь таблицами функции (приложение, табл. 1), найдем:

; ,

Пример 2. Найти ту же вероятность, что и в предыдущем примере, но при условии, что систематической ошибки нет.

Решение. По формуле (6.3.10), полагая , найдем:

Пример 3. По цели, имеющей вид полосы (автострада), ширина которой равна 20 м, ведется стрельба в направлении, перпендикулярном автостраде. Прицеливание ведется по средней линии автострады. Среднее квадратическое отклонение в направлении стрельбы равно м. Имеется систематическая ошибка в направлении стрельбы: недолет 3 м. Найти вероятность попадания в автостраду при одном выстреле.

Рассмотрим частный случай, когда параметры распределения m = 0 .σ = 1 . Нормальное распределение N(0;1) называется стандартным нормальным распределением. В этом случае плотность распределения

(22)

Кривая распределения, построенная по формуле стандартного нормального распределения имеет колоколообразныи вид, вертикальная ось является осью симметрии, горизонтальная - асимптотой. Максимальное значение ординаты равно

При значениях аргумента х = ± 3 значения функции близки к нулю: при общей площади под кривой распределения, равной единице, в этом диапазоне лежит 99,73%. Заметим, что в диапазоне х = ± 2 лежит 95,44% площади под кривой распределения, а в диапазоне х = ±1 - 68,26%.

Рисунок 3.- Кривая стандартного нормального распределения

При изменении параметра т график сдвигается вправо или влево так, что прямая х= т - ось симметрии

Рисунок 4- Влияние параметра т на вид кривой нормального распределения

При увеличении параметра σ максимум кривой распределения снижается, при уменьшении, а кривая вытягивается вверх, при этом по условию нормировки площадь под кривой распределения остается постоянной (и равной единице)

Рисунок 5 – Влияние параметра σ на вид кривой нормального распределения.

Вновь рассмотрим стандартное нормальное распределение N(0,1). Функция такого распределения иногда называется функцией Лапласа, она имеет специальное обозначение Ф(х).Можно записать уравнение

(23)

Эnа функция табулирована. Например, Ф(2,48) = = 0,9934. График функции показан на рис.

Рисунок 6 - График функции стандартного нормального распределения

Из симметрии графика вытекает соотношение

Ф(-х) = 1-Ф(х)

Табулированы и квантили нормального распределения

Квантиль нормального распределения порядка р - это число u p , для которого Ф(u p) = p .Например,=1,645

Из симметрии графика функции стандартного нормального распределения и формулы вытекает полезное соотношение для квантилей:

u 1- p = u p

Можно установить связь между функцией распределения F(x) для распределения N(m,σ) и функцией стандартного нормального распределения:

(24)

Вероятность попадания нормально распределенной случайной величины в интервал от x 1 до x 2 определяется по формуле

Часто в расчетах надо найти вероятность того, что случайная величина Х не слишком сильно отклонится от своего математического ожидания m:

Правило «трех сигм»

Пусть, например ε = 3σ. Используя таблицы функции стандартного нормального распределения найдем:

поэтому вероятность того, что случайная величина отклонится от математического ожидания больше, чем на Зσ, ничтожно мала:



Такое событие практически невозможно. В связи с этим на практике часто используется так называемое правило «трех сигм» : отклонение нормально распределенной случайной величины от ее математического ожидания, как правило, не превышает утроенного стандартного отклонения.

Рассмотрим применение свойств нормального распределения

Пример.1 На станке-автомате изготавливаются валики номинальным диаметром 10 мм. Стандартное отклонение, характеризующее точность станка, составляет σ = 0,03 мм. Сколько в среднем валиков из ста удовлетворяют стандарту, если для этого требуется, чтобы диаметр отклонялся от номинального не более чем на 0,05 мм?

Определение 1

Случайная величина $X$ имеет нормальное распределение (распределение Гаусса), если плотность её распределения определяется формулой:

\[\varphi \left(x\right)=\frac{1}{\sqrt{2\pi }\sigma }e^{\frac{-{(x-a)}^2}{2{\sigma }^2}}\]

Здесь $aϵR$ -- математическое ожидание, а $\sigma >0$ -- среднее квадратическое отклонение.

Плотность нормального распределения.

Покажем, что эта функция действительно является плотностью распределения. Для этого проверим следующее условие:

Рассмотрим несобственный интеграл $\int\limits^{+\infty }_{-\infty }{\frac{1}{\sqrt{2\pi }\sigma }e^{\frac{-{(x-a)}^2}{2{\sigma }^2}}dx}$.

Сделаем замену: $\frac{x-a}{\sigma }=t,\ x=\sigma t+a,\ dx=\sigma dt$.

Так как $f\left(t\right)=e^{\frac{-t^2}{2}}$ четная функция, то

Равенство выполняется, значит, функция $\varphi \left(x\right)=\frac{1}{\sqrt{2\pi }\sigma }e^{\frac{-{(x-a)}^2}{2{\sigma }^2}}$ действительно является плотностью распределения некоторой случайной величины.

Рассмотрим некоторые простейшие свойства функции плотности вероятности нормального распределения $\varphi \left(x\right)$:

  1. График функции плотности вероятности нормального распределения симметричен относительно прямой $x=a$.
  2. Функция $\varphi \left(x\right)$ достигает максимума при $x=a$, при этом $\varphi \left(a\right)=\frac{1}{\sqrt{2\pi }\sigma }e^{\frac{-{(a-a)}^2}{2{\sigma }^2}}=\frac{1}{\sqrt{2\pi }\sigma }$
  3. Функция $\varphi \left(x\right)$ убывает, при $x>a$, и возрастает, при $x
  4. Функция $\varphi \left(x\right)$ имеет точки перегиба при $x=a+\sigma $ и $x=a-\sigma $.
  5. Функция $\varphi \left(x\right)$ асимптотически приближается к оси $Ox$ при $x\to \pm \infty $.
  6. Схематический график выглядит следующим образом (рис. 1).

Рисунок 1. Рис. 1. График плотности нормального распределения

Заметим, что, если $a=0$, то график функции симметричен относительно оси $Oy$. Следовательно, функция $\varphi \left(x\right)$ четна.

Функция нормального распределения вероятности.

Для нахождения функции распределения вероятности при нормальном распределении воспользуемся следующей формулой:

Следовательно,

Определение 2

Функция $F(x)$ называется стандартным нормальным распределением, если $a=0,\ \sigma =1$, то есть:

Здесь $Ф\left(x\right)=\frac{1}{\sqrt{2\pi }}\int\limits^x_0{e^{\frac{-t^2}{2}}dt}$ - функция Лапласса.

Определение 3

Функция $Ф\left(x\right)=\frac{1}{\sqrt{2\pi }}\int\limits^x_0{e^{\frac{-t^2}{2}}dt}$ называется интегралом вероятности.

Числовые характеристики нормального распределения.

Математическое ожидание: $M\left(X\right)=a$.

Дисперсия : $D\left(X\right)={\sigma }^2$.

Среднее квадратическое распределение: $\sigma \left(X\right)=\sigma $.

Пример 1

Пример решения задачи на понятие нормального распределения.

Задача 1 : Длина пути $X$ представляет собой случайную непрерывную величину. $X$ распределена по нормальному закону распределения среднее значение которого равно $4$ километра, а среднее квадратическое отклонение равно $100$ метров.

  1. Найти функцию плотности распределения $X$.
  2. Построить схематически график плотности распределения.
  3. Найти функцию распределения случайной величины $X$.
  4. Найти дисперсию.
  1. Для начала представим все величины в одном измерении: 100м=0,1км

Из определения 1, получим:

\[\varphi \left(x\right)=\frac{1}{0,1\sqrt{2\pi }}e^{\frac{-{(x-4)}^2}{0,02}}\]

(так как $a=4\ км,\ \sigma =0,1\ км)$

  1. Используя свойства функции плотности распределения, имеем, что график функции $\varphi \left(x\right)$ симметричен относительно прямой $x=4$.

Максимум функция достигает в точке $\left(a,\frac{1}{\sqrt{2\pi }\sigma }\right)=(4,\ \frac{1}{0,1\sqrt{2\pi }})$

Схематический график имеет вид:

Рисунок 2.

  1. По определению функции распределения $F\left(x\right)=\frac{1}{\sqrt{2\pi }\sigma }\int\limits^x_{-\infty }{e^{\frac{-{(t-a)}^2}{2{\sigma }^2}}dt}$, имеем:
\
  1. $D\left(X\right)={\sigma }^2=0,01$.

Будут и задачи для самостоятельного решения, к которым можно посмотреть ответы.

Нормальное распределение: теоретические основы

Примерами случайных величин, распределённых по нормальному закону, являются рост человека, масса вылавливаемой рыбы одного вида . Нормальность распределения означает следующее : существуют значения роста человека, массы рыбы одного вида, которые на интуитивном уровне воспринимаются как "нормальные" (а по сути - усреднённые), и они-то в достаточно большой выборке встречаются гораздо чаще, чем отличающиеся в бОльшую или меньшую сторону.

Нормальное распределение вероятностей непрерывной случайной величины (иногда - распределение Гаусса) можно назвать колоколообразным из-за того, что симметричная относительно среднего функция плотности этого распределения очень похожа на разрез колокола (красная кривая на рисунке выше).

Вероятность встретить в выборке те или иные значение равна площади фигуры под кривой и в случае нормального распределения мы видим, что под верхом "колокола", которому соответствуют значения, стремящиеся к среднему, площадь, а значит, вероятность, больше, чем под краями. Таким образом, получаем то же, что уже сказано: вероятность встретить человека "нормального" роста, поймать рыбу "нормальной" массы выше, чем для значений, отличающихся в бОльшую или меньшую сторону. В очень многих случаях практики ошибки измерения распределяются по закону, близкому к нормальному.

Остановимся ещё раз на рисунке в начале урока, на котором представлена функция плотности нормального распределения. График этой функции получен при рассчёте некоторой выборки данных в пакете программных средств STATISTICA . На ней столбцы гистограммы представляют собой интервалы значений выборки, распределение которых близко (или, как принято говорить в статистике, незначимо отличаются от) к собственно графику функции плотности нормального распределения, который представляет собой кривую красного цвета. На графике видно, что эта кривая действительно колоколообразная.

Нормальное распределение во многом ценно благодаря тому, что зная только математическое ожидание непрерывной случайной величины и стандартное отклонение, можно вычислить любую вероятность, связанную с этой величиной.

Нормальное распределение имеет ещё и то преимущество, что один из наиболее простых в использовании статистических критериев, используемых для проверки статистических гипотез - критерий Стьюдента - может быть использован только в том случае, когда данные выборки подчиняются нормальному закону распределения.

Функцию плотности нормального распределения непрерывной случайной величины можно найти по формуле:

,

где x - значение изменяющейся величины, - среднее значение, - стандартное отклонение, e =2,71828... - основание натурального логарифма, =3,1416...

Свойства функции плотности нормального распределения

Изменения среднего значения перемещают кривую функции плотности нормального распределения в направлении оси Ox . Если возрастает, кривая перемещается вправо, если уменьшается, то влево.

Если меняется стандартное отклонение, то меняется высота вершины кривой. При увеличении стандартного отклонения вершина кривой находится выше, при уменьшении - ниже.

Вероятность попадания значения нормально распределённой случайной величины в заданный интервал

Уже в этом параграфе начнём решать практические задачи, смысл которых обозначен в заголовке. Разберём, какие возможности для решения задач предоставляет теория. Отправное понятие для вычисления вероятности попадания нормально распределённой случайной величины в заданный интервал - интегральная функция нормального распределения.

Интегральная функция нормального распределения :

.

Однако проблематично получить таблицы для каждой возможной комбинации среднего и стандартного отклонения. Поэтому одним из простых способов вычисления вероятности попадания нормально распределённой случайной величины в заданный интервал является использование таблиц вероятностей для стандартизированного нормального распределения.

Стандартизованным или нормированным называется нормальное распределение , среднее значение которого , а стандартное отклонение .

Функция плотности стандартизованного нормального распределения :

.

Интегральная функция стандартизованного нормального распределения :

.

На рисунке ниже представлена интегральная функция стандартизованного нормального распределения, график которой получен при рассчёте некоторой выборки данных в пакете программных средств STATISTICA . Собственно график представляет собой кривую красного цвета, а значения выборки приближаются к нему.


Для увеличения рисунка можно щёлкнуть по нему левой кнопкой мыши.

Стандартизация случайной величины означает переход от первоначальных единиц, используемых в задании, к стандартизованным единицам. Стандартизация выполняется по формуле

На практике все возможные значения случайной величины часто не известны, поэтому значения среднего и стандартного отклонения точно определить нельзя. Их заменяют средним арифметическим наблюдений и стандартным отклонением s . Величина z выражает отклонения значений случайной величины от среднего арифметического при измерении стандартных отклонений.

Открытый интервал

Таблица вероятностей для стандартизированного нормального распределения, которая есть практически в любой книге по статистике, содержит вероятности того, что имеющая стандартное нормальное распределение случайная величина Z примет значение меньше некоторого числа z . То есть попадёт в открытый интервал от минус бесконечности до z . Например, вероятность того, что величина Z меньше 1,5, равна 0,93319.

Пример 1. Предприятие производит детали, срок службы которых нормально распределён со средним значением 1000 и стандартным отклонением 200 часов.

Для случайно отобранной детали вычислить вероятность того, что её срок службы будет не менее 900 часов.

Решение. Введём первое обозначение:

Искомая вероятность.

Значения случайной величины находятся в открытом интервале. Но мы умеем вычислять вероятность того, что случайная величина примет значение, меньшее заданного, а по условию задачи требуется найти равное или большее заданного. Это другая часть пространства под кривой плотности нормального распределения (колокола). Поэтому, чтобы найти искомую вероятность, нужно из единицы вычесть упомянутую вероятность того, что случайная величина примет значение, меньше заданного 900:

Теперь случайную величину нужно стандартизировать.

Продолжаем вводить обозначения:

z = (X ≤ 900) ;

x = 900 - заданное значение случайной величины;

μ = 1000 - среднее значение;

σ = 200 - стандартное отклонение.

По этим данным условия задачи получаем:

.

По таблицам стандартизированной случайной величине (границе интервала) z = −0,5 соответствует вероятность 0,30854. Вычтем ее из единицы и получим то, что требуется в условии задачи:

Итак, вероятность того, что срок службы детали будет не менее 900 часов, составляет 69%.

Эту вероятность можно получить, используя функцию MS Excel НОРМ.РАСП (значение интегральной величины - 1):

P (X ≥900) = 1 - P (X ≤900) = 1 - НОРМ.РАСП(900; 1000; 200; 1) = 1 - 0,3085 = 0,6915.

О расчётах в MS Excel - в одном из последующих параграфах этого урока.

Пример 2. В некотором городе среднегодовой доход семьи является нормально распределённой случайной величиной со средним значением 300000 и стандартным отклонением 50000. Известно, что доходы 40 % семей меньше величины A . Найти величину A .

Решение. В этой задаче 40 % - ни что иное, как вероятность того, что случайная величина примет значение из открытого интервала, меньшее определённого значения, обозначенного буквой A .

Чтобы найти величину A , сначала составим интегральную функцию:

По условию задачи

μ = 300000 - среднее значение;

σ = 50000 - стандартное отклонение;

x = A - величина, которую нужно найти.

Составляем равенство

.

По статистическим таблицам находим, что вероятность 0,40 соответствует значению границы интервала z = −0,25 .

Поэтому составляем равенство

и находим его решение:

A = 287300 .

Ответ: доходы 40 % семей менее 287300.

Закрытый интервал

Во многих задачах требуется найти вероятность того, что нормально распределённая случайная величина примет значение в интервале от z 1 до z 2 . То есть попадёт в закрытый интервал. Для решения таких задач необходимо найти в таблице вероятности, соответствующие границам интервала, а затем найти разность этих вероятностей. При этом требуется вычитать меньшее значение из большего. Примеры на решения этих распространённых задач - следующие, причём решить их предлагается самостоятельно, а затем можно посмотреть правильные решения и ответы.

Пример 3. Прибыль предприятия за некоторый период - случайная величина, подчинённая нормальному закону распределения со средним значением 0,5 млн. у.е. и стандартным отклонением 0,354. Определить с точностью до двух знаков после запятой вероятность того, что прибыль предприятия составит от 0,4 до 0,6 у.е.

Пример 4. Длина изготавливаемой детали представляет собой случайную величину, распределённую по нормальному закону с параметрами μ =10 и σ =0,071 . Найти с точностью до двух знаков после запятой вероятность брака, если допустимые размеры детали должны быть 10±0,05 .

Подсказка: в этой задаче помимо нахождения вероятности попадания случайной величины в закрытый интервал (вероятность получения небракованной детали) требуется выполнить ещё одно действие.

позволяет определить вероятность того, что стандартизованное значение Z не меньше -z и не больше +z , где z - произвольно выбранное значение стандартизованной случайной величины.

Приближенный метод проверки нормальности распределения

Приближенный метод проверки нормальности распределения значений выборки основан на следующем свойстве нормального распределения: коэффициент асимметрии β 1 и коэффициент эксцесса β 2 равны нулю .

Коэффициент асимметрии β 1 численно характеризует симметрию эмпирического распределения относительно среднего. Если коэффициент асимметрии равен нулю, то среднее арифметрического значение, медиана и мода равны: и кривая плотности распределения симметрична относительно среднего. Если коэффициент асимметрии меньше нуля (β 1 < 0 ), то среднее арифметическое меньше медианы, а медиана, в свою очередь, меньше моды () и кривая сдвинута вправо (по сравнению с нормальным распределением) . Если коэффициент асимметрии больше нуля (β 1 > 0 ), то среднее арифметическое больше медианы, а медиана, в свою очередь, больше моды () и кривая сдвинута влево (по сравнению с нормальным распределением) .

Коэффициент эксцесса β 2 характеризует концентрацию эмпирического распределения вокруг арифметического среднего в направлении оси Oy и степень островершинности кривой плотности распределения. Если коэффициент эксцесса больше нуля, то кривая более вытянута (по сравнению с нормальным распределением) вдоль оси Oy (график более островершинный). Если коэффициент эксцесса меньше нуля, то кривая более сплющена (по сравнению с нормальным распределением) вдоль оси Oy (график более туповершинный).

Коэффициент асимметрии можно вычислить с помощью функции MS Excel СКОС. Если вы проверяете один массив данных, то требуется ввести диапазон данных в одно окошко "Число".


Коэффициент эксцесса можно вычислить с помощью функции MS Excel ЭКСЦЕСС. При проверке одного массива данных также достаточно ввести диапазон данных в одно окошко "Число".


Итак, как мы уже знаем, при нормальном распределении коэффициенты асимметрии и эксцесса равны нулю. Но что, если мы получили коэффициенты асимметрии, равные -0,14, 0,22, 0,43, а коэффициенты эксцесса, равные 0,17, -0,31, 0,55? Вопрос вполне справедливый, так как практически мы имеем дело лишь с приближенными, выборочными значениями асимметрии и эксцесса, которые подвержены некоторому неизбежному, неконтролируемому разбросу. Поэтому нельзя требовать строгого равенства этих коэффициентов нулю, они должны лишь быть достаточно близкими к нулю. Но что значит - достаточно?

Требуется сравнить полученные эмпирические значения с допустимыми значениями. Для этого нужно проверить следующие неравенства (сравнить значения коэффициентов по модулю с критическими значениями - границами области проверки гипотезы).

Для коэффициента асимметрии β 1 .

В теории вероятностей рассматривается достаточно большое количество разнообразных законов распределения. Для решения задач, связанных с построением контрольных карт, представляют интерес лишь некоторые из них. Важнейшим из них является нормальный закон распределения , который применяется для построения контрольных карт, используемых при контроле по количественному признаку , т.е. когда мы имеем дело с непрерывной случайной величиной. Нормальный закон распределения занимает среди других законов распределения особое положение. Это объясняется тем, что, во-первых, наиболее часто встречается на практике, и, во-вторых, он является предельным законом, к которому приближаются другие законы распределения при весьма часто встречающихся типичных условиях. Что касается второго обстоятельства, то в теории вероятностей доказано, что сумма достаточно большого числа независимых (или слабо зависимых) случайных величин, подчиненных каким угодно законам распределения (при соблюдении некоторых весьма нежестких ограничений), приближенно подчиняется нормальному закону, и это выполняется тем точнее, чем большее количество случайных величин суммируется. Большинство встречающихся на практике случайных величин, таких, например, как ошибки измерений, могут быть представлены как сумма весьма большего числа сравнительно малых слагаемых - элементарных ошибок, каждая из которых вызвана действием отдельной причины, независящей от остальных. Нормальный закон проявляется в тех случаях, когда случайная переменная Х является результатом действия большого числа различных факторов. Каждый фактор в отдельности на величину Х влияет незначительно, и нельзя указать, какой именно влияет в большей степени, чем остальные.

Нормальное распределение (распределение Лапласа–Гаусса ) – распределение вероятностей непрерывной случайной величины Х такое, что плотность распределения вероятностей при - ¥ <х< + ¥ принимает действительное значение:

Ехр (3)

То есть, нормальное распределение характеризуется двумя параметрами m и s, где m - математическое ожидание; s- стандартное отклонение нормального распределения.

Величина s 2 – это дисперсия нормального распределения.

Математическое ожидание m характеризует положение центра распределения, а стандартное отклонение s (СКО) является характеристикой рассеивания (рис. 3).

f(x) f(x)


Рисунок 3 – Функции плотности нормального распределения с:

а) разными математическими ожиданиями m; б) разными СКО s .

Таким образом, значением μ определяется положением кривой распределения на оси абсцисс. Размерность μ - та же, что и размерность случайной величины X . С ростом математического ожидания mобе функции сдвигается параллельно вправо. С убывающей дисперсией s 2 плотность все больше концентрируется вокруг m, в то время как функция распределения становится все более крутой.

Значением σ определяется форма кривой распределения. Поскольку площадь под кривой распределения должна всегда оставаться равной единице, то при увеличении σ кривая распределения становится более плоской. На рис. 3.1 показаны три кривые при разных σ: σ1 = 0,5; σ2 = 1,0; σ3 = 2,0.

Рисунок 3.1 – Функции плотности нормального распределения с разными СКО s .

Функция распределения (интегральная функция) имеет вид (рис. 4):

(4)

Рисунок 4 – Интегральная (а) и дифференциальная (б) функции нормального распределения

Особенно важно то линейное преобразование нормально распределенной случайной переменной Х , после которого получается случайная переменная Z с математическим ожиданием 0 и дисперсией 1. Такое преобразование называется нормированием:

Его можно провести для каждой случайной переменной. Нормирование позволяет все возможные варианты нормального распределения свести к одному случаю: m = 0, s = 1.

Нормальное распределение с m = 0, s = 1 называется нормированным нормальным распределением (стандартизованным) .

Стандартное нормальное распределение (стандартное распределение Лапласа–Гаусса или нормированное нормальное распределение) – это распределение вероятностей стандартизованной нормальной случайной величины Z , плотность распределения которой равна:

при - ¥ <z < + ¥

Значения функции Ф(z) определяется по формуле:

(7)

Значения функции Ф(z) и плотности ф(z) нормированного нормального распределения рассчитаны и сведены в таблицы (табулированы). Таблица составлена только для положительных значений z поэтому:

Ф (z) = 1 Ф (z) (8)

С помощью этих таблиц можно определить не только значения функции и плотности нормированного нормального распределения для заданного z , но и значения функции общего нормального распределения, так как:

; (9)

. 10)

Во многих задачах, связанных с нормально распределенными случайными величинами, приходится определять вероятность попадания случайной величины Х , подчиненной нормальному закону с параметрами m и s, на определенный участок. Таким участком может быть, например, поле допуска на параметр от верхнего значения U до нижнего L .

Вероятность попадания в интервал от х 1 до х 2 можно определить по формуле:

Таким образом, вероятность попадания случайной величины (значение параметра) Х в поле допуска определяется формулой

Можно найти вероятность того, что случайная переменная Х окажется в пределах μ k s. Полученные значения для k =1,2 и 3 следующие (также смотрим рис. 5):

Таким образом, если какое-либо значение появляется за пределами трехсигмового участка, в котором находятся 99,73% всех возможных значений, а вероятность появления такого события очень мала (1:270), следует считать, что рассматриваемое значение оказалось слишком маленьким или слишком большим не из-за случайного варьирования, а из-за существенной помехи в самом процессе, способной вызывать изменения в характере распределения.

Участок, лежащий внутри трехсигмовых границ, называют также областью статистического допуска соответствующей машины или процесса.