Множество всех возможных значений случайной величины называется. Случайная величина

СЛУЧАЙНЫЕ ВЕЛИЧИНЫ

Одним из важнейших понятий теории вероятности (наряду со случайным событием и вероятностью) является понятие случайной величины.

Определение. Под случайной величиной понимаю величину, которая в результате опыта принимает то или иное значение, причем неизвестно заранее, какое именно.

Cлучайные величины (сокращенно с.в.) обозначаются прописными латинскими буквами X, Y, Z ,… (или строчными греческими буквами x (кси), h(эта), q (тэта), y(пси) и т.д.), а их возможные значения – соответствующими строчными буквами х , у , z .

Примерами с.в. могут служить: 1) число родившихся мальчиков среди ста новорожденных есть случайная величина, которая имеет следующие возможные значения: 0, 1, 2, ..., 100;

2) расстояние, которое пролетит снаряд при выстреле из орудия, есть случайная величина. Действительно, расстояние зависит не только от установки прицела, но и от многих других причин (силы и направления ветра, температуры и т.д.), которые не могут быть полностью учтены. Возможные значения этой величины принадлежат некоторому промежутку (а , b ).

3) Х – число очков, появляющихся при бросании игральной кости;

4) Y – число выстрелов до первого попадания в цель;

5) Z – время безотказной работы прибора и т.п. (рост человека, курс доллара, количество бракованных деталей в партии, температура воздуха, выигрыши игрока, координата точки при случайном выборе ее на , прибыль фирмы, …).

В первом примере случайная величина X могла принять одно из следующих возможных значений: 0, 1, 2, . . ., 100. Эти значения отделены одно от другого промежутками, в которых нет возможных значений X . Таким образом, в этом примере случайная величина принимает отдельные, изолированные возможные значения. Во втором примере случайная величина могла принять любое из значений промежутка (а , b ). Здесь нельзя отделить одно возможное значение от другого промежутком, не содержащим возможных значений случайной величины.

Уже из сказанного можно заключить о целесообразности различать случайные величины, принимающие лишь отдельные, изолированные значения, и случайные величины, возможные значения которых сплошь заполняют некоторый промежуток.

Определение. Дискретной (прерывной) называют случайную величину (сокращено д.с.в.), которая принимает отдельные, счетные возможные значения с определенными вероятностями. Число возможных значений дискретной случайной величины может быть конечным или бесконечным.

Определение. Если же множество возможных значений с.в. несчетно, то такая величина называется непрерывной (сокращенно н.с.в.). Непрерывная случайная величина может принимать все значения из некоторого конечного или бесконечного промежутка. Очевидно, число возможных значений непрерывной случайной величины бесконечно.



Случайные величины X и Y (примеры 3 и 4) являются дискретными. С.в. Z (пример 5) является непрерывной: ее возможные значения принадлежат промежутку .

Определение. Математическим ожиданием непрерывной случайной величины Х, возможные значения которой принадлежат отрезку , называется определенный интеграл

Если возможные значения случайной величины рассматриваются на всей числовой оси, то математическое ожидание находится по формуле:

При этом, конечно, предполагается, что несобственный интеграл сходится.

Определение. Дисперсией непрерывной случайной величины называется математическое ожидание квадрата ее отклонения.

По аналогии с дисперсией дискретной случайной величины, для практического вычисления дисперсии используется формула:

Определение. Средним квадратичным отклонением Называется квадратный корень из дисперсии.

Определение. Модой М0 дискретной случайной величины называется ее наиболее вероятное значение. Для непрерывной случайной величины мода – такое значение случайной величины, при которой плотность распределения имеет максимум.

Если многоугольник распределения для дискретной случайной величины или кривая распределения для непрерывной случайной величины имеет два или несколько максимумов, то такое распределение называется Двухмодальным или Многомодальным .

Если распределение имеет минимум, но не имеет максимума, то оно называется Антимодальным .

Определение. Медианой MD случайной величины Х называется такое ее значение, относительно которого равновероятно получение большего или меньшего значения случайной величины.

Геометрически медиана – абсцисса точки, в которой площадь, ограниченная кривой распределения делится пополам.

Отметим, что если распределение одномодальное, то мода и медиана совпадают с математическим ожиданием.

Определение. Начальным моментом Порядка K Случайной величины Х называется математическое ожидание величины ХK .

Для дискретной случайной величины: .

.

Начальный момент первого порядка равен математическому ожиданию.

Определение. Центральным моментом Порядка K случайной величины Х называется математическое ожидание величины

Для дискретной случайной величины: .

Для непрерывной случайной величины: .

Центральный момент первого порядка всегда равен нулю, а центральный момент второго порядка равен дисперсии. Центральный момент третьего порядка характеризует асимметрию распределения.

Определение. Отношение центрального момента третьего порядка к среднему квадратическому отклонению в третьей степени называется Коэффициентом асимметрии .

Определение. Для характеристики островершинности и плосковершинности распределения используется величина, называемая Эксцессом .

Кроме рассмотренных величин используются также так называемые абсолютные моменты:

Абсолютный начальный момент: .

Абсолютный централь Ный момент: .

Абсолютный центральный момент первого порядка называется Средним арифметическим отклонением .

Пример. Для рассмо Ренного выше примера определить математическое ожидание и дисперсию случайной величины Х.

Пример. В урне 6 белых и 4 черных шара. Из нее пять раз подряд извлекают шар, причем каждый раз вынутый шар возвращают обратно и шары перемешивают. Приняв за случайную величину Х число извлеченных белых шаров, составить закон распределения этой величины, определить ее математическое ожидание и дисперсию.

Т. к. шары в каждом опыте возвращаются обратно и перемешиваются, то испытания можно считать независимыми (результат предыдущего опыта не влияет на вероятность появления или непоявления события в другом опыте).

Таким образом, вероятность появления белого шара в каждом опыте постоянна и равна

Таким образом, в результате пяти последовательных испытаний белый шар может не появиться вовсе, появиться один раз, два, три, четыре или пять раз.

Для составления закона распределения надо найти вероятности каждого из этих событий.

1) Белый шар не появился вовсе:

2) Белый шар появился один раз:

3) Белый шар появиться два раза: .

4) Белый шар появиться три раза:

Дискретная случайная величина и закон ее распределения

Наряду с понятием случайного события в теории вероятности используется и более удобное понятие случайной величины .

Определение. Случайной величиной называется величина, принимающая в результате опыта одно из своих возможных значений, причем заранее неизвестно, какое именно.

Будем обозначать случайные величины заглавными буквами латинского алфавита (Х, Y, Z,… ), а их возможные значения – соответствующими малыми буквами (x i , y i ,… ).

Примеры: число очков, выпавших при броске игральной кости; число появлений герба при 10 бросках монеты; число выстрелов до первого попадания в цель; расстояние от центра мишени до пробоины при попадании.

Можно заметить, что множество возможных значений для перечисленных случайных величин имеет разный вид: для первых двух величин оно конечно (соответственно 6 и 11 значений), для третьей величины множество значений бесконечно и представляет собой множество натуральных чисел, а для четвертой – все точки отрезка, длина которого равна радиусу мишени. Таким образом, для первых трех величин получаем множество значений из отдельных (дискретных), изолированных друг от друга значений, а для четвертой оно представляет собой непрерывную область. По этому показателю случайные величины подразделяются на две группы: дискретные и непрерывные.

Определение. дискретной , если она принимает отдельные, изолированные возможные значения с определенными вероятностями. Число возможных значений дискретной случайной величины может быть конечным или бесконечным.

Определение. Случайная величина называется непрерывной , если множество ее возможных значений целиком заполняет некоторый конечный или бесконечный промежуток. Число возможных значений непрерывной случайной величины бесконечно.

Для задания дискретной случайной величины нужно знать ее возможные значения и вероятности, с которыми принимаются эти значения. Соответствие между ними называется законом распределения случайной величины. Он может иметь вид таблицы, формулы или графика.

Таблица, в которой перечислены возможные значения дискретной случайной величины и соответствующие им вероятности, называется рядом распределения :

x i x 1 x 2 x n возможные значения
p i p 1 p 2 p n вероятность возможных значений

Заметим, что событие, заключающееся в том, что случайная величина примет одно из своих возможных значений, является достоверным, поэтому или

Задача. Монету бросают 5 раз. Случайная величина X – количество выпадения герба. Составить ряд распределения случайной величины Х.



Решение. Очевидно, что Х может принимать 5 значений: 0, 1, 2, 3, 4, 5, то есть X = 0, 1, 2, 3, 4, 5. По условию , . Вычислим вероятность каждого значения по формуле Бернулли: .

Герб не выпадет ни разу (k = 0) : .

Или .

Герб выпадет один раз (k = 1) :
.

Герб выпадет два раза (k = 2) :

Герб выпадет три раза (k = 3) :

Герб выпадет четыре раза (k = 4) :

Герб выпадет пять раз (k = 5) :

Следовательно, ряд распределения имеет вид:

биномиальные вероятности

При этом сумма вероятностей равна единице:

Графически закон распределения дискретной случайной величины можно представить в виде многоугольника распределения – ломаной, соединяющей точки плоскости с координатами (x i , p i ). То есть по оси абсцисс откладываются возможные значения случайной величины, а по оси ординат – вероятности этих значений. Для наглядности полученные точки соединяются отрезками прямых. Многоугольник распределения, так же как и ряд распределения, полностью характеризует случайную величину и является одной из форм закона распределения.

Случайные величины.

В математике величина – это общее название различных количественных характеристик предметов и явлений. Длина, площадь, температура, давление и т. д. – примеры различных величин.

Величина, которая принимает различные числовые значения под влия­нием случайных обстоятельств, называется случайной величиной . Примеры случайных величин: 1) число больных, ожидающих приема у врача, 2) точные размеры внутренних органов людей и т. д.

Различают дискретные и непрерывные случайные величины.

Случайная величина называется дискретной , если она принимает только определенные отделенные друг от друга значения, которые можно установить и перечислить.

Примеры :

1) число студентов в аудитории – может быть только целым положительным числом:

0,1,2,3,4….. 20…..

2) цифра, которая появляется на верхней грани при бросании игральной кости – может принимать лишь целые значения от 1 до 6.

3) относительная частота попадания в цель при 10 выстрелах - ее значения:

0; 0,1; 0,2; 0,3 ….. 1

4) число событий, происходящих за одинаковые промежутки времени: частота пульса, число вызовов скорой помощи за час, количество операций в месяц с летальным исходом и т. д.

Случайная величина называется непрерывной , если она может принимать любые значения внутри некоторого интервала, который иногда имеет резко выраженные границы, а есди они не известны, то считают, что значения случайной величины Х лежат в интервале (-¥; ¥).. К непрерывным случайным величинам относятся, например, температура, давление, вес и рост людей, размеры форменных элементов крови, рН крови и т. п.


Понятие случайной величины играет определяющую роль в современной теории вероятностей, разработавшей специальные приемы перехода от случайных событий к случайным величинам.

Если случайная величина зависит от времени, то можно говорить о случайном процессе.

3.1. Закон распределения дискретной случайной величины

Чтобы дать полную характеристику дискретной случайной величины необходимо указать все ее возможные значения и их вероятности.

Соответствие между возможными значениями дискретной случайной величины и их вероятностями называется законом распределения этой величины .

Обозначим возможные значения случайной величины Х через хi, а соответствующие им вероятности через рi* . Тогда закон распределения дискретной случайной величины можно задать тремя способами: в виде таблицы, графика или формулы.

1. В таблице , которая называется рядом распределения, перечисляются все возможные значения дискретной случайной величины Х и соответствующие этим значениям вероятности Р(Х):

Таблица 3.1.

Х

При этом сумма всех вероятностей рi должна быть равна единице (условие нормировки ):

рi = p1 + p2 +...+pn=

2. Графически – в виде ломаной линии, которую принято называть многоугольником распределения (рис.3.1). Здесь по горизонтальной оси откладывают все возможные значения случайной величины Хi, а по вертикальной оси – соответствующие им вероятности рi.

3. Аналитически - в виде формулы: Например, если вероятность попадания в цель при одном выстреле равна р, то вероятность промаха при одном выстреле q = 1 – р, а.вероятность поражения цели 1 раз при n выстрелах дается формулой: Р(n) = qn-1×p,

3.2. Закон распределения непрерывной случайной величины. Плотность распределения вероятности.

Для непрерывных случайных величин невозможно применить закон распределения в формах, приведенных выше, т. к. непрерывная величина имеет бесчисленное («несчетное») множество возможных значений, сплошь заполняющих некоторый интервал. Поэтому составить таблицу, в которой были бы перечислены все ее возможные значения, или построить многоугольник распределения нельзя. Кроме того, вероятность какого-либо ее конкретного значения очень мала (близка к 0). Вместе с тем, различные области (интервалы) возможных значений непрерывной случайной величины обычно не являются одинаково вероятными. Таким образом, и здесь есть некий закон распределения, хотя и не в прежнем смысле.

Рассмотрим непрерывную случайную величину Х, возможные значения которой сплошь заполняют некоторый интервал (а, b)*. Закон распределения вероятностей такой величины должен позволить найти вероятность попадания ее значения в любой заданный интервал (х1, х2), лежащий внутри (а, b*) (рис.3.2.)

Эту вероятность обозначают Р(х1 <Х< х2), или Р(х1 £ Х £ х2).

Рассмотрим сначала очень малый интервал значений от х до (х + Dх) (см. рис.3.2.) Малая вероятность dР того, что случайная величина Х примет какое-то значение из этого малого интервала (х, х + Dх), будет пропорциональной величине этого интервала Dх: dР ~ Dх, или, вводя коэффициент пропорциональности f, который сам может зависеть от х, получаем:

dР = f(х) × Dх. (3.2)


Введенная нами здесь функция f(х) называется плотностью распределения вероятностей случайной величины Х или, короче, плотностью вероятности (плотностью распределения). Уравнение (3.2) можно рассматривать как дифференциальное уравнение и тогда вероятность попадания вели. чины Х в интервал (х1, х2) равна:

Р (х1< Х < х2) = f(х) dх. (3.3)

Графически эта вероятность Р (х1< Х < х2) равна площади криволинейной трапеции, ограниченной осью абсцисс, кривой f(х) и прямыми Х = х1 и Х = х2 (см. Рис.3.3), что следует из геометрического смысла определенного интеграла (3.3). Кривая f(х) при этом называется кривой распределения.

Из (3.3) видно, что если известна функция f(х), то изменяя пределы интегрирования, можно найти вероятность для любых интересующих интервалов. Поэтому именно задание функции f(х) полностью определяет закон распределения для непрерывных случайных величин Х.

Для плотности распределения вероятности f(х) должно выполняться условие нормировки в виде:

f(х) = 1, (3.4)

если известно, что все значения Х лежат в интервале (а, b), или в виде:

f(х) dх = 1, (3.5)

если границы интервала для значений Х точно неизвестны. Условия нормировки плотности вероятности (3.4) или (3.5) являются следствием того, что значения случайной величины Х достоверно лежат в пределах (а, b) или (-¥, +¥). Из (3.4) и (3.5) следует, что площадь фигуры, ограниченной кривой распределения и осью абсцисс, всегда равна 1.

3.3. Числовые характеристики случайных величин.

Результаты, изложенные в параграфах 3.1 и 3.2, показывают, что полную характеристику о дискретной или непрерывной случайных величинах дают законы их распределения.

Однако во многих практически значимых ситуациях пользуются так называемыми числовыми характеристиками случайных величин, главное назначение которых – выразить в сжатой форме наиболее существенные особенности их распределения. Важно, что эти параметры представляют собой конкретные (постоянные) значения , которые можно оценивать с помощью полученных в опытах данных. Этими оценками занимается так называемая «Описательная статистика».

В теории вероятностей и математической статистике используется достаточно много различных характеристик, здесь мы рассматриваем наиболее часто употребляемые. Лишь для части из них приведены формулы, по которым рассчитываются их значения, в остальных случаях вычисления оставим компьютеру.

3.3.1.Характеристики положения : математическое ожидание, мода, медиана.

Именно они характеризуют положение случайной величины на числовой оси, т. е. указывают некоторые важные ее значения, которые характеризуют распределение остальных значений. Среди них важнейшую роль играет математическое ожидание М(Х).

а). Математическое ожидание М(Х) случайной величины Х является вероятностным аналогом ее среднего арифметического .

Для дискретной случайной величины оно вычисляется по формуле:

М(Х) = х1р1 + х2р2 + … + хnрn = = , (3.6)

а в случае непрерывной случайной величины М(Х) определяются формулами:

М(Х) = или М(Х) = (3.7)

где f(x) – плотность вероятности, dP= f(x)dx – элемент вероятности (аналог pi) для малого интервала Dx (dx).

Пример. Вычислите среднее значение непрерывной случайной величины, имеющей на отрезке (a, b) равномерное распределение.

Решение : При равномерном распределении плотность вероятности на интервале (a, b) постоянна, т. е. f(х) = fo = const, а вне (a, b) равна нулю, и из условия нормировки (4.3) найдем значение f0:

F0= f0 × x | = (b-a)f0 , откуда

M(X) = | = = (a + b).

Таким образом, математическое ожидание М(Х) совпадает с серединой интервала (a, b), определяющей , т. е. = M(X) = .


Б). Модой Мо(Х) дискретной случайной величины называют ее наиболее вероятное значение (рис.3.4, а), а непрерывной – значение Х , при котором плотность вероятности максимальна (рис.3.4,б).

в). Еще одна характеристика положения – медиана (Ме ) распределения случайной величины.

Медианой Ме(Х) случайной величины называют такое ее значение Х , которое делит все распределение на две равновероятные части. Другими словами для случайной величины одинаково вероятно принять значения меньше Ме (Х) или больше Ме(Х) : Р(Х < Ме) = Р(Х > Ме) = .

Поэтому медиану можно вычислить из уравнения:

(3.8)

Графически медиана – это значение случайной величины, ордината которой делит площадь , ограниченную кривой распределения, пополам (S1 = S2) (рис.3.4,в). Этой характеристикой обычно пользуются только для непрерывных случайных величин, хотя формально ее можно определить и для дискретных Х.

Если М(Х), Мо(Х) и Ме(Х) совпадают, то распределение случайной величины называют симметричным , в противном случае – асимметричным .

Характеристики рассеяния – дисперсия и стандартное отклонение (среднее квадратичное отклонение).

Дисперсия D (X ) случайной величины Х определяется как математическое ожидание квадрата отклонения случайной Х от ее математического ожидания М(Х):

D (X) = M 2 , (3.9)

или D (X) = M (X2) – а)

Поэтому для дискретной случайной величины диперсия вычисляется по формулам:

D(X) = [хi – М(Х)]2 рi, или D(X) = хi2 рi –

а для непрерывной величины, распределенной в интервале (a, b):

a для интервала (-∞,∞):

D (X) = 2 f(x)dx, или D (X) =х2 f(x)dx –

Дисперсия характеризует среднее рассеяние, разбросанность значений случайной величины Х относительно ее математического ожидания. Само слово «дисперсия» означает «рассеяние».

Но дисперсия D(Х) имеет размерность квадрата случайной величины, что весьма неудобно при оценке разброса в физических, биологических, медицинских и др. приложениях. Поэтому обычно пользуются другим параметром, размерность которого совпадает с размерностью Х. Это среднее квадратичное отклонение случайной величины Х, которое обозначают s (Х) :

s (Х) = (3.13)

Итак, математическое ожидание, мода, медиана, дисперсия и среднее квадратичное отклонение являются наиболее употребляемыми числовыми характеристиками распределений случайных величин, каждая из которых, как было показано, выражает какое-нибудь характерное свойство этого распределения.

3.4. Нормальный закон распределения случайных величин

Нормальный закон распределения (закон Гаусса) играет исключительно важную роль в теории вероятностей. Во-первых, это наиболее часто встречающийся на практике закон распределения непрерывных случайных величин. Во-вторых, он является предельным законом, в том смысле, что к нему при определенных условиях приближаются другие законы распределения.

Нормальный закон распределения характеризуется следующей формулой для плотности вероятности:

, (3.13)

Здесь х - текущие значения случайной величины X, а М(X) и s - ее математическое ожидание и стандартное отклонение, которые полностью определяют функцию f(x). Таким образом, если случайная величина распределена по нормальному закону, то достаточно знать только два числовых параметра: М(Х) и s , чтобы полностью знать закон ее распределения (3.13). График функции (3.13) называется нормальной кривой распределения (кривой Гаусса). Он имеет симметричный вид относительно ординаты х = М(Х). Максимальная плотность вероятности, равная » , соответствует математическому ожиданию `Х=М(Х), и по мере удаления от нее плотность вероятности f(х) симметрично спадает, постепенно приближась к нулю (рис. Изменение значения М(Х) в (3.13) не меняет форму нормальной кривой, а приводит лишь к ее сдвигу вдоль оси абсцисс. Величина М(Х) называется также центром рассеяния, а среднеквадратичное отклонение s характеризует ширину кривой распределения (см. Рис.3.6) .

С возрастанием s максимальная ордината кривой убывает, а сама кривая становится более пологой, растягиваясь вдоль оси абсцисс, тогда как при уменьшении s кривая вытягивается вверх, одновременно сжимаясь с боков (рис. 6).

Естественно, что при любых значениях М(Х) и s площадь, ограниченная нормальной кривой и осью Х, остается равной 1 (условие нормировки):

f(х) dх = 1, или f(х) dх =

Нормальное распределение симметрично, поэтому М(Х) = Мо(Х) = Ме(Х).

Вероятность попадания значений случайной величины Х в интервал (x1,x2), т. е. Р (x1 < Х< x2) равна

Р (x1 < Х < x2) = . (3.15)

На практике часто встречается задача нахождения вероятности попадания значений нормально распределенной случайной величины в интервал, симметричный относительно М(Х). В частности, рассмотрим следующую, важную в прикладном отношении задачу. Отложим от М(Х) вправо и влево отрезки равные s, 2s и 3s (рис. 7) и рассмотрим результат вычисления вероятности попадания Х в соответствующие интервалы:

Р (М(Х) - s < Х < М(Х) + s ) = 0,6827 = 68,27%. (3.16)

Р (М(Х) - 2s < Х < М(Х) + 2s) = 0,9545 = 95,45 %. (3.17)

Р (М(Х) - 3s < Х < М(Х) + 3s) = 0,9973 = 99,73 %. (3.18)

Из (3.18) следует, что значения нормально распределенной случайной величины Х с параметрами М(Х) и s с вероятностью Р = 99,73% лежат в интервале М(Х) ± 3s, иначе в этот интервал попадают практически все возможные значения данной случайной величины. Такой способ оценки диапазона возможных значений случайной величины известен как «правило трех сигм».

Пример. Известно, что для человека рН крови является нормально распределенной величиной со средним значением (математическим ожиданием) 7,4 и стандартным отклонением 0,2. Определите диапазон возможных значений этого параметра.

Решение: Для ответа на этот вопрос воспользуемся “правилом трех сигм”. С вероятностью равной 99,73% можно утверждать, что диапазон значений рН для человека составляет 7,4 ± 3·0,2, т. е 6,8÷8.

* Если точные значения границ интервала неизвестны, то рассматривают интервал (-¥, + ¥).