Главная Теория вероятностей и математическая статистика Математическая статистика


















Математическая статистика

Задачи, решаемые математической статистикой, являются, в некотором смысле, обратными задачам теории вероятностей. Вероятностные задачи, как правило, устроены следующим образом: распределения случайных величин считаются изначально известными, основываясь на знании этих распределений требуется найти вероятности различных событий, математические ожидания, дисперсии, моменты распределений и т.п. В статистических задачах само распределение считается неизвестным, и целью исследования является получение более или менее достоверной информации об этом распределении на основе данных, собранных в результате наблюдений (экспериментов).

Основные понятия математической статистики

Генеральная совокупность. Пусть имеется N объектов, каждому из которых присуще определенное значение некоторой числовой характеристики X. Совокупность этих N объектов мы и назовем генеральной совокупностью.

С точки зрения математической статистики генеральная совокупность представляет собой N чисел, среди которых, конечно, могут быть и одинаковые.

Выборка. Для того чтобы установить параметры генеральной совокупности, нам позволено произвести некоторое число n испытаний. Каждое испытание состоит в том, что мы случайным образом выбираем один объект генеральной совокупности и определяем его значение X. Полученный таким образом ряд чисел X1, …, Xn будем называть выборкой объема n, а число Xii-м элементом выборки.

Сам процесс выбора можно осуществлять различными способами: выбрав объект и определив его значение, изымать этот объект и не допускать к последующим испытаниям (выборка без возвращения); после определения его значения объект возвращается в генеральную совокупность и может полноправно участвовать в дальнейших испытаниях (выборка с возвращением).

Если бы мы смогли провести сплошное обследование всех объектов генеральной совокупности, то не нужно было бы применять никакие статистические методы и саму математическую статистику можно было бы отнести к чисто теоретическим наукам. Однако такой полный контроль невозможен по следующим причинам. Во-первых, часто испытание сопровождается разрушением испытуемого объекта; в этом случае мы имеем выборку без возвращения. Во-вторых, обычно необходимо исследовать весьма большое количество объектов, что просто невозможно физически. Наконец, может возникнуть такое положение, когда многократно измеряется один и тот же объект, но каждый замер производится со случайной ошибкой, и цель последующей статистической обработки заключается именно в уточнении характеристик объекта на основе многократных наблюдений; при этом результат каждого наблюдения надо считать новым объектом генеральной совокупности (простейшим примером такой ситуации является многократное подбрасывание монеты с целью определения вероятности выпадения «герба»).

Следует помнить также, что выборка обязательно должна удовлетворять условию репрезентативности: давать обоснованное представление о генеральной совокупности.

Ясно, что с ростом объема N генеральной совокупности исчезает различие между выборками с возвращением и без возвращения. Мы будем рассматривать случай бесконечно большого объема генеральной совокупности и поэтому, употребляя слово «выборка», не будем указывать, какая она — с возвращением или без него.

Теоретическая функция распределения. Пусть X1 — выборка единичного объема из заданной генеральной совокупности. Поскольку сам процесс выбора производится случайным образом, то X1 является случайной величиной и, как и всякая случайная величина, имеет функцию распределения F(x)=P{X1 < x}. Нетрудно видеть, что если объем N генеральной совокупности конечен, то при случайном выборе объекта мы находимся в рамках схемы классической вероятности и значение функции распределения P(x) совпадает с отношением Nx/N, где Nx — число тех объектов генеральной совокупности, значения которых меньше x.

В случае выборки X1, …, Xn произвольного объема n каждый элемент Xi выборки также будет иметь функцию распределения F(x), причем для выборки с возвращением X1, …, Xn будут независимы между собой (чего нельзя сказать о выборке без возвращения). Поскольку рассматриваем выборки из генеральной совокупности бесконечно большого объема, то приходим к интерпретации (с точки зрения теории вероятностей) выборки X1, …, Xn как n независимых одинаково распределенных с функцией распределения F(x) случайных величин. Функция распределения F(x) называется теоретической функцией распределения. Однако теоретическая функция распределения F(x) либо неизвестна, либо известна не полностью, и именно относительно F(x) мы будем делать наши статистические выводы. Заметим, что в соответствии с общими положениями теории вероятностей совместная функция распределения FX1,…,Xn(x1, …, xn) выборки X1, …, Xn задается формулой

FX1,…,Xn(x1, …, xn) = P{X1 < x1, …, Xn < xn} = F(x1)…F(xn).

В дальнейшем будем предполагать, что F(x) является функцией распределения либо дискретной, либо непрерывной наблюдаемой случайной величины X. В первом случае будем оперировать рядом распределения случайной величины X, записанным в виде табл. 1, а во втором — плотностью p(x) = F′(x).