Разделы сайта

Датчик случайных величин. Тестирование по критерию Хи-квадрат

Рассмотрим задачу по проверке близости теоретической и эмпирической функций распределения для дискретного распределения [7]. При этом закон распределения задаётся набором вероятностей р1,., рk, а гипотеза сводится к тому, что эти вероятности приняли определенные значения. То есть гипотеза Н0: р1 = р10, р2 = р20,., рk = рk0. Для решения такой задачи используется теорема Пирсона.

Теорема Пирсона

Пусть n - число независимых повторений некоего опыта, который заканчивается одним из k (k - натуральное число) элементарных исходов А1,., Аk, причём вероятности этих исходов - р1,., рk, p1 +. + рk = 1. Обозначим через m1,.,mk (m1 +. + mk = n) то количество опытов, которые закончились исходами А1,., Аk. Введем случайную величину

. (91)

Тогда при неограниченном росте n → ∞ случайная величина асимптотически подчиняется распределению с (k - 1) степенями свободы.

Для проверки гипотезы Н0 о том, что вероятности р1,…, рk приняли определенные значения Н0: р1 = р10, р2 = р20,., рk = рk0, рассмотрим следующую статистику: Статистика

(92)

называется статистикой хи-квадрат Пирсона для простой гипотезы.

Фактически величина XІ/n представляет собой квадрат некоего расстояния между двумя k-мерными векторами: вектором наблюдаемых относительных частот (mi/n) и вектором предсказанных ненаблюдаемых вероятностей (рi0). От евклидового расстояния это расстояние отличается тем, что разные координаты входят в него с разными весами. Если верна гипотеза Н0, то асимптотическое поведение XІ при n → ∞ указывает теорема Пирсона. Чтобы понять, что происходит, когда Н0 неверна, заметим, что по закону больших чисел (mi/n) → рi при n → ∞ для всех допустимых i = 1,.,k. Поэтому при n → ∞:

. (93)

Если гипотеза неверна, то XІ → ∞ при n → ∞. Значит, гипотеза Н0 должна быть отвергнута, если полученное в опыте значение XІ слишком велико. Термин "слишком велико" означает, что наблюденное значение XІ имеет малую вероятность, то есть превосходит критическое значение, которое можно взять из таблиц распределения хи-квадрат. Так как вероятность Р ( ≥ XІ) - малая величина, то маловероятно случайно получить такое же, как в опыте, или еще большее расхождение между вектором частот и вектором вероятностей.

Асимптотический характер теоремы Пирсона, лежащий в основе этого правила, требует осторожности при его практическом использовании. На него можно полагаться только при больших n. Достаточно велико должно быть и n, и все произведения npi. Проблема применимости аппроксимации (непрерывное распределение) к статистике XІ, распределение которой дискретно, оказалась сложной. Согласно имеющемуся опыту, аппроксимация применима, если все ожидаемые частоты npi > 10. Если число различных исходов k велико, граница для npi может быть снижена (до 5 или даже до 3, если k порядка нескольких десятков). Чтобы соблюсти эти требования, на практике порой приходится объединять несколько исходов и переходить к схеме Бернулли с меньшим k.

Вопрос о сравнении наблюденных в опыте частот с теми, которые предписывает теория (ради проверки этой теории) возникает во многих задачах. Рассмотрим способ сопоставления наблюдаемых частот с частотами, рассчитанными по модели. Обозначим наблюдаемые частоты через Н; ожидаемые (теоретические) частоты - Т. Если модель правильно описывает действительность, числа Н и Т должны быть близки друг к другу, сумма квадратов отклонений (Н - Т) І не должна быть большой. Разумно в общую сумму отдельные слагаемые вносить с различными весами, поскольку чем больше Т, тем больше Н может от него отклоняться за счет действия случая без отступления от модели. В качестве меры близости наблюдаемых и ожидаемых частот используется величина:

Перейти на страницу: 1 2

Самое читаемое:

Исследования свойств гексагональных кодирующих коллиматоров для однофотонной эмиссионной томографии
Цель работы: Численно исследовать аппаратные функции кодирующих коллиматоров, построенных на базе псевдослучайных последовательностей, расширенных псевдослучайных последовательностей, троичных последовательностей, расширенных троичных последовательностей. Оптимизировать скорость расчета аппаратных функций гексагональных кодирующих ...

www.techstages.ru : Все права защищены! 2024