Статистика - складна наука про вимірювання і аналізі різних даних. Як і в багатьох інших дисциплінах, в цій галузі існує поняття гіпотези. Так, гіпотеза в статистиці - це будь-яке положення, яке потрібно прийняти або відкинути. Причому в даній галузі є кілька видів таких припущень, схожих між собою за визначенням, але відрізняються на практиці. Нульова гіпотеза - сьогоднішній предмет вивчення.

Від загального до приватного: гіпотези в статистиці

Від основного визначення припущень відходить ще одне, не менш важливе, - статистична гіпотеза є вивчення генеральної сукупності важливих для науки об'єктів, щодо яких вченими робляться висновки. Її можна перевірити за допомогою вибірки (частини генеральної сукупності). Наведемо кілька прикладів статистичних гіпотез:

1. Успішність всього класу, можливо, залежить від рівня освіти кожного учня.

2. Початковий курс математики в рівній мірі засвоюється як дітьми, які прийшли в школу в 6 років, так і дітьми, які прийшли в 7.

Простий гіпотезою в статистиці називають таке припущення, яке однозначно характеризує певний параметр величини, взятої вченим.

Складна складається з декількох або нескінченної кількості простих. Вказується деяка область чи ні точної відповіді.

Корисно розуміти кілька визначень гіпотез в статистиці, щоб не плутати їх на практиці.

Концепція нульової гіпотези

Нульова гіпотеза - це теорія про те, що є якісь дві сукупності, які не розрізняються між собою. Однак на науковому рівні немає поняття «не розрізняються», але є «їх схожість дорівнює нулю». Від цього визначення і було утворено поняття. У статистиці нульова гіпотеза позначається як Н0. Причому крайнім значенням неможливого (маловірогідної) вважається від 0.01 до 0.05 або менше.

Краще розібрати, що таке нульова гіпотеза, приклад з життя допоможе. Педагог в університеті припустив, що різний рівень підготовки учнів двох груп до залікової роботи викликаний незначними параметрами, випадковими причинами, що не впливають на загальний рівень освіти (різниця в підготовці двох груп студентів дорівнює нулю).

Однак зустрічно варто навести приклад альтернативної гіпотези - припущення, спростовує твердження нульової теорії (Н1). Наприклад: директор університету припустив, що різний рівень в підготовці до залікової роботи в учнів двох груп викликаний застосуванням педагогами різних методик навчання (різниця в підготовці двох груп істотна і на те є пояснення).

Тепер відразу видно різницю між поняттями «нульова гіпотеза» і «альтернативна гіпотеза». Приклади ілюструють ці поняття.

Перевірка нульової гіпотези

Створити припущення - це ще півбіди. Справжньою проблемою для новачків вважається перевірка нульової гіпотези. Саме тут багатьох і чекають труднощі.

Використовуючи метод альтернативної гіпотези, яка стверджує щось протилежне нульовий теорії, можна порівняти обидва варіанти і вибрати правильний. Так діє статистика.

Нехай нульова гіпотеза Н0, а альтернативна Н1, тоді:

Н0: c = c0
  Н1: c ≠ c0.

Тут c - це якесь середнє значення генеральної сукупності, яке належить знайти, а c0 - це спочатку значення, по відношенню до якого перевіряється гіпотеза. Також є певна кількість Х - середнє значення вибірки, за яким визначається c0.

Отже, перевірка полягає в порівнянні Х і c0, якщо Х = c0, то приймається нульова гіпотеза. Якщо ж Х ≠ c0, то за умовою вірної вважається альтернативна.

«Довірчий» спосіб перевірки

Існує найбільш дієвий спосіб, за допомогою якого нульова статистична гіпотеза легко перевіряється на практиці. Він полягає в побудові діапазону значень до 95% точності.

Для початку знадобиться знати формулу розрахунку довірчого інтервалу:
  X - t * Sx ≤ c ≤ X + t * Sx,

де Х — це спочатку число на основі альтернативної гіпотези
t — табличні величини (коефіцієнт Стьюдента)
  Sx - стандартна середня помилка, яка розраховується як Sx = σ / √n, де в чисельнику стандартне відхилення, а в знаменнику - обсяг вибірки.

Отже, припустимо ситуацію. До ремонту конвеєр в день випускав 32.1 кг кінцевої продукції, а після ремонту, як стверджує підприємець, коефіцієнт корисної дії зріс, і конвеєр, по тижневої перевірки, почав випускати 39.6 кг в середньому.

Нульова гіпотеза буде стверджувати, що ремонт ніяк не вплинув на ККД конвеєра. Альтернативна гіпотеза скаже, що ремонт докорінно змінив ККД конвеєра, тому продуктивність його підвищилася.

По таблиці знаходимо n = 7, t = 2,447, звідки формула прийме наступний вигляд:

39,6 - 2,447 * 4,2 ≤ з ≤ 39,6 + 2,447 * 4,2;

Виходить, що значення 32.1 входить в діапазон, а отже, значення, запропоноване альтернативою — 39.6 — не приймається автоматично. Пам'ятайте, що спочатку перевіряється на правильність нульова гіпотеза, а потім — протилежна.

Різновиди заперечення

До цього розглядався такий варіант побудови гіпотези, де Н0 стверджує щось, а Н1 це спростовує. Звідки можна було скласти подібну систему:

Н0: з = с0
  Н1: з ≠ С0.

Але існує ще два споріднених способу спростування. Наприклад, нульова гіпотеза стверджує, що середня оцінка успішності класу більше 4.54, а альтернативна тоді скаже, що середня успішність того ж класу менш 4.54. І виглядати у вигляді системи це буде так:

Н0: з ⩾ 4.54
  Н1: з \u0026 lt; 4.54.

Зверніть увагу, що нульова гіпотеза стверджує, що значення більше або дорівнює, а статистична - що строго менше. Строгість знака нерівності має велике значення!

Статистична перевірка

Статистична перевірка нульових гіпотез полягає в використанні статистичного критерію. Такі критерії підпорядковуються різним законам розподілу.

Наприклад, існує F-критерій, який розраховується за розподілом Фішера. Є T-критерій, який найчастіше використовують на практиці, залежить від розподілу Стьюдента. Квадратний критерій згоди Пірсона і т. Д.

Область прийняття нульової гіпотези

В алгебрі є поняття «область допустимих значень». Це такий відрізок або точка на осі Х, на якому знаходиться безліч значень статистики, при яких нульова гіпотеза вірна. Крайні точки відрізка - критичні значення. Промені по праву і ліву сторону відрізка - критичні області. Якщо знайдене значення входить в них, то нульова теорія спростовується і приймається альтернативна.

Спростування нульової гіпотези

Нульова гіпотеза в статистиці часом дуже виверткий поняття. Під час перевірки її можна допустити помилки двох типів:

1. Відкидання вірної нульової гіпотези. Позначимо перший тип як а=1.
  2. Прийняття помилкової нульової гіпотези. Другий тип позначимо як а = 2.

Варто розуміти, що це не однакові параметри, результати помилок можуть істотно різнитися між собою і мати різні вибірки.

Приклад помилок двох типів

Зі складними поняттями легше розібратися на прикладі.

Під час виробництва якогось ліки від вчених потрібна надзвичайна обережність, оскільки перевищення дози одного з компонентів провокує високий рівень токсичності готового препарату, від якого пацієнти, що приймають його, можуть померти. Однак на хімічному рівні виявити передозування неможливе.
  Через це перед тим як випустити ліки в продаж, невелику його дозу перевіряють на щурах або кроликах, вводячи їм препарат. Якщо більшість піддослідних вмирає, то ліки в продаж не допускається, якщо піддослідні живі, то ліки дозволяють продавати в аптеках.

Перший випадок: насправді ліки було не токсичне, але під час експерименту була допущена помилка і препарат класифікували як токсичний і не допустили у продаж. А = 1.

Другий випадок: в ході іншого експерименту при перевірці іншої партії ліки вирішено, що препарат не токсичний, і в продаж його допустили, хоча насправді препарат був отруйний. А = 2.

Перший варіант спричинить за собою великі фінансові витрати постачальника-підприємця, так як доведеться знищити всю партію ліків і починати з нуля.

Друга ситуація спровокує смерть пацієнтів, які купили і вживали ці ліки.

Теорія ймовірності

Не тільки нульові, але все гіпотези в статистиці і економіці поділяють за рівнем значущості.

Рівень значущості - відсоток появи помилок першого роду (відхилення вірної нульової гіпотези).

• перший рівень — 5% або 0.05, тобто ймовірність помилитися 5 до 100 або 1 до 20.
• другий рівень — 1% або 0.01, тобто ймовірність 1 до 100.
  • третій рівень - 0.1% або 0.001, ймовірність 1 до тисячі.

Критерії перевірки гіпотези

Якщо вченим вже був зроблений висновок про правильність нульової гіпотези, то її необхідно піддати перевірці. Це необхідно, щоб виключити помилку. Існує основний критерій перевірки нульової гіпотези, що складається з декількох етапів:

1. Береться допустима помилкова ймовірність P=0.05.
2. Підбирається статистика для критерію 1.
3. За відомим методом знаходиться область допустимих значень.
4. Тепер обчислюється значення статистики Т.
  5. Якщо Т (статистика) належить області прийняття нульової гіпотези (як в «довірчому» методі), то припущення вважаються вірними, а значить, і сама нульова гіпотеза залишається вірною.

Саме так діє статистика. Нульова гіпотеза при грамотній перевірці буде прийнята або відкинута.

Варто зауважити, що для звичайних підприємців і користувачів перші три етапи буває дуже складно виконати безпомилково, тому їх довіряють професійним математикам. Зате 4 і 5 етапи може виконати будь-яка людина, в достатній мірі знає статистичні методи перевірки.