2. Статистичний дисперсійний аналіз
Статистичний дисперсійний аналіз – один з методів виявлення впливу
окремих факторів на показник біологічного або технологічного процесу.
Дисперсійний аналіз був створений спочатку для статистичної
обробки агрономічних дослідів. В наш час його також використовують в
економічних, технічних та соціальних експериментах.
В будь-якому експерименті середні значення досліджуваних величин
змінюються у зв’язку зі зміною основних факторів (кількісних та
якісних), що визначають умови досліду, а також і випадкових факторів.
Дослідження впливу тих чи інших факторів на мінливість середніх є
задачею дисперсійного аналізу.
В основі дисперсійного аналізу є такий принцип: якщо на випадкову
величину діють взаємно незалежні фактори A, B, …, то загальна дисперсія
дорівнює сумі дисперсій, зумовлених дією окремо кожного з факторів:
2
3. Однофакторний дисперсійний аналіз
Розглядається дія одиничного фактору А, котрий приймає k різних значень (рівнів
фактора). Найпростіші розрахунки виходять при рівній кількості дослідів на кожному рівні
фактора А.
Дисперсійний аналіз можна провести за наступним алгоритмом:
Обчислюється:
Сума за стовпцями:
Сума квадратів усіх дослідів:
Суму квадратів сум за стовпцями, поділену на число дослідів в стовпці:
Квадрат загальної суми, поділений на число всіх дослідів (коректуючий член):
Суму квадратів для стовпчика:
Загальна сума квадратів , рівна різниці між сумою квадратів всіх дослідів та коректуючим
членом:
Залишкову суму квадратів для оцінки помилки експерименту:
дисперсію:
дисперсію:
3
4. Результати розрахунків однофакторного
дисперсійного аналізу
Результати розрахунків представити у вигляді таблиці дисперсного
аналізу:
Якщо то вплив фактора А слід вважати незначним. При
цьому загальна дисперсія пов’язана тільки з фактором випадковості
і може служити оцінкою для дисперсії відтворення. Така оцінка краща
від , бо має більше число степенів вільності. Якщо ж справедлива
нерівність де f1=k-1 та f2=k(n-1)=N-k
різниця між дисперсіями та значна і, відповідно, значний
вплив фактора А.
4
5. Двофакторний дисперсійний аналіз
Вивчаючи вплив на процес одночасно двох факторів А та В. Фактор А вивчається на
рівнях а1, а,…,аk, фактор В – на рівнях b1, b2,…, bm. При проведенні двофакторного
дисперсійного аналізу зручно використовувати наступний алгоритм розрахунку.
Знаходимо:
Суми по стовпцях
Суми по стрічках
Суму квадратів всіх дослідів ;
Суму квадратів сум по стовпцях, поділену на число дослідів в стовпцю ;
Суму квадратів сум по стрічках, поділену на число дослідів в стрічці ;
Квадрат загальної суми, поділений на число всіх дослідів
(коректуючий член) ;
Суму квадратів для стовпця SSA=SS2-SS4
Суму квадратів для стрічки SSB=SS3-SS4
Загальнусуму квадратів, рівну різниці між сумою квадратів всіх дослідів та коректуючим
членом SSзаг.=SS1-SS4;
Залишкову суму квадратів SSзал.=SSзаг.-SSA-SSB=SS1-SS2-SS3+SS4;
Дисперсію ;
Дисперсію ;
Дисперсію .
5
6. Результати розрахунків двофакторного
дисперсійного аналізу
Результати розрахунків представляють у вигляді таблиці
дисперсного аналізу:
Така модель справедлива, коли між факторами А та В немає
взаємодії. В протилежному випадку цій взаємодії як фактору
присутня своя дисперсія s2АВ. Дисперсія взаємодії АВ, s2АВ є мірою
того, наскільки вплив фактора А залежить від рівня фактора В, та
навпаки, наскільки вплив фактора В залежить від рівня А. В
наведено вище алгоритмі при наявності взаємодії між
факторами s2АВ, як складова частина, входить в дисперсію s2пом.
6
7. Приклад розрахунку двофакторного
дисперсійного аналізу
Розрахуємо двофакторний дисперсійний аналіз для того, щоб дослідити вплив
фактора А (розтягування еспандер), та вплив фактора В (присідання) одночасно на
частоту пульсу. Для його проведення в якості досліджуваних даних використаємо дані з
наступної таблиці.
Для перевірки значимості впливу фактора А на параметр порівнюємо обчислене
значення статистики FA=46.3365 з табличним значенням F0.95(3.80)=2.76:
FA>F0.95(3.80)
Робимо висновок що фактор А впливає на параметр, що досліджується.
Для визначення степені впливу фактора В на параметр порівнюємо обчислене
значення статистики FB=1391.0256 табличним значенням F0.95(4.80)=2.53:
FB>F0.95(4.80)
Робимо висновок що фактор В теж впливає на параметр, що
досліджується, проте, порівнюючи різниці між статистикою та табличним значенням
критерію Фішера при дослідженні факторів А і В, можемо з впевненістю
стверджувати, що вплив фактора В (присідання) набагато суттєвіший.
Для перевірки наявності взаємодії між факторами А і В порівняємо обраховане
значення статистики FAB=3.2286 з табличним значенням F0.95(12.80)=1.92:
FAB>F0.95(12.80)
З отриманих результатів можна зробити висновок про слабку взаємодію двох
факторів.
7
9. Результати розрахунків
Середнє значення спостережень одної комірки
X(1,1,*)=72.20 X(2,3,*)=129.80 X(3,5,*)=159.00
X(1,2,*)=100.00 X(2,4,*)=144.40 X(4,1,*)=91.40
X(1,3,*)=116.80 X(2,5,*)=156.40 X(4,2,*)=105.80
X(1,4,*)=138.40 X(3,1,*)=81.80 X(4,3,*)=132.00
X(1,4,*)=153.20 X(3,2,*)=102.40 X(4,4,* )=152.00
X(2,1,*)=79.40 X(3,3,*)=129.60 X(4,5,*)= 59.60
X(2,2,*)=104.20 X(3,4,*)=150.40
Середнє значення всієї сукупності спостережень Х=122.97
Середні значення по стрічці:
X(1,*,*)=116.12 X(3,*,*)=124.64
X(2,*,*)=122.92 X(4,*,*)=128.20
Середні значення по стовпчику:
Х(*,1,*)= 81.30
Х(*,2,*)= 103.10
Х(*,3,*)= 127.05
Х(*,4,*)= 146.35
Х(*,5,*)= 157.05
Оцінка внутрішньої дисперсії по фактору А: S1^2=642.2233
Оцінка внутрішньої дисперсії по фактору В: S2^2=19279.6150
Оцінка між групової дисперсії: S3^2=44.7483
Оцінка залишкової дисперсії: S4^2=13.86
Обчислене значення статистики:Fa=46.3365
Обчислене значення статистики:Fb=1391.0256
Обчислене значення статистики:Fab=3.2286
9
10. Латинські квадрати
При проведенні експерименту число дослідів можна значно
скоротити, якщо скористатись двофакторним експериментом по схемі
латинського квадрату, використаного вперше Фішером. Латинський
квадрат n x n – це квадратна таблиця, складена з n елементів (чисел чи
букв) таким чином, що кожний елемент повторюється в кожній стрічці і
кожному стовпчику тільки один раз.
10
11. Греко-латинські квадрати
Планування за латинським квадратом дозволяє ввести в дослідження
три фактора. Для чотирьох факторів хороші властивості має план
експерименту по схемі греко-латинського квадрату. Число рівнів для всіх
факторів повинно бути однакове.
11
12. Перелік використаних джерел
1. Вікіпедія *Електронний ресурс+ Метематична статистика – Режим
доступу: URL: http://uk.wikipedia.org/wiki/Диспрсійний_аналіз -
Загол. з екрану;
2. ТНТУ Wiki *Електронний ресурс+ Дисперсійний аналіз – Режим
доступу: URL: http://wiki.tntu.edu.ua/Дисперсійний_аналіз - Загол. з
екрану;
3. Дисперсійний аналіз *Електронний ресурс+ Двофакторний
дисперсійний аналіз – Режим доступу: URL:
http://old.lp.edu.ua/fileadmin/ICCT/top/pub/Chaykivskyy/lek/da/da03
.html - Загол. з екрану;
4. Дисперсійний аналіз *Електронний ресурс+ Латинські і греко-
латинські квадрати - Режим доступу: URL:
http://old.lp.edu.ua/fileadmin/ICCT/top/pub/Chaykivskyy/mm/da.pdf.
12