Analýza rozptylu ANOVA

ANOVA je založená na predpoklade, že vysvetlená suma štvorcov (s 1 stupňom voľnosti) a nevysvetlená suma štvorcov s n - 2 stupňami voľnosti sú mierami rozptylu (variancie). Samotnú varianciu vyjadrujeme ako priemerný štvorec (mean square), čo je SS/d.f. Potom pomer MS vysvetleného regresiou a nevysvetleného regresiou predstavuje pomer rozptylov a ako taký je rozdelený podľa F rozdelenia.

Pokračujeme ďalej v úvahe o lineárnom vzťahu medzi hodnotami nezávislej a závislej premennej. Predpokladáme, že pokiaľ je hodnota pomeru variancií rovná alebo menšia ako kritická hodnota F rozdelenia pre daný počet stupňov voľnosti (1 a n - 2) prijímame nulovú hypotézu o nejestvovaní vzťahu medzi oboma premennými (a opačne).

Nulová hypotéza: nejestvuje lineárny vzťah medzi X a Y hodnotami.

Testujeme na úrovni istoty alfa = 0.05

Kritická hodnota pre Ftest pri 1 a 14 stupňoch voľnosti je 4.6.

Interpretácia
Keďže vypočítaná hodnota pomeru variancií 45.67 je výrazne väčšia ako kritická hodnota 4.6, môžeme odmietnuť nulovú hypotézu o neprítomnosti lineárneho vzťahu medzi nezávislou a závislou premennou, teda môžeme potvrdiť existenciu lineárneho vzťahu medzi premennými na úrovni 0.95. Inými slovami, 95% všetkých výberov úmrtnosti z danej populácie je v lineárnom vzťahu k teplote, ktorý má tvar priamky s parametrami y = 53.65 + 4.24 x.