t ROZDELENIE

Je nezvyčajné nevedieť priemer populácie a pri tom poznať jej rozptyl. Preto sa pre odhad rozptylu populácie použije smerodatná odchýľka výberu. V takom prípade však nie je možné použiť normálne (Gaussovo) rozdelenie, ale je potrebné použiť rozdelenie t - Studentovo.

Vlastnosti t-rozdelenia (Studentovho):

  • jeho priemer je 0;
  • je symetrické okolo priemeru;
  • rozptyl je väčší ako 1 avšak pri väčších výberoch sa blíži k 1;
  • je to celá rodina rozdelení, keďže pre každú hodnotu n - 1 je iné rozdelenie;
  • voči normálnemu nemá tak ostrý vrchol a má vyššie chvostíky.

  •  

    t rozdelenie má tvar podobný normálnemu rozdeleniu. Rastúcim počtom stupňov voľnosti sa toto rozdelenie približuje normálnemu. Totožné sú pri nekonečnom počte stupňov voľnosti, približne rovnaké sú už od df = 30. Všeobecný prístup k tvorbe intervalu spoľahlivosti je rovnaký ako pri použití normálneho rozdelenia. Pri výbere z normálneho rozdelenia, kde nie je známa jej smerodatná odchýľka , je možné skonštruovať 100(1- alfa) interval spoľahlivosti pre priemer populácie pomocou:

    Príklad
     
    V štúdii fajčenia sa u 160 mladých fajčiarov vo veku 16-17 rokov zistilo, že priemerne vyfajčia 7.3 cigarety denne so smerodatnou odchýľkou 2.6 cigarety. 
    Rozptyl v populácii nie je známy. Predpokladáme, že jeho hodnota je normálne rozložená v danej populácii. Výskumník chcel stanoviť 95% interval spoľahlivosti pre skutočný priemer populácie mladých ľudí.
    Odhadca je priemer výberu,  štandardná chyba je . Koeficient spoľahlivosti je hodnota t vztiahnutá ku koeficientu spoľahlivosti 0.95 a n - 1 stupňov voľnosti.Keďže 95%interval spoľahlivosti ponecháva 0.05 plochy pod krivkou t rozdelenia, musí sa rovnakou mierou rozdeliť na obe strany, čo vedie k dva razy 0.025 plochy. Ostáva teda 0.975 plochy pre koeficient spoľahlivosti 0.637 pri 159 stupňoch voľnosti.

    7.3 ą 2.262 * 0.21
    7.77, 6.83

    Interpretácia:Skutočný priemer populácie sa nachádza medzi 7.77 a 6.83 s istotou 95%, resp. 95% intervalov priemerov náhodných výberov bude obsahovať skutočný priemer populácie.

      Príklad 2

    Krok 1. Prečítajte súbor s príkladom o Calciu a placebe a vložte ho do tabuľky označenej CA

      CA <- read.table("D:/WWW/Healthnet/texts/statistika/odhady/Priklady/priklad1_Ca_placebo.txt", header=T)

    Krok 2. Vyberte hodnoty placeba a calcia do samostatných premenných

      P <- subset(CA, Treatment=="Placebo")

      C <- subset(CA, Treatment=="Calcium")

    Krok 3. Vypočítajte interval istoty pre priemer pomocou t-rozdelenia.

      Použijeme k tomu funkciu t.test(var)

      > t.test(C$End)

    Výsledok

    One Sample t-test

    data: C$End
    t = 44.5826, df = 9, p-value = 7.184e-12
    alternative hypothesis: true mean is not equal to 0
    95 percent confidence interval:
    104.3236 115.4764

    sample estimates:
    mean of x
    109.9