Dat fiind un eșantion dintr-o distribuție normală, ai cărei parametri sunt necunoscuți, este posibil să se dea intervale de predicție în sens frequentist, adică, un interval bazat pe statisticile eșantionului astfel încât, în cazul unor experimente repetate, Xn+1 să se încadreze în intervalul respectiv în procentul dorit de timp; acestea se pot numi „intervale de încredere predictive”.

O tehnică generală a intervalelor de predicție frequentiste constă în găsirea și calcularea unei mărimi pivot a observabilelor X1, …., Xn, Xn+1 – adică o funcție a observabilelor și a parametrilor a cărei distribuție de probabilitate nu depinde de parametri – care poate fi inversată pentru a da o probabilitate ca observația viitoare Xn+1 să se încadreze într-un anumit interval calculat în funcție de valorile observate până în prezent, X 1 , … , X n . {\displaystyle X_{1},\dots ,X_{n}.}

O astfel de cantitate pivot, care depinde numai de observabile, se numește statistică auxiliară. Metoda obișnuită de construire a mărimilor pivotale este de a lua diferența a două variabile care depind de locație, astfel încât locația să se anuleze, și apoi de a lua raportul a două variabile care depind de scară, astfel încât scara să se anuleze. cea mai cunoscută mărime pivotală este statistica t a lui Student, care poate fi derivată prin această metodă și este utilizată în continuare. Medie cunoscută, varianță cunoscutăEdit

Un interval de predicție pentru o observație viitoare X într-o distribuție normală N(µ,σ2) cu medie și varianță cunoscute poate fi calculat din

γ = P ( ℓ < X < u ) = P ( ℓ – μ σ < X – μ σ < u – μ σ ) = P ( ℓ – μ σ < Z < u – μ σ ) , {\displaystyle \gamma =P(\ell <X<u)=P\left({\frac {\ell -\mu }{\sigma }}<{\frac {X-\mu }{\sigma }}<{\frac {u-\mu }{\sigma }}}\dreapta)=P\left({\frac {\frac {\ell -\mu }{\sigma }}<Z<{\frac {u-\mu }{\sigma }}}\dreapta),}

unde Z = X – μ σ {\displaystyle Z={\frac {X-\mu }{\sigma }}}.

, scorul standard al lui X, este distribuit ca fiind normal standard.

Înseamnă

ℓ – μ σ = – z , u – μ σ = z , {\displaystyle {\frac {\frac {\ell -\mu }{\sigma }}}=-z,\quad {\frac {\frac {u-\mu }{\sigma }}}=z,}

sau

ℓ = μ – z σ , u = μ + z σ , {\displaystyle \ell =\mu -z\sigma ,\quad u=\mu +z\sigma ,}

cu z cuantila din distribuția normală standard pentru care:

γ = P ( – z < Z < z ) . {\displaystyle \gamma =P(-z<Z<z).}.

sau, în mod echivalent;

1 2 ( 1 – γ ) = P ( Z > z ) . {\displaystyle {\tfrac {1}{2}}(1-\gamma )=P(Z>z).}

Predicție
interval
z
75% 1.15
90% 1.64
95% 1.96
99% 2,58
Intervalul de predicție (pe axa y) dat de z (cuantila scorului standard, pe axa x). Axa y este comprimată logaritmic (dar valorile de pe ea nu sunt modificate).

Intervalul de predicție este scris în mod convențional sub forma:

. {\displaystyle \left.}

De exemplu, pentru a calcula intervalul de predicție de 95% pentru o distribuție normală cu o medie (µ) de 5 și o abatere standard (σ) de 1, atunci z este aproximativ 2. Prin urmare, limita inferioară a intervalului de predicție este de aproximativ 5 – (2-1) = 3, iar limita superioară este de aproximativ 5 + (2-1) = 7, obținându-se astfel un interval de predicție de aproximativ 3 până la 7.

Diagrama care arată funcția de distribuție cumulativă pentru distribuția normală cu media (µ) 0 și varianța (σ2) 1. În plus față de funcția cuantilă, intervalul de predicție pentru orice scor standard poate fi calculat prin (1 – (1 – (1 – Φµ,σ2(scor standard))-2). De exemplu, un scor standard de x = 1,96 dă Φµ,σ2(1,96) = 0,9750, ceea ce corespunde unui interval de predicție de (1 – (1 – (1 – 0,9750)-2) = 0,9500 = 95%.

Estimarea parametrilorEdit

Pentru o distribuție cu parametri necunoscuți, o abordare directă a predicției constă în estimarea parametrilor și apoi utilizarea funcției cuantile asociate – de exemplu, se poate utiliza media eșantionului X ¯ {\displaystyle {\overline {X}}}}.

ca estimare pentru μ și varianța eșantionului s2 ca estimare pentru σ2. Rețineți că există două alegeri naturale pentru s2 aici – împărțirea la ( n – 1 ) {\displaystyle (n-1)}

produce o estimare nepărtinitoare, în timp ce împărțind la n se obține estimatorul de maximă verosimilitate și se poate folosi oricare dintre ele. Se utilizează apoi funcția cuantile cu acești parametri estimați Φ X ¯ , s 2 – 1 {\displaystyle \Phi _{{\overline {X}},s^{2}}}^{-1}}

pentru a obține un interval de predicție.

Această abordare este utilizabilă, dar intervalul rezultat nu va avea interpretarea de eșantionare repetată – nu este un interval de încredere predictiv.

Pentru continuare, folosiți media eșantionului:

X ¯ = X ¯ n = ( X 1 + ⋯ + X n ) / n {\displaystyle {\overline {\overline {X}}={\overline {X}}}_{n}=(X_{1}+\cdots +X_{n})/n}

și varianța eșantionului (nebiată):

s 2 = s n 2 = 1 n – 1 ∑ i = 1 n ( X i – X ¯ n ) 2 . {\displaystyle s^{2}=s_{n}^{2}={1 \over n-1}\sum _{i=1}^{n}(X_{i}-{\overline {X}}}_{n})^{2}.}.

Medie necunoscută, varianță cunoscutăEdit

Dată o distribuție normală cu media necunoscută μ dar cu varianța cunoscută 1, media eșantionului X ¯ {\displaystyle {\overline {X}}}

a observațiilor X 1 , … , X n {\displaystyle X_{1},\dots ,X_{n}}

are distribuția N ( μ , 1 / n ) , {\displaystyle N(\mu ,1/n),}

în timp ce observația viitoare X n + 1 {\displaystyle X_{n+1}}

are distribuția N ( μ , 1 ) . {\displaystyle N(\mu ,1).}

Luând diferența dintre acestea se anulează μ și se obține o distribuție normală de varianță 1 + ( 1 / n ) , {\displaystyle 1+(1/n),}

deci X n + 1 – X ¯ 1 + ( 1 / n ) ∼ N ( 0 , 1 ) . {\displaystyle {\frac {X_{n+1}-{\overline {X}}}}{\sqrt {1+(1/n)}}}\sim N(0,1).}

Soluția pentru X n + 1 {\displaystyle X_{n+1}}

se obține distribuția de predicție N ( X ¯ , 1 + ( 1 / n ) ) , {\displaystyle N({\overline {X}},1+(1/n)),}

din care se pot calcula intervale ca mai înainte. Acesta este un interval de încredere predictiv, în sensul că, dacă se utilizează un interval de cuantile de 100p%, atunci, la aplicații repetate ale acestui calcul, observația viitoare X n + 1 {\displaystyle X_{n+1}}

se va încadra în intervalul prezis în 100p% din timp.

Observați că această distribuție de predicție este mai conservatoare decât utilizarea mediei estimate X ¯ {\displaystyle {\overline {X}}}.

și varianța cunoscută 1, deoarece aceasta utilizează varianța 1 + ( 1 / n ) {\displaystyle 1+(1/n)}

, deci produce intervale mai largi. Acest lucru este necesar pentru ca proprietatea dorită a intervalului de încredere să se mențină.

Medie cunoscută, varianță necunoscutăEdit

În mod contrar, dată fiind o distribuție normală cu media cunoscută 0 dar cu varianța necunoscută σ 2 {\displaystyle \sigma ^{2}}.

, varianța eșantionului s 2 {\displaystyle s^{2}}

a observațiilor X 1 , … , X n {\displaystyle X_{1},\dots ,X_{n}}

are, până la scară, a χ n – 1 2 {\displaystyle \scriptstyle \chi _{n-1}^{2}}

distribuție; mai precis: ( n – 1 ) s n 2 σ 2 ∼ χ n – 1 2 . {\displaystyle {\frac {(n-1)s_{n}^{2}}}{\sigma ^{2}}}\sim \chi _{n-1}^{2}.}

în timp ce observația viitoare X n + 1 {\displaystyle X_{n+1}}

are distribuția N ( 0 , σ 2 ) . {\displaystyle N(0,\sigma ^{2}).}

Luând raportul dintre observația viitoare și abaterea standard a eșantionului se anulează σ, obținându-se o distribuție t a lui Student cu n – 1 grade de libertate: X n + 1 s ∼ T n – 1 . {\displaystyle {\frac {X_{n+1}}{s}}\sim T^{n-1}.}

Soluționând pentru X n + 1 {\displaystyle X_{n+1}}

dă distribuția de predicție s T T n – 1 , {\displaystyle sT^{n-1},}

din care se pot calcula intervale ca mai înainte.

Observați că această distribuție de predicție este mai conservatoare decât utilizarea unei distribuții normale cu abaterea standard estimată s {\displaystyle s}

și media cunoscută 0, deoarece utilizează distribuția t în loc de distribuția normală și, prin urmare, produce intervale mai largi. Acest lucru este necesar pentru ca proprietatea de interval de încredere dorită să se mențină.

Medie necunoscută, varianță necunoscutăEdit

Combinarea celor de mai sus pentru o distribuție normală N ( μ , σ 2 ) {\displaystyle N(\mu ,\sigma ^{2})}

cu ambele μ și σ 2 necunoscute dă următoarea statistică auxiliară: X n + 1 – X ¯ n s n 1 + 1 / n ∼ T n – 1 . {\displaystyle {\frac {X_{n+1}-{\overline {X}}}}_{n}}{s_{n}{\sqrt {1+1/n}}}}\sim T^{n-1}.}

Această combinație simplă este posibilă deoarece media de eșantionare și varianța de eșantionare a distribuției normale sunt statistici independente; acest lucru este adevărat doar pentru distribuția normală și, de fapt, caracterizează distribuția normală.

Soluționarea pentru X n + 1 {\displaystyle X_{n+1}}

se obține distribuția de predicție X ¯ n + s n 1 + 1 / n ⋅ T n – 1 . {\displaystyle {\overline {X}}}_{n}+s_{n}{\sqrt {1+1/n}}\cdot T^{n-1}.}

Probabilitatea lui X n + 1 {\displaystyle X_{n+1}}.

să se încadreze într-un interval dat este atunci: Pr ( X ¯ n – T a s n 1 + ( 1 / n ) ≤ X n + 1 ≤ X ¯ n + T a s n 1 + ( 1 / n ) ) = p {\displaystyle \Pr \left({\overline {X}}}_{n}-T_{a}s_{n}{\sqrt {1+(1/n)}}}\leq X_{n+1}\leq {\overline {X}}}_{n}+T_{a}s_{n}{\sqrt {1+(1/n)}}\\,\right)=p}

Lasă un răspuns

Adresa ta de email nu va fi publicată.