Gegeben eine Stichprobe aus einer Normalverteilung, deren Parameter unbekannt sind, ist es möglich, Vorhersageintervalle im frequentistischen Sinne anzugeben, d.h., ein Intervall, das auf der Statistik der Stichprobe basiert, so dass bei wiederholten Experimenten Xn+1 mit dem gewünschten Prozentsatz in das Intervall fällt; man kann diese als „Vorhersage-Konfidenzintervalle“ bezeichnen.
Eine allgemeine Technik der frequentistischen Vorhersageintervalle besteht darin, eine zentrale Größe der Beobachtungsgrößen X1, …., Xn, Xn+1 zu finden und zu berechnen – d.h. eine Funktion von Beobachtungsgrößen und Parametern, deren Wahrscheinlichkeitsverteilung nicht von den Parametern abhängt -, die invertiert werden kann, um eine Wahrscheinlichkeit dafür zu erhalten, dass die zukünftige Beobachtung Xn+1 in ein Intervall fällt, das in Bezug auf die bisher beobachteten Werte X 1 , … , X n berechnet wird. {X_{1},X_{n}.}
Eine solche zentrale Größe, die nur von den Beobachtungswerten abhängt, nennt man eine Hilfsstatistik. Die übliche Methode zur Konstruktion von zentralen Größen besteht darin, die Differenz zweier Variablen zu nehmen, die vom Ort abhängen, so dass sich der Ort aufhebt, und dann das Verhältnis zweier Variablen zu nehmen, die vom Maßstab abhängen, so dass sich der Maßstab aufhebt.Die bekannteste zentrale Größe ist die Student’sche t-Statistik, die auf diese Weise abgeleitet werden kann und im Folgenden verwendet wird.
Bekannter Mittelwert, bekannte VarianzEdit
Ein Vorhersageintervall für eine zukünftige Beobachtung X in einer Normalverteilung N(µ,σ2) mit bekanntem Mittelwert und Varianz kann berechnet werden aus
γ = P ( ℓ < X < u ) = P ( ℓ – μ σ < X – μ σ < u – μ σ ) = P ( ℓ – μ σ < Z < u – μ σ ) , {\displaystyle \gamma =P(\ell <X<u)=P\left({\frac {\ell -\mu }{\sigma }}<{\frac {X-\mu }{\sigma }}<{\frac {u-\mu }{\sigma }}}right)=P\left({\frac {\ell -\mu }{\sigma }}<Z<{\frac {u-\mu }{\sigma }}right),}
wobei Z = X – μ σ {\displaystyle Z={\frac {X-\mu }{\sigma }}
, der Standardwert von X, ist standardnormalverteilt.
Daher
ℓ – μ σ = – z , u – μ σ = z , {\displaystyle {\frac {\ell -\mu }{\sigma }}=-z,\quad {\frac {u-\mu }{\sigma }}=z,}
oder
ℓ = μ – z σ , u = μ + z σ , {\displaystyle \ell =\mu -z\sigma ,\quad u=\mu +z\sigma ,}
mit z das Quantil in der Standardnormalverteilung, für das:
γ = P ( – z < Z < z ) . {γ = P(-z<Z<z).}
oder gleichbedeutend;
1 2 ( 1 – γ ) = P ( Z > z ) . {\displaystyle {\tfrac {1}{2}}(1-\gamma )=P(Z>z).}
Vorhersage intervall |
z |
---|---|
75% | 1.15 |
90% | 1.64 |
95% | 1.96 |
99% | 2.58 |
Das Vorhersageintervall wird üblicherweise wie folgt geschrieben:
.
Zur Berechnung des 95%igen Vorhersageintervalls für eine Normalverteilung mit einem Mittelwert (µ) von 5 und einer Standardabweichung (σ) von 1 beträgt z beispielsweise ungefähr 2. Daher ist die untere Grenze des Vorhersageintervalls ungefähr 5 – (2-1) = 3 und die obere Grenze ungefähr 5 + (2-1) = 7, so dass sich ein Vorhersageintervall von ungefähr 3 bis 7 ergibt.
Schätzung von ParameternBearbeiten
Für eine Verteilung mit unbekannten Parametern besteht ein direkter Ansatz zur Vorhersage darin, die Parameter zu schätzen und dann die zugehörige Quantilfunktion zu verwenden – zum Beispiel könnte man den Stichprobenmittelwert X ¯ {\displaystyle {\overline {X}} verwenden}
als Schätzung für μ und die Stichprobenvarianz s2 als Schätzung für σ2 verwenden. Man beachte, dass es hier zwei natürliche Möglichkeiten für s2 gibt – die Division durch ( n – 1 ) {\displaystyle (n-1)}
ergibt eine unverzerrte Schätzung, während die Division durch n den Maximum-Likelihood-Schätzer ergibt, und beide können verwendet werden. Man verwendet dann die Quantilsfunktion mit diesen geschätzten Parametern Φ X ¯ , s 2 – 1 {\displaystyle \Phi _{{\overline {X}},s^{2}}^{-1}}
, um ein Vorhersageintervall zu erhalten.
Dieser Ansatz ist brauchbar, aber das resultierende Intervall hat nicht die Interpretation einer wiederholten Stichprobe – es ist kein prädiktives Konfidenzintervall.
Für die Fortsetzung wird der Stichprobenmittelwert verwendet:
X ¯ = X ¯ n = ( X 1 + ⋯ + X n ) / n {\displaystyle {\overline {\}}={\overline {X}}_{n}=(X_{1}+\cdots +X_{n})/n}
und die (unverzerrte) Stichprobenvarianz:
s 2 = s n 2 = 1 n – 1 ∑ i = 1 n ( X i – X ¯ n ) 2 . {\displaystyle s^{2}=s_{n}^{2}={1 \über n-1}\sum _{i=1}^{n}(X_{i}-{\overline {X}}_{n})^{2}.}
Unbekannter Mittelwert, bekannte VarianzBearbeiten
Gegeben eine Normalverteilung mit unbekanntem Mittelwert μ aber bekannter Varianz 1, der Stichprobenmittelwert X ¯ {\displaystyle {\overline {X}}}
der Beobachtungen X 1 , … , X n {\displaystyle X_{1},\dots ,X_{n}}
hat die Verteilung N ( μ , 1 / n ) , {\displaystyle N(\mu ,1/n),}
während die zukünftige Beobachtung X n + 1 {\displaystyle X_{n+1}}
die Verteilung N ( μ , 1 ) hat. {\displaystyle N(\mu ,1).}
Nimmt man die Differenz davon, so hebt sich das μ auf und man erhält eine Normalverteilung der Varianz 1 + ( 1 / n ) , {\displaystyle 1+(1/n),}
also X n + 1 – X ¯ 1 + ( 1 / n ) ∼ N ( 0 , 1 ) . {\displaystyle {\frac {X_{n+1}-{\overline {X}}{\sqrt {1+(1/n)}}\sim N(0,1).}
Lösen für X n + 1 {\displaystyle X_{n+1}}
ergibt die Vorhersageverteilung N ( X ¯ , 1 + ( 1 / n ) ) , {\displaystyle N({\overline {X}},1+(1/n)),}
aus der man wie zuvor Intervalle berechnen kann. Dies ist ein prädiktives Konfidenzintervall in dem Sinne, dass, wenn man einen Quantilbereich von 100p% verwendet, bei wiederholter Anwendung dieser Berechnung die zukünftige Beobachtung X n + 1 {\displaystyle X_{n+1}}
in 100p% der Fälle in das vorhergesagte Intervall fallen.
Man beachte, dass diese Vorhersageverteilung konservativer ist als die Verwendung des geschätzten Mittelwertes X ¯ {\displaystyle {\overline {X}}}
und der bekannten Varianz 1, da hier die Varianz 1 + ( 1 / n ) {\displaystyle 1+(1/n)}
, was zu breiteren Intervallen führt. Dies ist notwendig, um die gewünschte Eigenschaft des Konfidenzintervalls zu erhalten.
Bekannter Mittelwert, unbekannte VarianzBearbeiten
Umgekehrt ergibt sich bei einer Normalverteilung mit bekanntem Mittelwert 0 und unbekannter Varianz σ 2 {\displaystyle \sigma ^{2}}
, die Stichprobenvarianz s 2 {\displaystyle s^{2}}
der Beobachtungen X 1 , … , X n {\displaystyle X_{1},\dots ,X_{n}}
hat, bis zur Skala, ein χ n – 1 2 {\displaystyle \scriptstyle \chi _{n-1}^{2}}
Verteilung; genauer gesagt: ( n – 1 ) s n 2 σ 2 ∼ χ n – 1 2 . {\displaystyle {\frac {(n-1)s_{n}^{2}}{\sigma ^{2}}}\sim \chi _{n-1}^{2}.}
während die zukünftige Beobachtung X n + 1 {\displaystyle X_{n+1}}
die Verteilung N ( 0 , σ 2 ) hat. {\displaystyle N(0,\sigma ^{2}).}
Nimmt man das Verhältnis zwischen der zukünftigen Beobachtung und der Standardabweichung der Stichprobe, so hebt sich das σ auf und es ergibt sich eine Student’s t-Verteilung mit n – 1 Freiheitsgraden: X n + 1 s ∼ T n – 1 . {\displaystyle {\frac {X_{n+1}}{s}}\sim T^{n-1}.}
Auflösung für X n + 1 {\displaystyle X_{n+1}}
ergibt die Vorhersageverteilung s T n – 1 , {\displaystyle sT^{n-1},}
aus der man die Intervalle wie zuvor berechnen kann.
Es ist zu beachten, dass diese Vorhersageverteilung konservativer ist als die Verwendung einer Normalverteilung mit der geschätzten Standardabweichung s {\displaystyle s}
und bekanntem Mittelwert 0, da sie die t-Verteilung anstelle der Normalverteilung verwendet und somit breitere Intervalle ergibt. Dies ist notwendig, damit die gewünschte Konfidenzintervalleigenschaft erhalten bleibt.
Unbekannter Mittelwert, unbekannte VarianzBearbeiten
Kombiniert man die obigen Angaben für eine Normalverteilung N ( μ , σ 2 ) {\displaystyle N(\mu ,\sigma ^{2})}
, wobei sowohl μ als auch σ2 unbekannt sind, ergibt die folgende Hilfsstatistik: X n + 1 – X ¯ n s n 1 + 1 / n ∼ T n – 1 . {\displaystyle {\frac {X_{n+1}-{\overline {X}}_{n}}{s_{n}{\sqrt {1+1/n}}}}\sim T^{n-1}.}
Diese einfache Kombination ist möglich, weil der Stichprobenmittelwert und die Stichprobenvarianz der Normalverteilung unabhängige Statistiken sind; dies gilt nur für die Normalverteilung und charakterisiert tatsächlich die Normalverteilung.
Lösung für X n + 1 {\displaystyle X_{n+1}}
ergibt die Vorhersageverteilung X ¯ n + s n 1 + 1 / n ⋅ T n – 1 . {\displaystyle {\overline {X}}_{n}+s_{n}{\sqrt {1+1/n}}\cdot T^{n-1}.}
Die Wahrscheinlichkeit von X n + 1 {\displaystyle X_{n+1}}
in ein gegebenes Intervall fällt, ist dann: Pr ( X ¯ n – T a s n 1 + ( 1 / n ) ≤ X n + 1 ≤ X ¯ n + T a s n 1 + ( 1 / n ) ) = p {\displaystyle \Pr \left({\overline {X}}_{n}-T_{a}s_{n}{\sqrt {1+(1/n)}}\leq X_{n+1}\leq {\overline {X}}_{n}+T_{a}s_{n}{\sqrt {1+(1/n)}}\,\right)=p}