Weitere Aufgaben für BW24.1 - 18

  1. Aufgabe

    Installieren Sie R und ein Frontend für R, z.B. R-Studio. (Installieren Sie möglichst nicht auf einem Netzwerklaufwerk, Clouodlaufwerk, OneDrive,… - das wird kompliziert!)

    Speichern Sie die Datei D01.csv in Ihrem Arbeitsverzeichnis. (Wenn Sie die Datei nicht speichern, sondern zunächst in einem Tabellenkalkulationsprogramm, z.B. Microsoft Excel, öffnen, und danach speichern, können viele Dinge schief gehen. Vermeiden Sie Umwege über Microsoft Excel! Falls Ihr Browser die Datei nicht speichern will, hilft es oft, mit der rechten Maustaste auf den Link zu klicken. Sehr oft erscheint dann ein Menü, in dem Sie »Speichern als…« oder »Link speichern…« wählen können.)

    Wenn Sie nicht wissen, welches Verzeichnis R gerade als Arbeitsverzeichnis verwendet, hilft das Kommando

    getwd()

    In RStudio können Sie Ihr Arbeitsverzeichnis auch über das Menü einstellen: Session / Set Working Directory / Choose Directory

    Laden Sie die Datei D01.csv mit dem Kommando

    D01 <- read.csv("D01.csv")

    Jetzt enthält die Variable D01 Ihren Datensatz. (Natürlich müssen Sie nicht D01 als Namen für den Datensatz verwenden. D01 ist nur ein Beispiel.) In dieser Übung werfen wir einen kurzen Blick auf den Datensatz:


    1. Benutzen Sie das Kommando nrow(D01) um festzustellen, wie viele Zeilen Ihr Datensatz hat. Wie viele Zeilen sind es?
    2. Benutzen Sie das Kommando names(D01) um die Namen der Variablen in diesem Datensatz zu ermitteln. Wie viele Variablen enthält Ihr Datensatz?
    3. Benutzen Sie das Kommando mean(D01$X4) um den Mittelwert der Variablen X4 in diesem Datensatz zu ermitteln.
    4. Benutzen Sie das Kommando median(D01$X4) um den Median der Variablen X4 in diesem Datensatz zu ermitteln.
    5. Benutzen Sie das Kommando sd(D01$X4) um die Standardabweichung der Variablen X4 in diesem Datensatz zu ermitteln. (Wenn Moodle sich über eine “incomplete answer” beklagt, prüfen Sie, ob Ihre Antwort im richtigen Format vorliegt. Abhängig von den Einstellungen in Moodle kann es sein, dass Moodle Dezimalzahlen z.B. als 3.14 erwartet (z.B. wenn Sie in Moodle als Sprache Englisch wählen), oder als 3,14 (wenn Sie in Moodle als Sprache z.B. Deutsch wählen).)

  2. Aufgabe

    Ihre Stichprobe der Zufallsvariablen XX enthält n=9n=9 unabhängige und normalverteilte Beobachtungen: X1,,X9X_1,\ldots,X_{9}. Sie suchen einen Schätzer für E[X]E[X]. Welche der folgenden Aussagen sind wahr?

    1. Der Schätzer X1+2X3-X_{1}+2X_{3} ist ein erwartungstreuer Schätzer für E[X]E[X].

      Ja / Nein

    2. Der Schätzer 16X116X2+16X4+16X6-\frac{1}{6}X_{1}-\frac{1}{6}X_{2}+\frac{1}{6}X_{4}+\frac{1}{6}X_{6} ist ein erwartungstreuer Schätzer für E[X]E[X].

      Ja / Nein

    3. Der Schätzer 45X325X5+45X635X8-\frac{4}{5}X_{3}-\frac{2}{5}X_{5}+\frac{4}{5}X_{6}-\frac{3}{5}X_{8} ist ein erwartungstreuer Schätzer für E[X]E[X].

      Ja / Nein

    4. Der Schätzer X8+X9-X_{8}+X_{9} ist ein erwartungstreuer Schätzer für E[X]E[X].

      Ja / Nein

    5. Der Schätzer 34X4+34X612X9\frac{3}{4}X_{4}+\frac{3}{4}X_{6}-\frac{1}{2}X_{9} dominiert X7-X_{7}.

      Ja / Nein

    6. Der Schätzer 32X3+32X6+X8-\frac{3}{2}X_{3}+\frac{3}{2}X_{6}+X_{8} dominiert X1-X_{1}.

      Ja / Nein



  3. Aufgabe

    Die Zufallsvariable XX hat eine Varianz von σX2=676\sigma^2_X=676. Sie haben vor, eine Stichprobe von nn unabhängigen und identisch verteilten Beobachtungen zu ziehen. Wie groß muss Ihre Stichprobe mindestens sein, damit die Varianz des Stichprobenmittelwertes σX2\sigma^2_{\bar{X}} nicht größer als 5252 ist? (Denken Sie daran: es gibt keine halben oder dreiviertel Stichprobenbeobachtungen.)


  4. Aufgabe

    Eine Zufallsvariable XX ist wie folgt verteilt:

    • P(X=A)=θP(X=A)=\theta
    • P(X=B)=θP(X=B)=\theta
    • P(X=C)=12θP(X=C)=1-2\theta

    wobei θ[0,1/2]\theta\in[0,1/2].

    Eine Stichprobe ergibt die folgenden Beobachtungen:

    {C,A,A,A,B,B}\{ C, A, A, A, B, B \}.

    Was ist der Maximum-Likelihood Schätzer für θ\theta?


  5. Aufgabe

    Eine Zufallsvariable XX folgt einer Exponentialverteilung mit Parameter λ\lambda.

    Die Dichtefunktion der Exponentialverteilung ist f(X)=λeλXf(X)=\lambda e^{-\lambda X} für X0X \ge 0.

    Eine Stichprobe ergibt die Beobachtungen {3,1,1}\{ 3, 1, 1 \}.

    Was ist der Maximum-Likelihood Schätzer für λ\lambda?


  6. Aufgabe

    Eine Zufallsvariable XX folgt einer Verteilung 𝒳θ\mathcal{X}_\theta mit Erwartungswert E(X)=5+θE(X)=5+\theta und Varianz 1/(5+θ)1/(5+\theta).

    Ihre Stichprobe enthält die folgenden Beobachtungen:

    {0,6,7,6,9}\{ 0,6,7,6,9 \}.

    Berechnen Sie den Momentenschätzer für θ\theta auf Basis des ersten Moments.


  7. Aufgabe

    Verwenden Sie die Stichprobe X aus der Datei D04.csv.

    X ist eine Stichprobe der Zufallsvariablen XX.

    Sie nehmen nun an, dass die Zufallsvariable XX einer Normalverteilung folgt: XN(μ,σ2)X \sim N(\mu,\sigma^2).


    1. Was ist die Untergrenze des 95%-Credible-Intervals für μ\mu?
    2. Was ist die Obergrenze des 95%-Credible-Intervals für μ\mu?
    3. Was ist die Untergrenze des 95%-Credible-Intervals für σ2\sigma^2?
    4. Was ist die Obergrenze des 95%-Credible-Intervals für σ2\sigma^2?
    5. Wie wahrscheinlich ist es etwa (in Prozent), dass μ\mu>-16.126?
    6. Wie wahrscheinlich ist es etwa (in Prozent), dass μ\mu im Intervall [-15.158,-14.671] liegt?

  8. Aufgabe

    Verwenden Sie in dieser Aufgabe ein Signifikanzniveau von 0.01.


    1. Stellen Sie sich vor, Sie führen einen zweiseitigen Test durch. Sie gehen davon aus, dass Ihre Teststatistik einer Standard-Normalverteilung folgt. Wie groß darf der absolute Betrag Ihrer Teststatistik maximal werden, ohne dass Sie Ihre Nullhypothese ablehnen müssen?
    2. Sie gehen davon aus, dass die Zufallsvariable XX einer Normalverteilung mit unbekanntem Mittelwert und Standardabweichung 4 folgt. In Ihrer Stichprobe mit 13 Beobachtungen finden Sie einen Stichprobenmittelwert von 4. Sie führen einen zweiseitigen Test durch. Ihre Nullhypothese ist, dass der Mittelwert von XX den Wert 0.2 hat. Wie groß ist der absolute Betrag Ihrer Teststatistik?
    3. Sie gehen weiter von einer Standardabweichung von 4 aus. Jetzt betrachten Sie eine Stichprobe mit 13 Beobachtungen und mit Stichprobenmittelwert 0.1. Die Nullhypothese Ihres zweiseitigen Tests ist weiter, dass der Mittelwert von XX den Wert 0.2 hat. Wie groß ist der pp-Wert (auf 4 Nachkommastellen gerundet)?

  9. Aufgabe

    Der Datensatz in der Datei DTW.csv enthält zwei Variablen: ZYS und ruk. Die Variable ruk gibt an, zu welcher Gruppe (JS oder WC) die Beobachtung ZYS gehört.

    Vergleichen Sie die beiden Gruppen JS und WC mit einem tt-Test.

    1. Ihre Nullhypothese ist, der Mittelwert von ZYS sei in beiden Gruppen gleich. Wie groß ist der pp-Wert für den tt-Test?
    2. Sie verwenden ein Signifikanzniveau von 5%. Können Sie Ihre Nullhypothese ablehnen? Ja / Nein
    3. Ihre Nullhypothese ist, der Mittelwert von ZYS sei in Gruppe JS größer als in Gruppe WC. Wie groß ist der pp-Wert für den tt-Test?
    4. Sie verwenden ein Signifikanzniveau von 5%. Können Sie Ihre Nullhypothese ablehnen? Ja / Nein
    5. Ihre Nullhypothese ist, der Mittelwert von ZYS sei in Gruppe WC größer als in Gruppe JS. Wie groß ist der pp-Wert für den tt-Test?
    6. Sie verwenden ein Signifikanzniveau von 5%. Können Sie Ihre Nullhypothese ablehnen? Ja / Nein


  10. Aufgabe

    Sie betrachten eine normalverteilte Zufallsvariable XN(μ,σ2)X \sim N(\mu,\sigma^2) mit unbekannter Varianz σ2\sigma^2. In Ihrer Stichprobe mit 19 Beobachtungen finden Sie einen Stichprobenmittelwert von 3 und eine Standardabweichung in der Stichprobe von 2.

    • Bestimmen Sie ein 95%-Konfidenzintervall für Ihre Schätzung des Erwartungswerts von XX: μ̂\hat{\mu}.

    1. Was ist die untere Grenze des Intervals?
    2. Was ist die obere Grenze des Intervals?

  11. Aufgabe

    Sie vergleichen die drei Merkmale EJ, GP, HX mit den drei Merkmalen RT, SF, VZ. Sie wollen prüfen, ob die drei Merkmale EJ, GP, HX von den drei Merkmalen RT, SF, VZ unabhängig sind.

    Die folgende Tabelle zeigt die Häufigkeiten, mit denen Sie Kombinationen der drei Merkmale EJ, GP, HX mit den drei Merkmalen RT, SF, VZ in Ihrer Stichprobe gefunden haben:

    Das folgende Kommando speichert eine solche Tabelle in der Variablen WB:

    WB <- rbind(c(22, 32, 34), c(6, 16, 28), c(7, 24, 22))

    Ihr Signifikanzniveau ist 0.1%. Ihre Nullhypothese ist, die Merkmale EJ, GP, HX sind von den Merkmalen RT, SF, VZ unabhängig.

    Testen Sie diese Nullhypothese mit einem Chi-Quadrat-Test.

    1. Welchen pp-Wert erhalten Sie (geben Sie mindestens 4 Nachkommastellen an)?
    2. Sie verwenden ein Signifikanzniveau von 0.1%. Können Sie Ihre Nullhypothese ablehnen? Ja / Nein


  12. Aufgabe

    Der Datensatz in der Datei DRE.csv enthält 34 paarweise Beobachtungen in den beiden Variablen PD und VG. Die Beobachtungen von PD und VG in der gleichen Zeile des Datensatzes gehören jeweils zur gleichen Beobachtungseinheit, sie bilden ein Paar.

    Vergleichen Sie die beiden Variablen PD und VG. Für Hypothesentests verwenden Sie einen Wilcoxon signed-rank Test.

    1. Was ist der Median der Differenz PD-VG?
    2. Ihre Nullhypothese ist, der Median der Differenz PD-VG sei Null. Wie groß ist der pp-Wert (geben Sie vier Nachkommastellen an) für den Wilcoxon signed-rank test?
    3. Sie verwenden ein Signifikanzniveau von 1%. Können Sie Ihre Nullhypothese ablehnen? Ja / Nein
    4. Ihre Nullhypothese ist, der Median der Differenz PD-VG sei positiv oder Null. Wie groß ist der pp-Wert (geben Sie vier Nachkommastellen an) für den Wilcoxon signed-rank test?
    5. Sie verwenden ein Signifikanzniveau von 1%. Können Sie Ihre Nullhypothese ablehnen? Ja / Nein
    6. Ihre Nullhypothese ist, der Median der Differenz PD-VG sei negativ oder Null. Wie groß ist der pp-Wert (geben Sie vier Nachkommastellen an) für den Wilcoxon signed-rank test?
    7. Sie verwenden ein Signifikanzniveau von 1%. Können Sie Ihre Nullhypothese ablehnen? Ja / Nein


  13. Aufgabe

    Der Datensatz in der Datei DFG.csv enthält zwei Variablen: BM und GT.

    Um GT als lineare Funktion von BM zu erklären, schätzen Sie die Gleichung

    GT =β0+β1= \beta_0 + \beta_1 BM +u{} + u.

    Sie nehmen an, dass uu normalverteilt ist.

    1. Welchen Wert schätzen Sie für β1\beta_1?
    2. Ihre Nullhypothese ist β1=0\beta_1=0. Bestimmen Sie (auf vier Nachkommastellen genau) den pp-Wert für den (zweiseitigen) Test.
    3. Sie verwenden ein Signifikanzniveau von 1 %. Können Sie Ihre Nullhypothese ablehnen? Ja / Nein
    4. Was ist die Untergrenze des 95% Konfidenzintervalls für β1\beta_1?
    5. Was ist die Obergrenze des 95% Konfidenzintervalls für β1\beta_1?


  14. Aufgabe

    Der Datensatz in der Datei DEJ.csv enthält 4 Variablen: GH, JE, LF, PM.

    Mit diesen Daten schätzen Sie den folgenden Zusammenhang:

    PM=β0+βGHGH+βJEJE+βLFLF+uPM = \beta_0 + \beta_{GH} GH + \beta_{JE} JE + \beta_{LF} LF + u.

    Sie nehmen an, dass uu normalverteilt ist.

    1. Welchen Wert schätzen Sie für βGH\beta_{GH}?
    2. Ihre Nullhypothese ist H0:βGH=0H_0: \beta_{GH} = 0. Bestimmen Sie (auf vier Nachkommastellen genau) den pp-Wert für den (zweiseitigen) Test.
    3. Sie verwenden ein Signifikanzniveau von 0.1%. Können Sie Ihre Nullhypothese ablehnen? Ja / Nein
    4. Sie haben keine a-priori Informationen über die Verteilung von βGH\beta_{GH} (Sie halten alle Werte für gleich wahrscheinlich). Was ist die Untergrenze des 95%-Credible-Interval für βGH\beta_{GH}?
    5. Was ist die Obergrenze des 95%-Credible-Interval für βGH\beta_{GH}?


  15. Aufgabe

    Sie untersuchen den Einfluss der beiden Variablen DT und GB auf die Variable VK. Sie haben den folgenden Zusammenhang geschätzt:

    VK=34DT+4GB2DTGB+ϵVK = 3 - 4 DT + 4 GB - 2 DT \cdot GB + \epsilon

    VKVK ist Ihre abhängige Variable. Die Variablen DTDT und GBGB sind Ihre unabhängigen Variablen. ϵ\epsilon ist das Residuum.

    1. Was ist der marginale Effekt von DT auf VK wenn GB den Wert 0 hat?
    2. Was ist der marginale Effekt von GB auf VK wenn DT den Wert 0 hat?
    3. Was ist der marginale Effekt von DT auf VK wenn GB den Wert 1 hat?
    4. Was ist der marginale Effekt von GB auf VK wenn DT den Wert -2 hat?


  16. Aufgabe

    Sie betrachten folgenden Zusammenhang:

    Y=β0+β1X1+β2X2+β3X1X2+uY = \beta_0 + \beta_1 X_1 + \beta_2 X_2 + \beta_3 X_1 X_2 + u

    Die Variable X1X_1 bildet zwei Situationen ab, L und Q: Im Fall L ist X1=0X_1=0. Im Fall Q ist X1=1X_1=1.

    Auch die Variable X2X_2 bildet zwei Situationen ab, S und Z: Im Fall S ist X2=0X_2=0. Im Fall Z ist X2=1X_2=1.

    Die Mittelwerte von YY für die vier möglichen Kombinationen von L und Q und S und Z sind in der folgenden Tabelle angegeben:


    1. Wie groß ist β0\beta_0?
    2. Wie groß ist β1\beta_1?
    3. Wie groß ist β2\beta_2?
    4. Wie groß ist β3\beta_3?

  17. Aufgabe

    Verwenden Sie die Daten aus der Datei DUX.csv. Bestimmen Sie bei den folgenden Fragen zunächst das passende Modell. Welcher (ggf. nicht lineare) Zusammenhang zwischen unabhängiger und abhängiger Variablen ist angemessen? Beantworten Sie dann die Fragen.


    1. Verwenden Sie ein Modell, in dem sich JG um einen festen Prozentsatz ändert, wenn sich BP um einen festen Betrag ändert. Um wieviel Prozent ändert sich JG etwa, wenn sich BP um eine Einheit ändert?
    2. Verwenden Sie ein Modell, in dem die Elastizität von NC bezüglich DA konstant ist. Was ist die Elastizität von NC bezüglich DA?
    3. Verwenden Sie ein Modell, in dem der marginale Effekt von ET auf SV konstant ist. Was ist der marginale Effekt von ET auf SV?
    4. Verwenden Sie ein Modell, in dem sich ZW um einen festen Betrag ändert, wenn sich HR um einen festen Prozentsatz ändert. Um welchen Betrag ändert sich ZW etwa, wenn sich HR um 1 Prozent ändert?

  18. Aufgabe

    In dieser Frage verwenden Sie ein Signifikanzniveau von 0.05.

    1. Sie führen einen zweiseitigen Test durch. Sie gehen davon aus, dass Ihre Teststatistik einer Standard-Normalverteilung folgt. Wie groß darf der absolute Betrag Ihrer Teststatistik maximal werden, ohne dass Sie Ihre Nullhypothese ablehnen müssen? (Sie können diesen Wert mit R berechnen.)
    2. Sie gehen davon aus, dass die Zufallsvariable XX einer Normalverteilung mit unbekanntem Mittelwert und Standardabweichung 3 folgt. In Ihrer Stichprobe mit 27 Beobachtungen finden Sie einen Stichprobenmittelwert von 5. Sie führen einen zweiseitigen Test durch. Ihre Nullhypothese ist, dass der Mittelwert von XX den Wert 6 hat. Wie groß ist der absolute Betrag Ihrer Teststatistik?
    3. Lehnen Sie Ihre Nullhypothese ab? Ja / Nein
    4. Sie nehmen weiter an, dass die Zufallsvariable XX einer Normalverteilung mit unbekanntem Mittelwert und Standardabweichung 3 folgt. In Ihrer Stichprobe mit 27 Beoachtungen finden Sie einen Stichprobenmittelwert von 2. Ihre Nullhypothese ist weiter, dass XX einen Mittelwert von 6 hat. Wie groß ist der pp-Wert für einen zweiseitigen Test (geben Sie mindestens 4 Nachkommastellen an)?
    5. Lehnen Sie mit dieser Stichprobe Ihre Nullhypothese ab? Ja / Nein


  19. Aufgabe

    Der Datensatz in der Datei DSU.csv enthält vier Variablen: F, J, V und X.

    Mit diesen Daten schätzen Sie den folgenden Zusammenhang:

    X=β0+βFF+βJJ+βVV+uX = \beta_0 + \beta_{F} F + \beta_{J} J + \beta_{V} V + u.

    Sie nehmen an, dass uu normalverteilt ist.

    1. Welchen Wert schätzen Sie mit dem OLS Schätzer für βF\beta_{F}?
    2. Ihre Nullhypothese ist H0:βF=0H_0: \beta_{F} = 0. Bestimmen Sie (auf vier Nachkommastellen genau) den pp-Wert für den (zweiseitigen) Test.
    3. Sie verwenden ein Signifikanzniveau von 0.1%. Können Sie Ihre Nullhypothese ablehnen? Ja / Nein
    4. Sie haben keine a-priori Informationen über die Verteilung von βF\beta_{F}. Was ist die Untergrenze des 95%-Credible-Interval für βF\beta_{F}?
    5. Was ist die Obergrenze des 95%-Credible-Intervals für βF\beta_{F}?


  20. Aufgabe

    Der Datensatz in der Datei DHL.csv enthält vier Variablen: C, K, V und Z.

    Sie betrachten folgenden Zusammenhang:

    Z=β0+βCC+βKK+βCKC×K+βVV+uZ = \beta_0 + \beta_{C}C+\beta_{K}K+\beta_{C K}C\times K+\beta_{V}V + u.

    Sie nehmen an, dass uu normalverteilt ist. Verwenden Sie den OLS Schätzer, um die Koeffizienten β0\beta_0, βC\beta_{C}, βK\beta_{K}, βCK\beta_{C K} und βV\beta_{V} zu schätzen.

    1. Wie groß ist der marginale Effekt von CC auf ZZ wenn KK den Wert 0 hat?
    2. Wie groß ist der marginale Effekt von KK auf ZZ wenn CC den Wert 0 hat?
    3. Wie groß ist der marginale Effekt von CC auf ZZ wenn KK den Wert 1 hat?
    4. Wie groß ist der marginale Effekt von KK auf ZZ wenn CC den Wert -2 hat?


  21. Aufgabe

    Der Datensatz in der Datei DLX.csv enthält zwei Variablen: lj und fn. Die Variable fn gibt an, zu welcher Gruppe (CZ oder EG) die Beobachtung lj gehört.

    Vergleichen Sie die beiden Gruppen CZ und EG mit einem tt-Test.

    1. Ihre Nullhypothese ist, der Mittelwert von lj sei in beiden Gruppen gleich. Wie groß ist der pp-Wert für den tt-Test (geben Sie bitte vier Nachkommastellen an)?
    2. Sie verwenden ein Signifikanzniveau von 10%. Können Sie Ihre Nullhypothese ablehnen? Ja / Nein
    3. Ihre Nullhypothese ist, der Mittelwert von lj sei in Gruppe CZ größer als in Gruppe EG. Wie groß ist der pp-Wert für den tt-Test (geben Sie bitte vier Nachkommastellen an)?
    4. Sie verwenden ein Signifikanzniveau von 10%. Können Sie Ihre Nullhypothese ablehnen? Ja / Nein
    5. Ihre Nullhypothese ist, der Mittelwert von lj sei in Gruppe EG größer als in Gruppe CZ. Wie groß ist der pp-Wert für den tt-Test (geben Sie bitte vier Nachkommastellen an)?
    6. Sie verwenden ein Signifikanzniveau von 10%. Können Sie Ihre Nullhypothese ablehnen? Ja / Nein


  22. Aufgabe

    Sie betrachten eine normalverteilte Zufallsvariable XN(μ,σ2)X \sim N(\mu,\sigma^2) mit unbekannter Varianz σ2\sigma^2. In Ihrer Stichprobe mit 18 Beobachtungen finden Sie einen Stichprobenmittelwert von 6 und eine Standardabweichung in der Stichprobe von 3.

    Bestimmen Sie ein 95%-Konfidenzintervall für μ\mu.

    1. Was ist die untere Grenze des 95%-Konfidenzintervals für μ\mu?
    2. Was ist die obere Grenze des 95%-Konfidenzintervals für μ\mu?
    3. Sie verwenden ein Signifikanzniveau von 5%. Ihre Nullhypothese ist μ0=12\mu_0=12. Können Sie Ihre Nullhypothese ablehnen? Ja / Nein


  23. Aufgabe

    Ein Merkmal in Ihrer Stichprobe kann fünf verschiedene Werte haben: DV, LA, QS, RH, XK.

    Die folgende Tabelle zeigt in der Spalte Häufigkeit die Häufigkeiten, mit denen Sie die fünf Werte DV, LA, QS, RH, XK in Ihrer Stichprobe beobachtet haben.

    Sie wollen eine Theorie testen. Nach dieser Theorie treten die fünf Werte DV, LA, QS, RH, XK mit Wahrscheinlichkeiten auf, die Sie in der Spalte Erwartete Wahrscheinlichkeit finden:

       Häufigkeit       Erwartete Wahrscheinlichkeit   
    DV 5 1/9
    LA 36 2/9
    QS 36 2/9
    RH 17 2/9
    XK 32 2/9

    Mit anderen Worten: Sie haben 5 mal den Wert DV beobachtet. Sie erwarten, dass in der Grundgesamtheit dieser Wert mit Wahrscheinlichkeit 1/9 auftritt. Sie haben 36 mal den Wert LA beobachtet. Sie erwarten, dass in der Grundgesamtheit dieser Wert mit Wahrscheinlichkeit 2/9 auftritt. Sie haben 36 mal den Wert QS beobachtet. Sie erwarten, dass in der Grundgesamtheit dieser Wert mit Wahrscheinlichkeit 2/9 auftritt. Sie haben 17 mal den Wert RH beobachtet. Sie erwarten, dass in der Grundgesamtheit dieser Wert mit Wahrscheinlichkeit 2/9 auftritt. Sie haben 32 mal den Wert XK beobachtet. Sie erwarten, dass in der Grundgesamtheit dieser Wert mit Wahrscheinlichkeit 2/9 auftritt. .

    Mit dem folgenden Kommando speichern Sie einen Vektor, der die beobachteten Häufigkeiten darstellt, in der Variablen CD:

    CD <- c(5, 36, 36, 17, 32)

    Mit dem folgenden Kommando speichern Sie einen Vektor, der die erwarteten Wahrscheinlichkeiten darstellt, in der Variablen przj:

    przj <- c(1/9, 2/9, 2/9, 2/9, 2/9)

    Ihr Signifikanzniveau ist 5%. Ihre Nullhypothese ist, die fünf Werte DV, LA, QS, RH, XK sind entsprechend den Wahrscheinlichkeiten, die Sie in der Spalte Erwartete Wahrscheinlichkeit finden, verteilt.

    Testen Sie diese Nullhypothese mit einem Chi-Quadrat-Anpassungs-Test.

    1. Welchen pp-Wert erhalten Sie?
    2. Sie verwenden ein Signifikanzniveau von 5%. Können Sie Ihre Nullhypothese ablehnen? Ja / Nein