Weitere Aufgaben für BW24.1 - 14
-
Aufgabe
Installieren Sie R und ein Frontend für R, z.B. R-Studio. (Installieren Sie möglichst nicht auf einem Netzwerklaufwerk, Clouodlaufwerk, OneDrive,… - das wird kompliziert!)
Speichern Sie die Datei D01.csv in Ihrem Arbeitsverzeichnis. (Wenn Sie die Datei nicht speichern, sondern zunächst in einem Tabellenkalkulationsprogramm, z.B. Microsoft Excel, öffnen, und danach speichern, können viele Dinge schief gehen. Vermeiden Sie Umwege über Microsoft Excel! Falls Ihr Browser die Datei nicht speichern will, hilft es oft, mit der rechten Maustaste auf den Link zu klicken. Sehr oft erscheint dann ein Menü, in dem Sie »Speichern als…« oder »Link speichern…« wählen können.)
Wenn Sie nicht wissen, welches Verzeichnis R gerade als Arbeitsverzeichnis verwendet, hilft das Kommando
getwd()
In RStudio können Sie Ihr Arbeitsverzeichnis auch über das Menü einstellen: Session / Set Working Directory / Choose Directory
Laden Sie die Datei
D01.csv
mit dem KommandoD01 <- read.csv("D01.csv")
Jetzt enthält die Variable
D01
Ihren Datensatz. (Natürlich müssen Sie nichtD01
als Namen für den Datensatz verwenden.D01
ist nur ein Beispiel.) In dieser Übung werfen wir einen kurzen Blick auf den Datensatz:
-
Benutzen Sie das Kommando
nrow(D01)
um festzustellen, wie viele Zeilen Ihr Datensatz hat. Wie viele Zeilen sind es? -
Benutzen Sie das Kommando
names(D01)
um die Namen der Variablen in diesem Datensatz zu ermitteln. Wie viele Variablen enthält Ihr Datensatz? -
Benutzen Sie das Kommando
mean(D01$X3)
um den Mittelwert der VariablenX3
in diesem Datensatz zu ermitteln. -
Benutzen Sie das Kommando
median(D01$X3)
um den Median der VariablenX3
in diesem Datensatz zu ermitteln. -
Benutzen Sie das Kommando
sd(D01$X3)
um die Standardabweichung der VariablenX3
in diesem Datensatz zu ermitteln. (Wenn Moodle sich über eine “incomplete answer” beklagt, prüfen Sie, ob Ihre Antwort im richtigen Format vorliegt. Abhängig von den Einstellungen in Moodle kann es sein, dass Moodle Dezimalzahlen z.B. als3.14
erwartet (z.B. wenn Sie in Moodle als Sprache Englisch wählen), oder als3,14
(wenn Sie in Moodle als Sprache z.B. Deutsch wählen).)
-
Benutzen Sie das Kommando
-
Aufgabe
Ihre Stichprobe der Zufallsvariablen enthält unabhängige und normalverteilte Beobachtungen: . Sie suchen einen Schätzer für . Welche der folgenden Aussagen sind wahr?
Der Schätzer ist ein erwartungstreuer Schätzer für .
Ja / Nein
Der Schätzer ist ein erwartungstreuer Schätzer für .
Ja / Nein
Der Schätzer ist ein erwartungstreuer Schätzer für .
Ja / Nein
Der Schätzer ist ein erwartungstreuer Schätzer für .
Ja / Nein
Der Schätzer dominiert .
Ja / Nein
Der Schätzer dominiert .
Ja / Nein
-
Aufgabe
Die Zufallsvariable hat eine Varianz von . Sie haben vor, eine Stichprobe von unabhängigen und identisch verteilten Beobachtungen zu ziehen. Wie groß muss Ihre Stichprobe mindestens sein, damit die Varianz des Stichprobenmittelwertes nicht größer als ist? (Denken Sie daran: es gibt keine halben oder dreiviertel Stichprobenbeobachtungen.)
-
Aufgabe
Eine Zufallsvariable ist wie folgt verteilt:
wobei .
Eine Stichprobe ergibt die folgenden Beobachtungen:
.
Was ist der Maximum-Likelihood Schätzer für ?
-
Aufgabe
Eine Zufallsvariable folgt einer Exponentialverteilung mit Parameter .
Die Dichtefunktion der Exponentialverteilung ist für .
Eine Stichprobe ergibt die Beobachtungen .
Was ist der Maximum-Likelihood Schätzer für ?
-
Aufgabe
Eine Zufallsvariable folgt einer Verteilung mit Erwartungswert und Varianz .
Ihre Stichprobe enthält die folgenden Beobachtungen:
.
Berechnen Sie den Momentenschätzer für auf Basis des ersten Moments.
-
Aufgabe
Verwenden Sie die Stichprobe
X
aus der Datei D04.csv.X
ist eine Stichprobe der Zufallsvariablen .Sie nehmen nun an, dass die Zufallsvariable einer Normalverteilung folgt: .
- Was ist die Untergrenze des 95%-Credible-Intervals für ?
- Was ist die Obergrenze des 95%-Credible-Intervals für ?
- Was ist die Untergrenze des 95%-Credible-Intervals für ?
- Was ist die Obergrenze des 95%-Credible-Intervals für ?
- Wie wahrscheinlich ist es etwa (in Prozent), dass >-17.625?
- Wie wahrscheinlich ist es etwa (in Prozent), dass im Intervall [-16.520,-16.162] liegt?
-
Aufgabe
Verwenden Sie in dieser Aufgabe ein Signifikanzniveau von 0.01.
- Stellen Sie sich vor, Sie führen einen zweiseitigen Test durch. Sie gehen davon aus, dass Ihre Teststatistik einer Standard-Normalverteilung folgt. Wie groß darf der absolute Betrag Ihrer Teststatistik maximal werden, ohne dass Sie Ihre Nullhypothese ablehnen müssen?
- Sie gehen davon aus, dass die Zufallsvariable einer Normalverteilung mit unbekanntem Mittelwert und Standardabweichung 3 folgt. In Ihrer Stichprobe mit 14 Beobachtungen finden Sie einen Stichprobenmittelwert von -0.004. Sie führen einen zweiseitigen Test durch. Ihre Nullhypothese ist, dass der Mittelwert von den Wert 6 hat. Wie groß ist der absolute Betrag Ihrer Teststatistik?
- Sie gehen weiter von einer Standardabweichung von 3 aus. Jetzt betrachten Sie eine Stichprobe mit 14 Beobachtungen und mit Stichprobenmittelwert -10. Die Nullhypothese Ihres zweiseitigen Tests ist weiter, dass der Mittelwert von den Wert 6 hat. Wie groß ist der -Wert (auf 4 Nachkommastellen gerundet)?
-
Aufgabe
Der Datensatz in der Datei DMK.csv enthält zwei Variablen:
TEX
undsvj
. Die Variablesvj
gibt an, zu welcher Gruppe (AB oder JM) die BeobachtungTEX
gehört.Vergleichen Sie die beiden Gruppen AB und JM mit einem -Test.
- Ihre Nullhypothese ist, der Mittelwert von TEX sei in beiden Gruppen gleich. Wie groß ist der -Wert für den -Test?
- Sie verwenden ein Signifikanzniveau von 1%. Können Sie Ihre Nullhypothese ablehnen? Ja / Nein
- Ihre Nullhypothese ist, der Mittelwert von TEX sei in Gruppe AB größer als in Gruppe JM. Wie groß ist der -Wert für den -Test?
- Sie verwenden ein Signifikanzniveau von 1%. Können Sie Ihre Nullhypothese ablehnen? Ja / Nein
- Ihre Nullhypothese ist, der Mittelwert von TEX sei in Gruppe JM größer als in Gruppe AB. Wie groß ist der -Wert für den -Test?
- Sie verwenden ein Signifikanzniveau von 1%. Können Sie Ihre Nullhypothese ablehnen? Ja / Nein
-
Aufgabe
Sie betrachten eine normalverteilte Zufallsvariable mit unbekannter Varianz . In Ihrer Stichprobe mit 14 Beobachtungen finden Sie einen Stichprobenmittelwert von 11 und eine Standardabweichung in der Stichprobe von 1.
- Bestimmen Sie ein 95%-Konfidenzintervall für Ihre Schätzung des Erwartungswerts von : .
- Was ist die untere Grenze des Intervals?
- Was ist die obere Grenze des Intervals?
-
Aufgabe
Sie vergleichen die drei Merkmale AX, BH, CW mit den drei Merkmalen FQ, MS, PK. Sie wollen prüfen, ob die drei Merkmale AX, BH, CW von den drei Merkmalen FQ, MS, PK unabhängig sind.Die folgende Tabelle zeigt die Häufigkeiten, mit denen Sie Kombinationen der drei Merkmale AX, BH, CW mit den drei Merkmalen FQ, MS, PK in Ihrer Stichprobe gefunden haben:
Das folgende Kommando speichert eine solche Tabelle in der Variablen
ZN
:ZN <- rbind(c(16, 36, 27), c(24, 8, 9), c(22, 17, 11))
Ihr Signifikanzniveau ist 1%. Ihre Nullhypothese ist, die Merkmale AX, BH, CW sind von den Merkmalen FQ, MS, PK unabhängig.
Testen Sie diese Nullhypothese mit einem Chi-Quadrat-Test.
- Welchen -Wert erhalten Sie (geben Sie mindestens 4 Nachkommastellen an)?
- Sie verwenden ein Signifikanzniveau von 1%. Können Sie Ihre Nullhypothese ablehnen? Ja / Nein
-
Aufgabe
Der Datensatz in der Datei DYQ.csv enthält
24
paarweise Beobachtungen in den beiden VariablenRX
undZD
. Die Beobachtungen vonRX
undZD
in der gleichen Zeile des Datensatzes gehören jeweils zur gleichen Beobachtungseinheit, sie bilden ein Paar.Vergleichen Sie die beiden Variablen RX und ZD. Für Hypothesentests verwenden Sie einen Wilcoxon signed-rank Test.
- Was ist der Median der Differenz
RX-ZD
? - Ihre Nullhypothese ist, der Median der Differenz
RX-ZD
sei Null. Wie groß ist der -Wert (geben Sie vier Nachkommastellen an) für den Wilcoxon signed-rank test? - Sie verwenden ein Signifikanzniveau von 10%. Können Sie Ihre Nullhypothese ablehnen? Ja / Nein
- Ihre Nullhypothese ist, der Median der Differenz
RX-ZD
sei positiv oder Null. Wie groß ist der -Wert (geben Sie vier Nachkommastellen an) für den Wilcoxon signed-rank test? - Sie verwenden ein Signifikanzniveau von 10%. Können Sie Ihre Nullhypothese ablehnen? Ja / Nein
- Ihre Nullhypothese ist, der Median der Differenz
RX-ZD
sei negativ oder Null. Wie groß ist der -Wert (geben Sie vier Nachkommastellen an) für den Wilcoxon signed-rank test? - Sie verwenden ein Signifikanzniveau von 10%. Können Sie Ihre Nullhypothese ablehnen? Ja / Nein
- Was ist der Median der Differenz
-
Aufgabe
Der Datensatz in der Datei DFG.csv enthält zwei Variablen:
LW
undXT
.Um
XT
als lineare Funktion vonLW
zu erklären, schätzen Sie die GleichungXT LW .
Sie nehmen an, dass normalverteilt ist.
- Welchen Wert schätzen Sie für ?
- Ihre Nullhypothese ist . Bestimmen Sie (auf vier Nachkommastellen genau) den -Wert für den (zweiseitigen) Test.
- Sie verwenden ein Signifikanzniveau von 5 %. Können Sie Ihre Nullhypothese ablehnen? Ja / Nein
- Was ist die Untergrenze des 95% Konfidenzintervalls für ?
- Was ist die Obergrenze des 95% Konfidenzintervalls für ?
-
Aufgabe
Der Datensatz in der Datei DCF.csv enthält 3 Variablen:
DF, QC, TH
.Mit diesen Daten schätzen Sie den folgenden Zusammenhang:
.
Sie nehmen an, dass normalverteilt ist.
- Welchen Wert schätzen Sie für ?
- Ihre Nullhypothese ist . Bestimmen Sie (auf vier Nachkommastellen genau) den -Wert für den (zweiseitigen) Test.
- Sie verwenden ein Signifikanzniveau von 5%. Können Sie Ihre Nullhypothese ablehnen? Ja / Nein
- Sie haben keine a-priori Informationen über die Verteilung von (Sie halten alle Werte für gleich wahrscheinlich). Was ist die Untergrenze des 95%-Credible-Interval für ?
- Was ist die Obergrenze des 95%-Credible-Interval für ?
-
Aufgabe
Sie untersuchen den Einfluss der beiden Variablen LW und MB auf die Variable PK. Sie haben den folgenden Zusammenhang geschätzt:
ist Ihre abhängige Variable. Die Variablen und sind Ihre unabhängigen Variablen. ist das Residuum.
- Was ist der marginale Effekt von LW auf PK wenn MB den Wert 0 hat?
- Was ist der marginale Effekt von MB auf PK wenn LW den Wert 0 hat?
- Was ist der marginale Effekt von LW auf PK wenn MB den Wert -3 hat?
- Was ist der marginale Effekt von MB auf PK wenn LW den Wert 3 hat?
-
Aufgabe
Sie betrachten folgenden Zusammenhang:
Die Variable bildet zwei Situationen ab, S und W: Im Fall S ist . Im Fall W ist .
Auch die Variable bildet zwei Situationen ab, X und Z: Im Fall X ist . Im Fall Z ist .
Die Mittelwerte von für die vier möglichen Kombinationen von S und W und X und Z sind in der folgenden Tabelle angegeben:
- Wie groß ist ?
- Wie groß ist ?
- Wie groß ist ?
- Wie groß ist ?
-
Aufgabe
Verwenden Sie die Daten aus der Datei DUN.csv. Bestimmen Sie bei den folgenden Fragen zunächst das passende Modell. Welcher (ggf. nicht lineare) Zusammenhang zwischen unabhängiger und abhängiger Variablen ist angemessen? Beantworten Sie dann die Fragen.
-
Verwenden Sie ein Modell, in dem sich
QM
um einen festen Prozentsatz ändert, wenn sichBT
um einen festen Betrag ändert. Um wieviel Prozent ändert sichQM
etwa, wenn sichBT
um eine Einheit ändert? -
Verwenden Sie ein Modell, in dem die Elastizität von
RJ
bezüglichKC
konstant ist. Was ist die Elastizität vonRJ
bezüglichKC
? -
Verwenden Sie ein Modell, in dem der marginale Effekt von
LE
aufWG
konstant ist. Was ist der marginale Effekt vonLE
aufWG
? -
Verwenden Sie ein Modell, in dem sich
XS
um einen festen Betrag ändert, wenn sichNZ
um einen festen Prozentsatz ändert. Um welchen Betrag ändert sichXS
etwa, wenn sichNZ
um 1 Prozent ändert?
-
Verwenden Sie ein Modell, in dem sich
-
Aufgabe
In dieser Frage verwenden Sie ein Signifikanzniveau von 0.1.
- Sie führen einen zweiseitigen Test durch. Sie gehen davon aus, dass Ihre Teststatistik einer Standard-Normalverteilung folgt. Wie groß darf der absolute Betrag Ihrer Teststatistik maximal werden, ohne dass Sie Ihre Nullhypothese ablehnen müssen? (Sie können diesen Wert mit R berechnen.)
- Sie gehen davon aus, dass die Zufallsvariable einer Normalverteilung mit unbekanntem Mittelwert und Standardabweichung 3 folgt. In Ihrer Stichprobe mit 29 Beobachtungen finden Sie einen Stichprobenmittelwert von -9. Sie führen einen zweiseitigen Test durch. Ihre Nullhypothese ist, dass der Mittelwert von den Wert 20 hat. Wie groß ist der absolute Betrag Ihrer Teststatistik?
- Lehnen Sie Ihre Nullhypothese ab? Ja / Nein
- Sie nehmen weiter an, dass die Zufallsvariable einer Normalverteilung mit unbekanntem Mittelwert und Standardabweichung 3 folgt. In Ihrer Stichprobe mit 29 Beoachtungen finden Sie einen Stichprobenmittelwert von -9. Ihre Nullhypothese ist weiter, dass einen Mittelwert von 20 hat. Wie groß ist der -Wert für einen zweiseitigen Test (geben Sie mindestens 4 Nachkommastellen an)?
- Lehnen Sie mit dieser Stichprobe Ihre Nullhypothese ab? Ja / Nein
-
Aufgabe
Der Datensatz in der Datei DSU.csv enthält vier Variablen:
A, C, D und K
.Mit diesen Daten schätzen Sie den folgenden Zusammenhang:
.
Sie nehmen an, dass normalverteilt ist.
- Welchen Wert schätzen Sie mit dem OLS Schätzer für ?
- Ihre Nullhypothese ist . Bestimmen Sie (auf vier Nachkommastellen genau) den -Wert für den (zweiseitigen) Test.
- Sie verwenden ein Signifikanzniveau von 5%. Können Sie Ihre Nullhypothese ablehnen? Ja / Nein
- Sie haben keine a-priori Informationen über die Verteilung von . Was ist die Untergrenze des 95%-Credible-Interval für ?
- Was ist die Obergrenze des 95%-Credible-Intervals für ?
-
Aufgabe
Der Datensatz in der Datei DHL.csv enthält vier Variablen:
A, G, N und R
.Sie betrachten folgenden Zusammenhang:
.
Sie nehmen an, dass normalverteilt ist. Verwenden Sie den OLS Schätzer, um die Koeffizienten , , , und zu schätzen.
- Wie groß ist der marginale Effekt von auf wenn den Wert 0 hat?
- Wie groß ist der marginale Effekt von auf wenn den Wert 0 hat?
- Wie groß ist der marginale Effekt von auf wenn den Wert -3 hat?
- Wie groß ist der marginale Effekt von auf wenn den Wert -2 hat?
-
Aufgabe
Der Datensatz in der Datei DGA.csv enthält zwei Variablen:
zb
undyf
. Die Variableyf
gibt an, zu welcher Gruppe (RG oder WT) die Beobachtungzb
gehört.Vergleichen Sie die beiden Gruppen RG und WT mit einem -Test.
- Ihre Nullhypothese ist, der Mittelwert von zb sei in beiden Gruppen gleich. Wie groß ist der -Wert für den -Test (geben Sie bitte vier Nachkommastellen an)?
- Sie verwenden ein Signifikanzniveau von 0.1%. Können Sie Ihre Nullhypothese ablehnen? Ja / Nein
- Ihre Nullhypothese ist, der Mittelwert von zb sei in Gruppe RG größer als in Gruppe WT. Wie groß ist der -Wert für den -Test (geben Sie bitte vier Nachkommastellen an)?
- Sie verwenden ein Signifikanzniveau von 0.1%. Können Sie Ihre Nullhypothese ablehnen? Ja / Nein
- Ihre Nullhypothese ist, der Mittelwert von zb sei in Gruppe WT größer als in Gruppe RG. Wie groß ist der -Wert für den -Test (geben Sie bitte vier Nachkommastellen an)?
- Sie verwenden ein Signifikanzniveau von 0.1%. Können Sie Ihre Nullhypothese ablehnen? Ja / Nein
-
Aufgabe
Sie betrachten eine normalverteilte Zufallsvariable mit unbekannter Varianz . In Ihrer Stichprobe mit 21 Beobachtungen finden Sie einen Stichprobenmittelwert von 9 und eine Standardabweichung in der Stichprobe von 6.
Bestimmen Sie ein 99%-Konfidenzintervall für .
- Was ist die untere Grenze des 99%-Konfidenzintervals für ?
- Was ist die obere Grenze des 99%-Konfidenzintervals für ?
- Sie verwenden ein Signifikanzniveau von 1%. Ihre Nullhypothese ist . Können Sie Ihre Nullhypothese ablehnen? Ja / Nein
-
Aufgabe
Ein Merkmal in Ihrer Stichprobe kann sechs verschiedene Werte haben: CQ, DK, GY, HR, XB, ZT.Die folgende Tabelle zeigt in der Spalte Häufigkeit die Häufigkeiten, mit denen Sie die sechs Werte CQ, DK, GY, HR, XB, ZT in Ihrer Stichprobe beobachtet haben.
Sie wollen eine Theorie testen. Nach dieser Theorie treten die sechs Werte CQ, DK, GY, HR, XB, ZT mit Wahrscheinlichkeiten auf, die Sie in der Spalte Erwartete Wahrscheinlichkeit finden:
Häufigkeit Erwartete Wahrscheinlichkeit CQ 5 2/12 DK 10 3/12 GY 5 3/12 HR 16 1/12 XB 13 1/12 ZT 7 2/12 Mit anderen Worten: Sie haben 5 mal den Wert CQ beobachtet. Sie erwarten, dass in der Grundgesamtheit dieser Wert mit Wahrscheinlichkeit 2/12 auftritt. Sie haben 10 mal den Wert DK beobachtet. Sie erwarten, dass in der Grundgesamtheit dieser Wert mit Wahrscheinlichkeit 3/12 auftritt. Sie haben 5 mal den Wert GY beobachtet. Sie erwarten, dass in der Grundgesamtheit dieser Wert mit Wahrscheinlichkeit 3/12 auftritt. Sie haben 16 mal den Wert HR beobachtet. Sie erwarten, dass in der Grundgesamtheit dieser Wert mit Wahrscheinlichkeit 1/12 auftritt. Sie haben 13 mal den Wert XB beobachtet. Sie erwarten, dass in der Grundgesamtheit dieser Wert mit Wahrscheinlichkeit 1/12 auftritt. Sie haben 7 mal den Wert ZT beobachtet. Sie erwarten, dass in der Grundgesamtheit dieser Wert mit Wahrscheinlichkeit 2/12 auftritt. .
Mit dem folgenden Kommando speichern Sie einen Vektor, der die beobachteten Häufigkeiten darstellt, in der Variablen
AZ
:AZ <- c(5, 10, 5, 16, 13, 7)
Mit dem folgenden Kommando speichern Sie einen Vektor, der die erwarteten Wahrscheinlichkeiten darstellt, in der Variablen
prly
:prly <- c(2/12, 3/12, 3/12, 1/12, 1/12, 2/12)
Ihr Signifikanzniveau ist 1%. Ihre Nullhypothese ist, die sechs Werte CQ, DK, GY, HR, XB, ZT sind entsprechend den Wahrscheinlichkeiten, die Sie in der Spalte Erwartete Wahrscheinlichkeit finden, verteilt.
Testen Sie diese Nullhypothese mit einem Chi-Quadrat-Anpassungs-Test.
- Welchen -Wert erhalten Sie?
- Sie verwenden ein Signifikanzniveau von 1%. Können Sie Ihre Nullhypothese ablehnen? Ja / Nein