{ "cells": [ { "cell_type": "markdown", "id": "1bd16b8f-9a3f-4173-8168-ba9e10ea99c7", "metadata": {}, "source": [ "## Inferenz für die Standardabweichung der Grundgesamtheit\n", "----------------------------------------" ] }, { "cell_type": "markdown", "id": "cf5934a4-1737-49e0-880c-14a2a5abde8c", "metadata": {}, "source": [ "Bisher haben wir Methoden der Inferenzstatistik erörtert, die sich auf Aussagen über einen oder mehrere Grundgesamtheitsmittelwerte konzentrieren. In den folgenden Abschnitten betrachten wir Methoden der Inferenzstatistik, die Aussagen über die Varianzen (oder Standardabweichungen) der Grundgesamtheit liefern. Wir erinnern daran, dass die Varianz ($\\sigma^2$) und die Standardabweichung ($\\sigma$) ein Maß für die Streuung und Variabilität einer Variablen sind." ] }, { "cell_type": "code", "execution_count": 1, "id": "335e80ef-5b5d-400a-83b1-add5312d602e", "metadata": { "tags": [ "remove-cell" ] }, "outputs": [ { "name": "stdout", "output_type": "stream", "text": [ "\n", "---------------------------------\n", "Working on the host: Joachims-MacBook-Pro.local\n", "\n", "---------------------------------\n", "Python version: 3.10.2 | packaged by conda-forge | (main, Feb 1 2022, 19:30:18) [Clang 11.1.0 ]\n", "\n", "---------------------------------\n", "Python interpreter: /opt/miniconda3/envs/srh/bin/python\n" ] } ], "source": [ "%matplotlib inline\n", "# Load the \"autoreload\" extension\n", "%load_ext autoreload\n", "# always reload modules\n", "%autoreload 2\n", "# black formatter for jupyter notebooks\n", "#%load_ext nb_black\n", "# black formatter for jupyter lab\n", "%load_ext lab_black\n", "\n", "%run ../../src/notebook_env.py" ] }, { "cell_type": "markdown", "id": "e7b4ba76-cc2c-4eb6-9d8b-1bae0e586637", "metadata": {}, "source": [ "## Inferenz für die Standardabweichung einer Grundgesamtheit\n", "----------------------------------------" ] }, { "cell_type": "code", "execution_count": 5, "id": "f0bd980e-6bb4-4c25-b605-fc8ef2c2845e", "metadata": {}, "outputs": [], "source": [ "import matplotlib.pyplot as plt\n", "import numpy as np\n", "import pandas as pd\n", "from random import sample\n", "import statsmodels.api as smi" ] }, { "cell_type": "markdown", "id": "9777822d-a02d-4573-981a-80d85195e144", "metadata": {}, "source": [ "Inferenz für eine Grundgesamtheitsstandardabweichung basiert auf der Chi-Quadrat ($\\chi^2$)-Verteilung. Eine $\\chi^2$-Verteilung ist eine rechtsschiefe Wahrscheinlichkeitsdichtekurve. Die Form der $\\chi^2$-Kurve wird durch ihre Freiheitsgrade ($df$) bestimmt." ] }, { "cell_type": "code", "execution_count": 6, "id": "451b697e-df27-49dd-ac50-2be89f471aba", "metadata": { "tags": [ "hide-cell" ] }, "outputs": [ { "data": { "text/plain": [ "" ] }, "execution_count": 6, "metadata": {}, "output_type": "execute_result" }, { "data": { "image/png": "", "text/plain": [ "
" ] }, "metadata": { "needs_background": "light" }, "output_type": "display_data" } ], "source": [ "from scipy.stats import chi2\n", "import numpy as np\n", "import matplotlib.pyplot as plt\n", "\n", "df = [1, 2, 3, 5, 7, 10]\n", "\n", "x = np.linspace(0, 14, 1000)\n", "fig, ax = plt.subplots()\n", "for _df in df:\n", " ax.plot(x, chi2.pdf(x, df=_df), label=f\"df={_df}\")\n", "ax.set_title(\n", " \"$\\chi^2$-Warscheinlichkeitsdichtefunktion mit unterschiedlichen Freiheitsgraden (df)\"\n", ")\n", "ax.legend(fontsize=18)\n", "ax.set_ylim(-0.02, 0.5)\n", "ax.axvline(0, color=\"k\")" ] }, { "cell_type": "markdown", "id": "1fbfe085-2ecf-46b6-b9ea-007ac035146e", "metadata": {}, "source": [ "Um einen Hypothesentest für eine Populationsstandardabweichung durchzuführen, wird ein $\\chi^2$-Wert mit einer bestimmten Fläche unter einer $\\chi^2$-Kurve in Beziehung gesetzt. Entweder wir ziehen eine $\\chi^2$-Tabelle, um diesen Wert nachzuschlagen, oder wir machen von der Python-Maschinerie Gebrauch.\n", "\n", "Bei gegebenen $\\alpha$, wobei $\\alpha$ einer Wahrscheinlichkeit zwischen $0$ und $1$ entspricht, bezeichnet $\\chi^2_\\alpha$ den $\\chi^2$ -Wert, der die Fläche $\\alpha$ zu seiner Rechten unter einer $\\chi^2$ -Kurve hat." ] }, { "cell_type": "code", "execution_count": 7, "id": "aceda4e5-7223-4621-b0fa-de6d0ae8271f", "metadata": { "tags": [ "hide-cell" ] }, "outputs": [ { "data": { "text/plain": [ "Text(2.5, 0.07, 'Fläche = $1 - \\\\alpha$')" ] }, "execution_count": 7, "metadata": {}, "output_type": "execute_result" }, { "data": { "image/png": "", "text/plain": [ "
" ] }, "metadata": { "needs_background": "light" }, "output_type": "display_data" } ], "source": [ "from scipy.stats import chi2\n", "import numpy as np\n", "import matplotlib.pyplot as plt\n", "\n", "df = 5\n", "alpha = 0.9\n", "x = np.linspace(0, 16, 1000)\n", "fig, ax = plt.subplots(figsize=(16, 7))\n", "ax.plot(x, chi2.pdf(x, df=df))\n", "ax.set_xlim(-0.02, 14)\n", "ax.axvline(0, color=\"k\")\n", "ax.axhline(0, color=\"k\")\n", "ax.vlines(\n", " chi2.ppf(alpha, df=df),\n", " ymin=0,\n", " ymax=chi2.pdf(chi2.ppf(alpha, df=df), df=df),\n", " color=\"k\",\n", " linestyle=\"dashed\",\n", ")\n", "\n", "ax.fill_between(\n", " x, chi2.pdf(x, df=df), where=x >= chi2.ppf(alpha, df=df), color=\"r\", alpha=0.5\n", ")\n", "\n", "ax.set_title(r\"$\\chi^2$-Dichtefunktion, $df=5$, $\\alpha=0.1$\")\n", "\n", "\n", "ax.annotate(\n", " r\"$\\chi^2$\",\n", " xy=(7, 0.075),\n", " xytext=(10, 0.13),\n", " # textcoords=\"data\",\n", " arrowprops=dict(headwidth=15, headlength=30, width=4, color=\"k\"),\n", " size=18,\n", ")\n", "\n", "ax.annotate(\n", " r\"Fläche = 0.1\",\n", " xy=(10, 0.018),\n", " xytext=(11, 0.07),\n", " # textcoords=\"data\",\n", " arrowprops=dict(headwidth=15, headlength=30, width=4, color=\"k\"),\n", " size=18,\n", ")\n", "\n", "ax.text(s=\"$\\chi^2_{0.1}$\", x=chi2.ppf(alpha, df=df), y=0.04, size=18)\n", "ax.text(s=r\"Fläche = $1 - \\alpha$\", x=2.5, y=0.07, size=18)" ] }, { "cell_type": "markdown", "id": "82cd3379-b4b3-4637-9fd2-a69de1edd1d9", "metadata": {}, "source": [ "### Intervall-Schätzung von $\\sigma$" ] }, { "cell_type": "markdown", "id": "916d39bb-cbc0-415b-83ef-9663ea80a42c", "metadata": {}, "source": [ "Das $100(1-\\alpha)\\%$-Konfidenzintervall für $\\sigma$ beträgt" ] }, { "cell_type": "markdown", "id": "7c5ff91a-66fb-4230-a986-7fb39d9ba80f", "metadata": {}, "source": [ "$$\\sqrt{\\frac{n-1}{\\chi^2_{\\alpha/2}}} \\le \\sigma \\le \\sqrt{\\frac{n-1}{\\chi^2_{1-\\alpha/2}} }$$" ] }, { "cell_type": "markdown", "id": "8a299ea2-1058-479f-8094-e5c8ffc778fc", "metadata": {}, "source": [ "### $\\chi^2$-Test auf Standardabweichung" ] }, { "cell_type": "markdown", "id": "0e04aa8d-81a8-44dd-872b-d187e2fc452b", "metadata": {}, "source": [ "Das Hypothesentestverfahren für eine Standardabweichung wird als **$\\chi^2$-Test auf Standardabweichung** bezeichnet. Hypothesentests für Varianzen folgen demselben schrittweisen Verfahren wie Hypothesentests für den Mittelwert. " ] }, { "cell_type": "markdown", "id": "de6a4d90-5893-48e4-82b5-4ca1a7ed8c4f", "metadata": {}, "source": [ "$$\n", "\\begin{array}{l}\n", "\\hline\n", "\\ \\text{Schritt 1} & \\text{Geben Sie die Nullhypothese } H_0 \\text{ und alternative Hypothese } H_A \\text{ an.}\\\\\n", "\\ \\text{Schritt 2} & \\text{Legen Sie das Signifikanzniveau, } \\alpha\\text{ fest.} \\\\\n", "\\ \\text{Schritt 3} & \\text{Berechnen Sie den Wert der Teststatistik.} \\\\\n", "\\ \\text{Schritt 4} &\\text{Bestimmen Sie den p-Wert.} \\\\\n", "\\ \\text{Schritt 5} & \\text{Wenn }p \\le \\alpha \\text{, } H_0 \\text{ ablehnen } \\text{; ansonsten } H_0 \\text{ nicht ablehnen} \\text{.} \\\\\n", "\\ \\text{Schritt 6} &\\text{Interpretieren Sie das Ergebnis des Hypothesentests.} \\\\\n", "\\hline \n", "\\end{array}\n", "$$" ] }, { "cell_type": "markdown", "id": "fed2dbca-9f64-4f76-9202-c8c49747867f", "metadata": {}, "source": [ "Die Teststatistik für einen Hypothesentest mit der Nullhypothese $H_0: \\,\\sigma = \\sigma_0$ für eine normalverteilte Variable ist gegeben durch" ] }, { "cell_type": "markdown", "id": "9eae70b3-5570-477e-9ef0-4ff44869b2be", "metadata": {}, "source": [ "$$\\chi^2 = \\frac{n-1}{\\sigma^2_0}s^2$$" ] }, { "cell_type": "markdown", "id": "b10138fe-feed-4772-8958-89db0b0974fb", "metadata": {}, "source": [ "wobei $n$ der Stichprobenumfang und $s$ die Standardabweichung der Stichprobendaten ist." ] }, { "cell_type": "markdown", "id": "e8dd3975-cc20-4e2c-9a60-927daab07029", "metadata": {}, "source": [ "Die Variable folgt einer $\\chi^2$-Verteilung mit $n-1$ Freiheitsgraden.\n", "\n", "Beachten Sie, dass der Test auf eine Standardabweichung $\\chi^2$-Test nicht robust gegenüber Abweichungen von der Normalverteilung ist (Weiss 2010)." ] }, { "cell_type": "markdown", "id": "3ac4c514-150a-4190-a71b-f24d8f8c18fd", "metadata": {}, "source": [ "### $\\chi^2$ -Test auf Standardabweichung : Ein Beispiel" ] }, { "cell_type": "markdown", "id": "159d2c2a-85f3-44ea-af3d-a873eea312fe", "metadata": {}, "source": [ "Um praktische Erfahrungen zu sammeln, wenden wir den $\\chi^2$-Test mit einer Standardabweichung in einer Übung an. Dazu laden wir den `students` Datensatz. Sie können die Datei `students.csv` hier herunterladen. Importieren Sie den Datensatz und geben Sie ihm einen passenden Namen." ] }, { "cell_type": "code", "execution_count": 8, "id": "61de612b-0984-448b-ab4b-ec2fef58d2b8", "metadata": {}, "outputs": [], "source": [ "# Lese Datei students.csv als Dataframe ein; Indexspalte wird übersprungen\n", "students = pd.read_csv(\"../../data/students.csv\", index_col=0)" ] }, { "cell_type": "markdown", "id": "5767b967-8614-4f68-8a17-e1eadec0adfd", "metadata": {}, "source": [ "Der `students` Datensatz besteht aus $8239$ Zeilen, von denen jede einen bestimmten Studenten repräsentiert, und $16$ Spalten, von denen jede einer Variable/einem Merkmal entspricht, das sich auf diesen bestimmten Studenten bezieht. Diese selbsterklärenden Variablen sind: *stud_id, name, gender, age, height, weight, religion, nc_score, semester, major, minor, score1, score2, online_tutorial, graduated, salary.*" ] }, { "cell_type": "markdown", "id": "e0e56741-c964-4f43-9936-34d4b5ef7453", "metadata": {}, "source": [ "Um den **$\\chi^2$-Test auf Standardabweichung** zu demonstrieren, untersuchen wir die Streuung der Körpergröße in cm der Studentinnen und vergleichen sie mit der Streuung der Körpergröße aller Studenten (unserer Grundgesamtheit). **Wir wollen testen, ob die Standardabweichung der Körpergröße der Studentinnen kleiner ist als die Standardabweichung der Körpergröße aller Studenten.**" ] }, { "cell_type": "markdown", "id": "047bc69e-1b30-4fb8-a75b-b1597366ccf7", "metadata": {}, "source": [ "### Vorbereitung der Daten" ] }, { "cell_type": "markdown", "id": "4ced0c9f-2db6-4977-acc5-c75de6a7f901", "metadata": {}, "source": [ "Wir beginnen mit der Datenaufbereitung.\n", "\n", "- Zunächst definieren wir die Standardabweichung der Grundgesamtheit. In unserem Beispiel entspricht die Grundgesamtheit der Körpergröße aller $8239$ Studenten im Datensatz. Wir berechnen die Standardabweichung für die Variable `height` und weisen ihr den Variablennamen `sigma0` zu.\n", "- Zweitens unterteilen wir den Datensatz anhand der Variable `gender`.\n", "- Drittens nehmen wir eine Stichprobe von $30$ Studentinnen und extrahieren die interessierende Statistik, die Standardabweichung der Größe der Studentinnen in unserer Stichprobe." ] }, { "cell_type": "code", "execution_count": 9, "id": "7e1dd217-d0a6-48e0-bc76-3b866646ecee", "metadata": {}, "outputs": [ { "data": { "text/plain": [ "11.077529134763823" ] }, "execution_count": 9, "metadata": {}, "output_type": "execute_result" } ], "source": [ "sigma0 = students[\"height\"].std()\n", "sigma0" ] }, { "cell_type": "markdown", "id": "4f41971c-d4dc-40b4-b660-c3734161efd3", "metadata": {}, "source": [ "Die Standardabweichung der interessierenden Grundgesamtheit ($\\sigma_0$) beträgt $\\approx$ $11,08$ cm." ] }, { "cell_type": "code", "execution_count": 10, "id": "92d71995-7441-4745-816b-f397adf07a4d", "metadata": {}, "outputs": [], "source": [ "female = students.loc[students[\"gender\"] == \"Female\"]\n", "\n", "n = 30\n", "female_sample = female[\"height\"].sample(n=30, random_state=1)\n", "sample_std = female_sample.std()" ] }, { "cell_type": "markdown", "id": "fb75b866-2709-4738-abb5-e437d07d19b1", "metadata": {}, "source": [ "Außerdem überprüfen wir die Normalverteilungsannahme, indem wir ein Q-Q-Diagramm erstellen. In Python können wir die Funktion `qqplot()` verwenden, um Q-Q-Plots zu erstellen." ] }, { "cell_type": "code", "execution_count": 11, "id": "d0d721b4-d0af-4575-b877-fd32557eccbf", "metadata": {}, "outputs": [ { "data": { "text/plain": [ "Text(0, 0.5, 'Stichproben Quantillen')" ] }, "execution_count": 11, "metadata": {}, "output_type": "execute_result" }, { "data": { "image/png": "iVBORw0KGgoAAAANSUhEUgAAAYUAAAElCAYAAAALP/6mAAAAOXRFWHRTb2Z0d2FyZQBNYXRwbG90bGliIHZlcnNpb24zLjUuMiwgaHR0cHM6Ly9tYXRwbG90bGliLm9yZy8qNh9FAAAACXBIWXMAAAsTAAALEwEAmpwYAABA2UlEQVR4nO3debxVc/fA8c9qdAsVpZRSolJRVHiiZIjHWDKEkIxJiEco/UQeRBmfBkLIkLFCKCqFNChRKRka1C0qqTRoXL8/vt9z2/d0pjuce869d71fr/O6++xxnX3OPevsvb97fUVVMcYYYwBKpDoAY4wx6cOSgjHGmCyWFIwxxmSxpGCMMSaLJQVjjDFZLCkYY4zJYknBZBGRH0SkTarjSDZxXhKRv0Rkph/XWUQ+EZFaIrJJRErmcRv3i8hrfjhf1hllO8+KyP+JSBsR+SG/15/fRKSViCzyw4tEpFUKY8l6j8welhRSRESuFpF5IrJFRH4XkSEiUiGB5SqKyFC/zBa/js5xlqktIuq/mDaJyB8iMlZE2gbnU9VGqjo5jy+tMDgJaAscoqrHAajqK6p6lqr+pqr7ququ/NpYXtYZ/sUlIjVE5EcReUZERFW7quqDqjpZVRvlV8zJoqpfqmp9P1xfVb9MdUwmO0sKKSAi/wEeBXoCFYATgNrApyJSOsZyZYAJwKHAv/yyPYHHROTWBDZdUVX3BZoAnwGjReTq3L+SxIhIqWRvI4cOBZaq6ubcLJyMX/wJbvdQ4AvgA1W9VXNw52l+vwc5XZ8/OisS3zdF6bVEpKr2KMAHsD+wCbgkbPy+wGqgc4xlr/XzlA8b3xHYCOwXZbnagAKlwsbfCfwBlPDPlwKn++HjgGnAemAVMAgoE1j2DGARsAEYAkwBrvPTrgamAk8C64D/AnWBScCfwFrgdVySIrDtnsBcYDPwIlAV+AT4G5cMK4W9ni7AcuAvoCvQwi+/HhgUYx/+A+zy78MDPt6vwuZT4HA//DIwFPjYx3Z6hPXW8fvgb1zCHQS8Fmn/45L5i36/Zvr9UzJKvPcDr/n9twx4MDCtBNDHj18NjAAqhG3zWuA3XDIJjbsBWOm3/5+w9d0D/Orfp7eBA2KsryTwuH8/lwDdw17nZOAh/1nYChwOtAS+wX1uvgFaBrZ/NbDY78MlQCc//nC/bzf4bb0VWKaB39/rcJ/HSyLtx3jvkZ9+AvA17vPzPdAmMG2v15Lq75KkfUelOoDi9gD+Dewk7AvaT3sFeD3Gsm8Cr0QYX8qvs22U5bJ9KQXGH+bHH+mfL2VPUmjm/0lK+eUXAj38tMq4JNTBT78N2EH2pLATuMVPz/D/2G2BskAV/6XyVCCWpcB0XCKogfuS+xY4xi8zCegb9nqeBfbBJah/gDHAQYHlT46yP64mkATCn/tx4UlhA3Ai7otznwjrnAY84WNt7b94oiWFMcBzQHkf70zgxiix3o/7osoEeodNuwb4xb+P+wKjgFfDtjnCbycjMG6kH3cUsCbwnvfw78Eh/nU8B4yMsb6uwAI/fyVc4g5PCr8BjfznoCougV/pn1/mnx/o17kRqO+XPRho5IdHAveG9j1wkh9fHvejoItf37G4pNEoyr6M9R7VwCXCs/122vrnVaK8ltKp/i5J2ndUqgMobg/gCuD3KNP6A5/GWHYC0D/KtN+By6NMC/1DhyeFffz4E/3zpUT4Feyn9QBG++GrgGmBaeL/OYNJ4bc4+6E9MCfwfCn+l6F//h4wNPD8FmBM2OupEZj+J9AxbPkeUbZ9NTlPCiNivJZauCRYPjDuDSIkBdwX4zYgIzDvZcDnUdZ9P+7Lcj1QN2zaRKBb4Hl9XHIuFdjmYRE+Bw0C4x4DXvTDC4HTAtMOjrO+SQSSGXA6eyeFfoHpVwIzw17DNL//y/vXeGFw3/h5RgDDcNeAguM7Al+GjXsO/+Mhh+/R3fiEGpg+Hn/kHv5aivKj6J4XS19rgcpRzskejPvlFmpVErow3Duw7MHhC/l1VQ4suynwqBUjlhr+77oI66znL0b/LiIbgYf9NgCq45IAAOr+a1aErWJ58ImIHCQib4pIpl/fa4H1hfwRGN4a4fm+eZw/L5bHmFYd+EuzX6NYFmXeQ4HSwCoRWS8i63FfZAfFWP8HwHBgkr+uENxucDvL2JN4YsUdHLfMrycU2+hAXAtxp9mira962PN42wqPN7T9Gn7fdcQdfawSkY9EpIGf5y7cD4+ZvoXcNYF4jw/F62PuBFSLEEe89+hQ4OKwdZ1E9v+3WJ+BIsOSQsGbhvul2CE4UkTKA2fhznmirlXJvv7xsJ9tAnCWnzfoQtwvupl+2X0Dj99ixHIB7jTLogjThgI/Akeo6v5Ab9w/Jrhz0YcEYpfgc0/Dnj/ixx3t13dFYH2pthkoF3oiIpG+VMJfT9AqoFLY+xItGS/Hvf+VVbWif+yvcVoOqeodwFhcYggl85W4L7PgNneSPTlGirtm2DIrA7GdFYiroqruo6qZUdaX7XMQtt5I84fHG9p+JoCqjlfVtrgv4h+B5/3431X1elWtDtwIDBGRw328U8Li3VdVb4oQR7z3aDnuSCG4rvKq2j/KaymyLCkUMFXdgLu4+T8R+beIlBaR2sA77LkAG82ruF/k7/hmpqVF5EzgGeAxv+64RKSqiHQH+gK9VHV3hNn2w5222OR/sQX/0T4CjhKR9v4o5WYi/zoLX98mYL3/UuuZSKwF5HugkYg0FZF9cKdsEqaqy4BZwAMiUkZETgLOizLvKuBT4HER2V9ESohIXRE5OYFNdcedspkoIlVx59pvF5E6IrIv7mjuLVXdGWc9/yci5USkEe58/Ft+/LPAQ6GjERGpIiLtYqznbeA230y2Iu4UTCwfA/VE5HIRKSUiHYGGwFj/mTzff2lvw31Wdvk4LhaRUPL5C/flvAuXJOuJyJX+f6G0iLQQkSPDN5zAe/QacJ6InCkiJUVkH3H3foT/2CnyLCmkgKo+hvvlPZA9LS3K4c7nR20mqarbcOdtlwMzcKdIxgFP4RJNPOtFZDMwD3dB7WJVHR5l3juBy318z7PniwNVXQtcjDsf/SfuH3sW7p85mgdwFwI34JLKqATiLRCq+hPQD3ck9jPwVS5WczlwPO5UXF/cefBorgLK4C7S/gW8S4TTghHiVNwv5Zk+1g9wPxS+wH2G/sFde4lnCu4C9URgoKp+6sc/7df5qYj8jbvofHyM9TyPS3BzgTm4L/2d+C/zCPH/CZwL/Af3ubkLONd/nkr48Stx+/BkoJtftAUwQ0Q2+fhuU9Ulqvo3rpHBpX6533FNvctGiTfqe6Sqy4F2uP/LNbj/sZ4Uw+9I8RdRTAr5c6QP4C74xjrdE75caVyTzUzgak3Rm+nbbK/AXSj+PBUxmPj8EekSXMuZeEcTuVn/WcCzqhp+isgUIsUuC6Yj/2u9N64Nd06W24G7nvArruVJgfGH2RVFpCx7rjdML8gYTGqJSIaInO1PBdXA/foeneq4TN7YkYLJFRG5H3eqInQa5FZVnZHSoExM+X2kICLlcKeiGuBOZX6EO7WzMa/rNqljScEYY0wWO31kjDEmiyWFJPA3jR2WT+taKiKn58e6crn9uK9F9lRhLZDCd/m5T3zch+dy2RNF5Ge/j9qLK73dOZfrCpbazrY/E11vqj8r+cU3BQ2/GTK/1p20MuZFhSWFJPA30CxOdRyRiEhvEVni/zFWiMhbgWmTReS64Pzp/FrSQD9c4b19VXWMutLbr+T3RpK13tzy7fwf95+fTf7z9GRgetokp/BYNAml0YsaSwpFVKRf7f7X5pW4+yH2BZrj2qqnjYI62sgnhwJp37FNEvTCfXaOw92UeAruPgVTBFhSSILgKQkReVlEBour5fK3iMwQkboxlr1SRJaJyJ8icm/YtBIico+I/Oqnvy0iB/hpoVMO14rIb7g7X8O1AMar6q+QVT5gmF/+IaAVMMj/+hsU4bVk+F+Iy0Rkg4h8JSIZgfV3EpHfRGRtMHZ/auRdEXnL74NvRaRJYPpSEblbROYCm30Tx/PF1blZ749gwu9SbSEiC8T1nvaSuDuRQ+s7V0S+88t+LSJHR9vf3tkistjHPUACtfJF5BoRWei3M1723O37K6466Yd+f5UNHmmJ60TpKxEZ6JddIq4df2i9dURkit8fn7F3HSgC82Y7ghOR631Mf/t9cGxg9qYiMte/P28lul/8e3BntGXD9z2uOOJKdZaq6gi/nldx5SNC++UuiXA6KPgL3n+uXvb7aYFff3De6iLynois8fvx1sC0+/3/wQi/P34QkeYxYgk/NTdZRB4Ukal++U9FpLKfFpq3c5TPdSL/jxGXTWvJrLZXXB/sXWFzHe5XVSlcGYs3oyzXEHd7f2vcXZlP4O4QzVVp4wjrv8LH0hP3S69k2PTJ+EqnUV7LYD9PDVwt/ZY+jtC2n8eVVG6Cu7s5VJL7flxtpotwxeDuZE/TSHAVUr/D1c7JAOrh6hG19fPfhbsDt0xg/vl+/gNwNe7/66cdi6vndLyPsbOfv2yM9+pzv55awE/sqfba3m/3SP/e9QG+Diy7lEBV2eD+w1X+3AFc7+O4CXfXbajFX05KbQfXezHuZsUWuHtDDgcODcQzE1f87QBcQbuuieyXWMtG2Gd9cGWku+HKb0vY9PD90gZYEW0eXHXgL/12a/r3doWfVgKYDdyHa/58GK7PhTMDn61/cHfol8TV2JoeI5ZI+/ZX3Gcuwz/vHzZvtM91D+L/P0ZcNp0fKQ+gKD7YOym8EJh2NvBjlOXuI5AwcF/u2wP/PDkqbRxlG51wJRI240oN3BOYNpkoScH/c24FmkRYZ2jbhwTGzQQu9cP3h/2jlsAVKGvlny8FrglM/z/g7bD5M/Gdnvj5uwamnw386oeHEuiIxo9bRPS+FRT4d+B5N2CiH/4EuDYsji1k/xKOlRR+CUwr57dVjRyU2o6w3vG4ewEivZalwBWB54/h7jCOu19iLRthOyVx9a6m4r7oVhLoHCrCfmlD7KSwOOw9uIE9SeF4wsqw405fvRT4bE0ITGsIbI0RS6R92yfs/R+X4Oc6kf/HiMum86Mwnb8tzH4PDG8heknn8JLUm0Xkz8D0Q3GljYMF7GKVNt6Lqr4OvC6uREZ7PzxHVcfHeQ2Vcf0v/BpjnlivM/i6dvvTCdUjTSesxLKffzl7Sn2Hzx9e/rmziARrAJUJ21a4WOt6WkQeD0wXH0e00thBWftDVbeICLh9UpnIZZwjVRkNV5OcvQc52S/Rls1G3UXawcBgcacPrwGGi8hMVV2YwGsIF16CO7ykdXVxpaxDSuKOLKLFvY+IlNLEb9CL9/8ZbXoi/4+J/u+nDbumkF5WEfhiEHfH6IGB6TktbRyVqu5Q1XdwxcwaJ7DsWtxhetTrIXEEX1cJ3CH3ysD04LazlVgW921aE19iOXx97F3++aGwfVROVUcmEluEdd0Ytq4MVf065iuNLyeltsMtJ3fvQW72S1yqulVVB+MK+zUMjQ6bLbw0eUlc73sh2T737F3SeklY3Pup6tmJhpjgfLmRyP9joWNJIb28C5wrIieJSBlck8fge5TT0sbZ+Iuf54jIfv4i2Vm47gVD5Sn+wJ2z3Yu68trDgSf8hb+SIvIvcbWPEtFMRDr4C3w9cKcdotVKehs4R0RO80c0//HzB7+MbxaRQ/yFvd7sqeL6PNBVRI4Xp3zoNceIraeIVBKRmriuRYOlpHuJKzGNiFQQkYsTfL1RaQ5KbUfwAnCniDTzr+9wyd7xTjS52S8RiUgPf/E4Q1yjgM64Vkhz/Czhn6OfcL/ez/HvZx+yVzJ9G7efK4krVR08mpkJbBTXECHDf+4ai0i2i9ExRP1M54M8/T+mK0sKaURVf8Cdq30D9+vpL7L3aJbT0sbhNuK+QH/DdX34GHCTqoZKRT8NXCSuFcgzEZa/E1d2+xvcBetHSfwz9D6uZ62/cM1iO6gr6LcXVV2Euyj+P9wRynnAeaq6PTDbG7iyzYv9479+2Vm4i7uD/LZ+wZ3fjxfbbNzF7o+AF/26RvvX+Ka43uLm4zpCyg85KbWdxR/dPYR7/X/j+ns+IIHlcrNfotkKPI47NbIW95m9UPfcz/II0EdcK6c71fXz0Q2X0DJxRw7Bz/UDuFNGS3Dv6auBuHfh3v+mfvpav54KCcaaLZacv9SY8vr/mJas9pFJOnHF8w5X1StSHYsxJjY7UjDGGJPFkoIxxpgsdvrIGGNMFjtSMMYYkyVpN6+JyHBcJ92rVbWxH9cU14xrH9wdnd1Udaaf1gu4Fnfzx60J3ExF5cqVtXbt2kmJ3xhjiqrZs2evVdUqkaYl847ml3HN34JN7R4DHlDVT0TkbP+8jYg0BC7FtZmvDkwQkXoap7xt7dq1mTVrVlKCN8aYokpEot6Rn7TTR6r6Ba4NdrbRwP5+uAJ77hxth6v5s01Vl+DaUB+XrNiMMcZEVtC1j3oA40VkIC4htfTja5D97tYVZK9zY4wxpgAU9IXmm4DbVbUmcDv+zlFckbFwEZtFicgNIjJLRGatWbMmSWEaY0zxVNBJoTMwyg+/w55TRCvIXhArvFhaFlUdpqrNVbV5lSoRr5MYY4zJpYJOCiuBk/3wqcDPfvgD4FJxvVfVAY7AFcIyxhhTgJLZJHUkrnONyr52fl9cQa6nfaXMf3CdaaCqP4jI28ACXFPVm+O1PDLGGJP/kpYUVPWyKJOaRZn/IVz1R2OMMSlidzQbY0xRs2UL3Hsv/Pxz/HnDWFIwxpiiZOxYaNgQHn4YPvoox4tbUjDGmKLgt9/gggvgvPOgfHmYMgV69MjxaiwpGGNMYbZjBwwYAEceCePHwyOPwJw50Lp1rlZX0Hc0G2OMyS9ffQU33QTz57sjhGeegdq1GTMnkwHjF7Fy/VaqV8yg55n1aX9MYkUi7EjBGGMKm7Vr4dproVUr2LABxoyBDz7ISgi9Rs0jc/1WFMhcv5Veo+YxZk5mQqu2pGCMMYXF7t3w4otQvz6MGAF33QULF0K7dlmzDBi/iK07st/mtXXHLgaMX5TQJuz0kTHGFAbz5rlTRVOnwkknwdCh0LjxXrOtXL814uLRxoezIwVjjElnmzZBz55wzDHw448wfLhrWRQhIQBUr5iRo/HhLCkYY0w6UoXRo909BwMHQpcusGiR+1si+ld3zzPrk1G6ZLZxGaVL0vPM+glt1k4fGWNMulmyBG65xd18dtRRMHIknHhiQouGWhnltvWRJQVjjEmiHDUP3b4dHn8cHnzQHQ0MHAi33gqlS+dom+2PqZFwEghnScEYY5Ik1Dw01Boo1DwU2PtLe8oUdyF54ULo0AGeegpq1qSg2TUFY4xJkoSah65eDZ07Q5s28M8/7pTRe++lJCGAJQVjjEmamM1Dd++G556DBg3cNYPevd2dyWefXcBRZmenj4wxJkmqV8wgM0JiOHlLJrRsCTNmuCOEIUNc7aI0YEcKxhiTJOHNQ8tv28IDn7/AS4Nvci2MXn0VJk1Km4QAdqRgjDFJk9U8dNyPNJ0xgfs/f57Kf69DunaFhx6CSpVSHOHeLCkYY0wStd//H9p/MRDGjXN3JT/7MRx3XKrDispOHxljTDJs2wb9+kGjRq5e0dNPw8yZaZ0QwI4UjDEm/02cCN26wU8/QceO8MQTUL16qqNKiB0pGGNMfvn9d7j8cjj9dNfkdPx4ePPNQpMQwJKCMcbk3a5dMGiQ6+fgvfegb19X6vqMM1IdWY4l7fSRiAwHzgVWq2pjP+4tIFSqryKwXlWbikhtYCEQus1vuqp2TVZsxhiTb2bNgq5dYfZsd4QweDDUq5fqqHItmdcUXgYGASNCI1S1Y2hYRB4HNgTm/1VVmyYxHmOMyT/r10OfPu7Gs6pV3V3JHTuCSKojy5OkJQVV/cIfAexFRAS4BDg1Wds3xpikUHUJ4I47YM0a6N7dVTWtUCHVkeWLVF1TaAX8oao/B8bVEZE5IjJFRFpFW1BEbhCRWSIya82aNcmP1BhjQhYtgrZtoVMnqFXLNTF95pkikxAgdUnhMmBk4PkqoJaqHgPcAbwhIvtHWlBVh6lqc1VtXqVKlQII1RhT7G3dCvfdB0cf7a4hDB4M06ZBs2apjizfFfh9CiJSCugAZO1NVd0GbPPDs0XkV6AeMKug4zPGmGzGjYObb4bFi90RwsCBUK1aqqNKmlQcKZwO/KiqK0IjRKSKiJT0w4cBRwCLUxCbMcY4mZlw8cVw1llQqpS7Ie2114p0QoAkJgURGQlMA+qLyAoRudZPupTsp44AWgNzReR74F2gq6quS1ZsxhgT1c6dzPvP/Ww57Aj+GfMBw9p24YMRn8CpxaNdTDJbH10WZfzVEca9B7yXrFiMMSYh06ezofO1HPXTAj4/rBl9T+/Kb5UOJmPsT+wuUzbX/R4XJnZHszHGrFsHN94ILVuy7ffVdG3fiy4X3c9vlQ4GInShWYRZQTxjTPGlCiNGQM+eLjH06MGp+i82lS2316zRutYsauxIwRhTPC1Y4LrCvPpqqFvXlal44gkqVD0w4uzVK2YUaHipYknBGFO8bNkCvXpBkyauaN2wYa6/gyZNgL270ATIKF2SnmfWj7S2IsdOHxljiqQxczIZMH4RK9dvpXrFDHqeWZ/2mXNcWYply6BzZxgwAMJugs3qQjN82WJwkRksKRhjiqAxczLpNWoeW3fsAkB/W8a+l/WBRdOgYUOYMgVat466fPtjahSbJBDOkoIxpsgZMH4RW3fsotSunVwz6316TH0DURjy7+vo9v5gKFMm1SGmLUsKxpgiZ+X6rTRf8QP/HT+EBmuX8dnhx3P/6TeyssJBdLOEEJMlBWNM0bJ2Lc9MHMR5s8axYv8qXN+hD58dcQIANYpJC6K8sKRgjCkadu+Gl16Cu+7inI0beeFfF/H4CZeytcw+QPFqQZQX1iTVGFP4zZsHrVrBdddBo0aUmDOHyoOf4oCDKiG4I4RHOhxVbC8e54QdKRhjCoWITUyPqAAPPABPPgmVKrkjhc6dQYT2YEkgFywpGGPSXngT08y/tjDx4Wc546vhlPt9pTtC6N8fDox8N7JJXNykICJVgOuB2sH5VfWa5IVljDF7hJqYAhyy/ncemPAcp/36DT9XO4wjpk6Fli1THGHRkciRwvvAl8AEYFdywzHGmL2tXL+V0rt2cP3M0dzy9VvsFuHBU67llebn84slhHyVSFIop6p3Jz0SY4yJ4px1i7ht1FMc8edyPqnXkn6nXc+q/atYE9MkSCQpjBWRs1X146RHY4wxQatXw513MujVV1lesRpXX9SXyXVbANbENFkSSQq3Ab1FZDuwHRBAVXX/pEZmjCm0IrYUitASKOp8u3fD88/DPffA5s3QuzffndOFn7/4DSmGReoKkqhqqmPItebNm+usWbNSHYYxJiC8pRC4X/Xh9wlEm29IQ+GUp/vCjBmuv4MhQ+DIIwvyJRR5IjJbVZtHmhb35jVxrhCR//PPa4rIcfkdpDGmaAi2FAqJ1J1l+Hz7bttCz0+G0rrT2bBkCbz6KkyaZAmhgCVy+mgIsBs4FXgQ2AQMBlokMS5jTCEVrdvK8PFZz1U5e9FU7ps4jIM2/cXrx5zFlRNfczejmQKXSFI4XlWPFZE5AKr6l4hYmUFjTETVK2aQGSExhHdnWb1iBiWXLObBz4Zy8pJvmV+1LjdecC9rGzblSksIKZNIUtghIiUBhayb2XYnNSpjTKHV88z6Ea8VZGsptG0bLyz7mMNefIbtJUtx/2k38Oqx51CmbBkesRZFKZVIUngGGA0cJCIPARcBfeItJCLDgXOB1ara2I97Cwi94xWB9ara1E/rBVyLu0HuVlUdn6NXYowpEPFaFsXtznLiROjWjSN/+okVZ5zPzc06MXd3eWtRlCYSan0kIg2A03DNUSeq6sIElmmNu/4wIpQUwqY/DmxQ1X4i0hAYCRwHVMfdPV1PVWPeQW2tj4wpWIm2LIro99/hjjtg5Eg4/HAYPBjOOCPJEZtIctX6SEQOCD2A1bgv7TeAP/y4mFT1C2BdlHULcIlfJ0A74E1V3aaqS4BfcAnCGJNGEm1ZlM2uXTBoENSvD++9B337ulLXlhDSUqzTR7Nx1xEkMC70XIHD8rDdVsAfqvqzf14DmB6YvsKP24uI3ADcAFCrVq08hGCMyalEWxZlmTULunaF2bOhbVt3dHDEEUmM0ORV1KSgqnWSuN3L2HOUANkTT1YIkRZU1WHAMHCnj/I/NGNMNIm2LGL9eujTx914VrWqO2XUsSNIpH91k06iJgUROTbWgqr6bW42KCKlgA5As8DoFUDNwPNDgJW5Wb8xJnnitixSdQngjjtgzRro3h0efBAqVEhRxCanYp0+ejzGNMXdzJYbpwM/quqKwLgPgDdE5AncheYjgJm5XL8xJklitixatAhuvtm1LmrRAj76CJo1i7NGk25inT46JS8rFpGRQBugsoisAPqq6ovApWQ/dYSq/iAibwMLgJ3AzfFaHhljkiORJqfZWhpt3Qr33QePPgoZGe66wY03QsmSKYje5FXUJqkicqqqThKRDpGmq+qopEaWAGuSakz+ynGT03Hj3NHB4sXQqRMMHAjVqhVgxCY3YjVJjXX66GRgEnBehGkKpDwpGGPyV6wmp9mSQmYm9OgB774L9erBhAlw2mkFG6xJilinj/r6wX7+3oEsIpLMlknGmBSJ2+R050743//c6aKdO91F5J49oWzZAozSJFPc0tnAexHGvZvfgRhjUm+vpqXB8dOnQ/PmrmVRq1Ywf75rdmoJoUiJ1SS1AdAIqBB2XWF/YJ9kB2aMKXiRmpxW27mF174ZCb3fgOrV3SmjDh3snoMiKtY1hfq4gnYVyX5d4W/g+iTGZIzJg3ith2JNz9bk9K8tXLv4S3pOfJGyG9e7awgPPAD77ZeCV2UKSqxrCu8D74vIv1R1WgHGZIzJpfDWQ5nrt9Jr1DzAfeHHmx76277sBrjpJvjiCzjhBHj2WWjSJAWvyBS0RK4p/CIivUVkmIgMDz2SHpkxJsfiFayLW9Buyxbo1cslgHnzYNgwmDrVEkIxkkh/Cu8DX+LKWdsNZcaksXith2JOHzvWlaVYtgw6d4YBA6BKlaTFatJTIkmhnKrenfRIjDF5Fq9gXaTp1Teu5pEpL8KjU6FhQ5gyBVq3LpB4TfpJ5PTRWBE5O+mRGGPyrOeZ9ckonb28RLBgXXB6qV07uWHGe0x44SZOXDwb+veHOXMsIRRziRwp3Ab0FpFtwA58fwqqun9SIzPGRBWtBVG8rjBDf8c99x493nuCBmuXserkMzj4lWFw6KEpez0mfSTUHWe6stpHpjjKU5eYa9fC3XfD8OFQqxY88wy0a5fkiE26yVV3nGErqCQix4lI69Ajf0M0xiQqV11i7t4NL74IDRrAiBFw112wYIElBLOXuKePROQ63CmkQ4DvgBOAaeS+PwVjTB7kuEvMefPcPQdTp7ryFEOGQOPGSYzQFGaJHCncBrQAlvk+Fo4B1iQ1KmNMVDHrEwVt2uSK1R1zjOsA56WXXMsiSwgmhkSSwj+q+g+AiJRV1R9xJTCMMSkQr4URqjB6tGteOnAgdOkCP/4IV19t9YpMXIm0PlohIhWBMcBnIvIX1n+yMSkTs4XRkiVwyy2uK8yjjoI334SWLVMcsSlMctT6SEROBioA41R1e9KiSpC1PjLG274dHn/c9W9QogT06we33gqlEvndZ4qb3Pa8Flq4VuBpqLOdasBv+RCbMSavJk+Gbt1g4UK48EJ46ik45JBUR2UKqUR+RnyE635TcP0o1AEW4fpaMMakyurVcOed8OqrUKeOO2V0thUfMHkTNymo6lHB5yJyLHBj0iIyxsS2ezc8/zzccw9s3gz33gu9e0O5cqmOzBQBOT7hqKrfikiLZARjjIljzhx3z8GMGdCmDQwd6m5IMyafJHJN4Y7A0xLAsdh9CsYUrL//hvvuc2UpKld2p4w6dbImpibfJXKkEOx7byfuGsN78RbyHfGcC6xW1caB8bcA3UPrUtW7RKQ2sBB3rQJguqp2TegVGFNIxeoWM2vaX1votOIb7v3sOTLWroauXeGhh6BSpRRHb4qqRK4pPCAi+/vhjTlY98vAIGBEaISInAK0A45W1W0iclBg/l9VtWkO1m9MoRWrW0yAXqPmUWX1Cl7+bCgnL/mWBdXqsvqVF2hz5bmpCtkUEzGTgoj0AHriWh2JiKwF7lPVN0Wkpqouj7asqn7hjwCCbgL6q+o2P8/qvARvTGEVq6hd6Z3buX7ya9w87W22lyzF/afdwKvHnkO1zHJMTVG8pviImhRE5H7gOKCVqi724w4DnhaRQ4HrgcNzuL16QCsReQj4B7hTVb/x0+qIyBxgI9BHVb+MEtcNwA0AtWrVijSLMWkvWvG6Ot9N48FPh1Dnr5V82KAVD556Hav3OzDmMsbkp1hHCp2Ao0J1jwBUdbGIXIK70Hx5LrdXCVdptQXwtk80q4BaqvqniDQDxohIo0inq1R1GDAM3B3NuYjBmJQL7xazyqZ1/N+kFzh/4RcsP7AGV17Sjy/rHLvXMsYkW6yCeLuDCSFEVbcCmar6QS62twIYpc5MYDdQWVW3qeqffv2zgV9xRxXGFEmhonYldu/iqtkfMvH5rvz7p6/58YbbmTN2CrPqZW/1na3gnTFJFOtIYYWInKaqE4MjReRUIDOX2xuD64dhsojUA8oAa0WkCrBOVXf5I4cjgMW53IYxaa/9MTWouOB7qt3dkwaZPzHz8GZsGPgkbdu1ogGwu+w+UVsmGZNMsZLCrcD7IvIVMBtX6qIFcCJwfrwVi8hIoA1QWURWAH2B4cBwEZkPbAc6q6r6ntz6ichOYBfQVVXX5f5lGZPG1q+HPn1oM2QIVK0KI0dyXMeO2e45CPa3bExBilklVUT2wV07aISrffQD8Hqk00qpYFVSTaGiCiNHwh13wJo1cPPNrqpphQqpjswUM7mukuq//IcnJSpjipNFi1wSmDgRmjd3xeuaNUt1VMbsJZGe14wxubV1qytPcfTRMGsWDB4M06dbQjBpy3rgMCZZxo1zRweLF8Pll7tOcKpVS3VUxsRkRwrG5LfMTLj4YjjrLNfz2YQJ8PrrlhBMoRA3KYjIiSLymYj8JCKLRWSJiFhzUWPC7dwJTz7pSll/+KHrEnPuXDjttFRHZkzCEjl99CJwO65Z6q448xpTPE2f7iqYfv89/PvfMGgQ1K2b6qiMybFEksIGVf0k6ZEYUxitWwe9erme0A4+GN55x/WTbP0cmEIqkaTwuYgMAEYB20IjVfXbpEVlTLpTdR3d3HmnSww9esADD8B++8Vd1Jh0lkhSON7/Dd7ooLhyFcYUPwsWQLduMGUKnHACfPYZNGmS6qiMyReJdLJzSkEEYkza27IF/vtfGDDAHREMGwbXXgslrBGfKToS6aO5KvAwUF1VzxKRhsC/VPXFpEdnTLoYOxa6d4dly6BzZ5cYqlQBEuxW0wrbmUIikdNHLwMvAff65z8Bb+FaJRlTtP32G9x2G4wZAw0bulNGrVtnTU6kW81I0ywxmHSVyHFvZVV9G9f3AaoaqmRqTNG1Y4c7GjjySBg/Hvr3hzlzsiUEiN2tZqxpxqSrRI4UNovIgbiLy4jICcCGpEZlTCpNneruOZg/H84/H555Bg49NOKs0brIjNV1pnWradJZIkcKdwAfAHVFZCowArglqVEZkwpr17oLxyedBBs3ulNG778fNSFA9C4yq1fMiDnNmHQVNyn4+xFOBloCNwKNVHVusgMzpsDs3g0vvujKU4wYAXfd5ZqdtmsXd9FQt5pBoa4zY00zJl0l0vpoH6AbcBLuFNKXIvJsunS0Y0yezJsHN93kThmddBIMHQqNGye8eOiCcawWRtb6yBQmMXteAxCRt4G/gdf8qMuASqp6cZJji8t6XjO5tmmTuwP5ySehYkV3Ublz56j3HFjTUlOU5LrnNa++qgZv1/xcRL7Pn9CMKWCq7jrBrbfC8uVw3XWuZdGBB0ZdJFazU0sMpqhJ5ELzHN/iCAAROR6YmryQjEmSJUvgvPPgggvc0cFXX7lCdjESAsRudmpMURP1SEFE5uGuIZQGrhKR3/ykWsCCAojNmPyxfbvr9ezBB93poQED3A1ppUsntHhump0aU1jFOn10boFFYUyyTJ7sitctXOiOEJ5+GmrWzNEqqlfMIDNCArCmpaYoinr6SFWXhR5AReA8/6joxxmTvlavhquuglNOga1bXe2iUaNynBAgdrNTY4qaRLrjvA14HTjIP14Tkbg3r4nIcBFZLSLzw8bfIiKLROQHEXksML6XiPzip52Z85diDO6eg+eeg/r14c03oXdv+OEHOOccwF00PrH/JOrc8xEn9p/EmDmZWYtGm9b+mBo80uEoalTMQIAaFTN4pMNRdpHZFEmJNEmdi6uKutk/Lw9MU9Wj4yzXGtgEjFDVxn7cKbjCeueo6jYROUhVV/vKqyOB44DqwASgnqrGrLFkTVJNNnPmuHsOZsyAk0929xwceWTW5PBWROB+8T/S4SiAqNPsy98UNbGapCbS+kjIXgBvlx8Xk6p+AawLG30T0F9Vt/l5Vvvx7YA3VXWbqi4BfsElCGPi27jR9XzWvDksXuzuSv7882wJAax4nTGJSOQ+heHADBEZ7Z+3J/dls+sBrUTkIeAf4E5V/QaoAUwPzLfCj9uLiNwA3ABQq1atXIZhigRVePddlxBWrYIbb4SHH4ZKlSLObsXrjIkv5pGCiJQAZgBdcL/6/wK6qOpTudxeKaAScALQE3hbRITIRx4Rz2up6jBVba6qzav4Tk5MMfTrr3DWWXDJJVC1Kkyb5k4XRUkIYMXrjElEzKSgqruBx1X1W1V9RlWfVtU5edjeCmCUOjNxfTRU9uODzUIOAVbmYTumqNq2Dfr1g0aN4OuvXRPTmTPh+OPjLmrF64yJL5HTR5+KyIX4L/M8bm8McCowWUTqAWWAtbjS3G+IyBO4C81HADPzuC1TSEWtMzRxorvn4KefmHB0G+49qQulthxCz3l/JNT9pRWvMya+RFof/Q2Ux11gDlVGVVXdP85yI4E2uCOBP4C+wKu4axRNge24awqT/Pz3AtcAO4EeqvpJvOCt9VHRE6mFUM1tG3jjx7epOe59NtWszW0nXcfEWk2zplsLImNyJlbro7hJIZ1ZUih6Tuw/Kevu4RK7d3HFnI+584tX2WfXDsr06c0pJU9gyea9WyrX8Of+I915XKNiBlPvOTW5gRtTiOS1Sioi0oFAfwqqOib/wjNmj1Brn6NW/cxDnw7m6N9/4Yvax9C3bVc+v/8Glt7zUczlcjrNGJNdIp3sDAEOx91cBtBVRNqq6s1JjcwUS/XK7uLyscO48tuPWbNvJbqffxdjG7SiRqVyQPw6RFajyJi8SeRI4WSgcegis4i8AsxLalSm+FGFkSN5f3APSq/7k1eancsTra7g77Lls7UC6nlm/YjXDULTY00zxsSXSFJYhCuXHSqCVxOwPppN/lm0CG6+GSZOZJ8WLfj86Vd4YXlZNq3fSg1rQWRMgUqk9dEUoAV7moi2AKYBWwBU9fxkBhiLXWgu5LZuhUcegUcfhYwMdzfyjTdCyZLxlzXG5FpeLzTfl8/xGAPjxkH37u7O5E6dYOBAqFYt1VEZU+zFTQqqOqUgAjHFRGYm3H47vPMO1Kvnbkg71ZqLGpMuEulPoYOI/CwiG0Rko4j8LSIbCyI4U4Ts3AlPPQUNGsCHH7quMefOtYRgTJpJ5PTRY8B5qrow2cGYImr6dNfPwXffuSJ2gwbBYYelOipjTASJ9KfwhyUEkyvr1rkLxy1bwpo17pTRRx9ZQjAmjUU9UvB3MQPMEpG3cMXstoWmq+qo5IZmCpusYnR/beGaJV9x14QXKLtxvevv4IEHYL/9YhasM8akXqzTR+cFhrcAZwSeK2BJwWQJFbKrvmopIz8dzAnL5/NdjQasGzqSUzu2zTZP6OayzPVb6TXK3QdpicGY9BA1Kahql4IMxBRuz3z4Pd0nvMwNM0exuUwG95zZnbeanEH1JSUJXUqO1eWlJQVj0kMitY9eAW5T1fX+eSVcxzvXJDk2U1iMHcsrT1xHzQ1/8G7j03j4lGtYV64CkL0YXW66wzTGFKxEWh8dHUoIAKr6l4gck7yQTKGxfDncdhuMHs3Ogw7lksv7M7Nm42yzBIvRxStmZ4xJvURaH5XwRwcAiMgBJFhy2xRRO3a4O5CPPNLdmdy/P3M//Jx5hzXJNlt4MTrr8tKY9JfIl/vjwNci8q5/fjHwUPJCMmlt6lTo2hXmz4fzzoNnnoHatWkHaOkyMVsWJVLMzhiTWgn1vCYiDXF9KwswUVUXJDuwRFhBvAK0di3cfTcMHw41a8L//gft2qU6KmNMLuSqIJ6I7K+qG/3pot+BNwLTDlDVdfkfqkk7u3fDSy+5hLBhA9x1F9x3H5Qvn+rIjDFJEOv00RvAucBs3H0JIeKf222pRd28ea48xdSpcNJJMHQoNG4cfzljTKEV6z6Fc/3fOgUXjkkLmza5O5CffBIqVnSnjDp3hhKJtEswxhRmiVRJnZjIOFMEqMLo0dCwoWtd1KWL6xWtSxdLCMYUE7GuKewDlAMq+yap4iftD1QvgNhMQVqyBG65xRWsO+ooGDkSTjwx1VEZYwpYrGsKNwI9cAlgNnuSwkZgcLwVi8hw3DWJ1ara2I+7H7geWONn662qH4tIbWAhrj9ogOmq2jUnL8Tk3Jg5mTz50XzO+ewNbp32FqVKlaTUwIFw661QunS2+awZqTHFQ6xrCk8DT4vILar6v1ys+2VgEDAibPyTqjowwvy/qmrTXGzH5MKYOZmMeuJ1XvhkEEf8uZxx9f7Fo2fexG2nnkr7sIRgReyMKT6inigWkRYiUi2UEETkKhF5X0Se8c1UY1LVLwBrtpqOVq+m7LVdGPHa3eyzcztdLupL1wvuZUm5AxgwflG2WWMVsTPGFD2xrh4+B2wHEJHWQH/cr/4NwLA8bLO7iMwVkeHB8hlAHRGZIyJTRKRVtIVF5AYRmSUis9asWRNtNhPJ7t3w3HNQvz6nff85g/51CW2vHczndVtkzRJenM6K2BlTvMRKCiUDN6h1BIap6nuq+n/A4bnc3lCgLtAUWIUroYEfrqWqxwB3AG+IyP6RVqCqw1S1uao2r1KlSi7DKIa++871gNa1KzRtytW3DWNg66v4p/Q+2WYLL04XrVidFbEzpmiKmRREJHTN4TRgUmBargriqeofqrpLVXcDzwPH+fHbVPVPPzwb+BWol5ttmDB//w233w7NmsHixTBiBEyaxCVXnpFQcTorYmdM8RLry30kMEVE1gJbgS8BRORw3CmkHBORg1V1lX96ATDfj68CrFPVXSJyGHAEsDg32yjsctvSZ6/lzqhH+1+nua4wV61yfSU//DBUcmfsEi1OZ0XsjCleYhbEE5ETgIOBT1V1sx9XD9hXVb+NuWKRkUAboDLwB9DXP2+KK5OxFLhRVVeJyIVAP2AnsAvoq6ofxgu+qBXEC2/pA+5X+SMdjor5JRy+XK2/VvHQhGdptXg2HHOMK09x/PFJj98YUzjEKoiXUJXUdFXUksKJ/SdF7ISmRsUMpt5zaoQlsi9XZucObpzxLt2nvc32kqV44YxruH30U1DKur8wxuyRqyqppuDltqXPyvVbabn0Ox78bCh112UytkEr+p16HWv2O5DbLSEYY3LAvjHSSK66q/z9d54b9wRnfD+JpRUP5spL+vFlnWMBd4RhjDE5YVXO0kiOWvrs2gWDBrl7DhZ8xaBWnTjz2sFZCcFaCBljcsOOFNJIwi19Zs1y9xvMng2nn07JwYM5ZHN5KlsLIWNMHtmF5sJk/Xro0weGDIGqVV1/Bx07gkjcRY0xJsQuNBd2qq6U9R13wJo1cPPN8N//QoUKqY7MGFPEWFJIdz/9BN26wcSJ0Ly56++gWbNUR2WMKaLsQnO62roV7rvPdXgzaxYMHgzTp1tCMMYklR0ppKNx49wposWLoVMn1zVmtWqpjsoYUwzYkUI6ycyEiy+Gs85yPZ9NnAivvWYJwRhTYCwppIOdO+Gpp6BBAxg71l1E/v57ODV6aQtjjEkGO32UatOnw003uf4OzjrL3ZB22GGpjsoYU0zZkUKqrFvnylm3bOmamb77rmtZZAnBGJNClhQKmqrr6KZBA3jxRdcBzsKFcOGFdhOaMSblLCkUpAUL4JRToHNnOPxwV6bi8cdhv/1SHZkxxgCWFArGli3Qqxc0aQJz58KwYfDVV+65McakEbvQnA9idqE5dix07w7LlsHVV8Njj0GVKimN1xhjorGkkEfhXWFmrt9Kr1HzyFiVyZnPPwJjxkDDhjBlCrRundpgjTEmDksKeTRg/KJsfSqX2rWTK2aMovWjb0Apgf793cXkMmVSGKUxxiTGkkIeBbvKbLZiAQ+NH0yDtcv47PDjaTvhLTj00BRGZ4wxOWNJIY+qV8xgy8rfuWfyy3Sc9xkr9q/C9R36sKDFKbS1hGCMKWQsKeTF7t0M2vottV94kH23bebZ4y/k6ZaXQfnyPGJdYRpjCqGkNUkVkeEislpE5gfG3S8imSLynX+cHZjWS0R+EZFFInJmsuLKN/PmQevWHNOvJ7saHEmXW57j0TZdOOCgSjzS4SjrCtMYUygl80jhZWAQMCJs/JOqOjA4QkQaApcCjYDqwAQRqaequ8ihmM1D88OmTfDAA64rzIoV4aWXqNy5M6/Z3cjGmCIgaUcKqvoFsC7B2dsBb6rqNlVdAvwCHJfTbYaah2au34qyp3nomDmZOV3V3lRh9GjXvHTgQOjSBRYtcvceWEIwxhQRqbijubuIzPWnlyr5cTWA5YF5VvhxORLePBRg645dDBi/KNfBArBkCZx3HnTo4I4OvvoKnn8eDjwwb+s1xpg0U9BJYShQF2gKrAIe9+Mj/dTWSCsQkRtEZJaIzFqzZk22acHmoYmMj2v7dnjkEWjUCCZPdkcIs2fDiSfmbn3GGJPmCjQpqOofqrpLVXcDz7PnFNEKoGZg1kOAlVHWMUxVm6tq8yph5SKqV8yIuN1o42OaPBmaNoXevV0/BwsXwn/+43pEM8aYIqpAk4KIHBx4egEQapn0AXCpiJQVkTrAEcDMnK6/55n1yShdMtu4jNIl6ZmT5qGrV8NVV7lqpv/84/o4eO89qFkz/rLGGFPIJa31kYiMBNoAlUVkBdAXaCMiTXGnhpYCNwKo6g8i8jawANgJ3JyblkehVka5an20e7e7TnDPPbB5sztCuPdeKFcup2EYY0yhJaoRT90XCs2bN9dZs2blfUVz5rguMWfMgDZtYMgQOPLIvK/XGGPSkIjMVtXmkaYV7/4UNm6EHj2geXPXwujVV2HSJEsIxphiq3iWuVCFd95x1UtXrXJ9JT/8MFSqFH9ZY4wpworfkcIvv7jWRB07QtWqMG0aDB1qCcEYYyhOSWHbNujXDxo3hq+/hqefhpkz4fjjUx2ZMcakjeJx+mjCBOjWDX7+GS65xNUtql491VEZY0zaKdpHCqtWwWWXQdu2rsnp+PHw1luWEIwxJoqimRR27YJBg6BBAxg1Cvr2hfnz4YwzUh2ZMcaktaJ3+mjNGnchefZsOP10GDwY6tVLdVTGGFMoFL0jhcqVoW5dGDkSPv3UEoIxxuRA0TtSEHHXDYwxxuRY0TtSMMYYk2uWFIwxxmSxpGCMMSaLJQVjjDFZLCkYY4zJYknBGGNMFksKxhhjslhSMMYYk6VQd8cpImuAZamOI0xlYG2qg8iBwhRvYYoVCle8hSlWKFzxpmOsh6pqlUgTCnVSSEciMita36fpqDDFW5hihcIVb2GKFQpXvIUpVrDTR8YYYwIsKRhjjMliSSH/DUt1ADlUmOItTLFC4Yq3MMUKhSvewhSrXVMwxhizhx0pGGOMyWJJwRhjTBZLCnkkIheLyA8isltEojY7E5GlIjJPRL4TkVkFGWNYHInG+28RWSQiv4jIPQUZYyCGA0TkMxH52f+tFGW+lO3bePtJnGf89LkicmxBxhchnnjxthGRDX5ffici96UiTh/LcBFZLSLzo0xPm32bQKxps1/jUlV75OEBHAnUByYDzWPMtxSoXBjiBUoCvwKHAWWA74GGKYj1MeAeP3wP8Gg67dtE9hNwNvAJIMAJwIwUvveJxNsGGJuqGMNiaQ0cC8yPMj2d9m28WNNmv8Z72JFCHqnqQlVdlOo4EpVgvMcBv6jqYlXdDrwJtEt+dHtpB7zih18B2qcghlgS2U/tgBHqTAcqisjBBR2oly7va0JU9QtgXYxZ0mbfJhBroWFJoeAo8KmIzBaRG1IdTBw1gOWB5yv8uIJWVVVXAfi/B0WZL1X7NpH9lC77Miex/EtEvheRT0SkUcGElivptG8TUSj2a6lUB1AYiMgEoFqESfeq6vsJruZEVV0pIgcBn4nIj/7XRb7Lh3glwriktF2OFWsOVlNg+zZMIvupwPZlAhKJ5VtcXZxNInI2MAY4ItmB5VI67dt4Cs1+taSQAFU9PR/WsdL/XS0io3GH8kn54sqHeFcANQPPDwFW5nGdEcWKVUT+EJGDVXWVPy2wOso6CmzfhklkPxXYvkxA3FhUdWNg+GMRGSIilVU13Qq6QXrt25gK036100cFQETKi8h+oWHgDCBiK4U08Q1whIjUEZEywKXABymI4wOgsx/uDOx1lJPifZvIfvoAuMq3lDkB2BA6JZYCceMVkWoiIn74ONx3xJ8FHmli0mnfxlSo9muqr3QX9gdwAe4XyzbgD2C8H18d+NgPH4Zr6fE98APuNE7axuufnw38hGutkpJ4gQOBicDP/u8B6bZvI+0noCvQ1Q8LMNhPn0eMFmppEm93vx+/B6YDLVMY60hgFbDDf2avTdd9m0CsabNf4z2szIUxxpgsdvrIGGNMFksKxhhjslhSMMYYk8WSgjHGmCyWFIwxxmSxpGAKjIgcGKgS+buIZPrh9SKyoIBjaS8iDQPP+4lIjm76E5Ha0api5jCOuSLyo4jMF5GL8rK+GNvpISLlAs8/FpGKfniT/5vn12MKP0sKpsCo6p+q2lRVmwLPAk/64abA7vzenojEumO/PZCVFFT1PlWdkN8xxCIiTYCBQDtVbQCcBzwqIs2SsLkeQFZSUNWzVXV9ErZjCjlLCiZdlBSR58X19fCpiGQAiEhdERnni919KSIN/PhDRWSi/5U9UURq+fEvi8gTIvI57gt2r+VFpCVwPjDAH6nU9ctd5NfRX0QW+HUP9OOqishoX9Dse7+OHMcd5k7gYVVdAuD/Pgz8x69jsvg+L0Sksogs9cO1/Tq/9Y+Wfnwbv8y7/sjjdX+37624G/4+9/sl1AdF5WhvhoiUFJEBIvKN3w83xtpGLt5vk65SffecPYrnA7gfuNMP1wZ2Ak3987eBK/zwROAIP3w8MMkPfwh09sPXAGP88MvAWKBknOVfBi4KxPMycBFwALCIPf2XV/R/3wJ6+OGSQIXcxB22D74FmoSNawJ854cn4+/SBSoDS/1wOWAfP3wEMMsPtwE24GoAlQCmASf5aUsJ9DkRfA5sCrwP8/3wDUAfP1wWmAXUibUNexSNhxXEM+liiap+54dnA7VFZF+gJfBO4MdoWf/3X0AHP/wqrkOekHdUdVec5aPZCPwDvCAiH+ESDMCpwFUAqroL2CCuJ7icxh0kJFZVNVxpYJCINAV2AfUC02aq6goAEfkO90X/VQLrDHcGcHTgGkcFXALano/bMGnIkoJJF9sCw7uADNwv0fXqrjvEE/xy3ez/5mR5txLVnb5g2Wm4gnHdcQkhmrzE/QPQHJgbGHcs7lc5uKOQ0CnefQLz3I6rW9XET/8nRjy5/R8X4BZVHZ9tpEibfNyGSUN2TcGkLXXlhpeIyMWQ1SdvEz/5a9yXNkAnIvxSjbP838B+4cv4X/kVVPVj3MXZpn7SROAmP09JEdk/l3EHDQR6iUhtP19tv80BfvpSIHTROdgqqQKwSlV3A1fiTmfFE/H1xjAeuElESvvY6omrQmuKOEsKJt11Aq4VkVAV1FD3kbcCXURkLu6L8bYcLv8m0FNE5ohI3cD8+wFj/Xqn4H6V49d/iojMw50mitdzVrTtZvGnne4GPhSRn3DVS2/SPd2lDsR9MX+Nu6YQMgToLCLTcaeONhPfMOCT0IXmBLwALAC+FddM9TnsiKBYsCqpxqQJEemPuyh9pro+lI0pcJYUjDHGZLHTR8YYY7JYUjDGGJPFkoIxxpgslhSMMcZksaRgjDEmiyUFY4wxWf4fSGSJTRIM5HYAAAAASUVORK5CYII=", "text/plain": [ "
" ] }, "metadata": { "needs_background": "light" }, "output_type": "display_data" } ], "source": [ "# Erzeuge Q-Q Plot\n", "qqp = smi.qqplot(female_sample, line=\"r\")\n", "ax = qqp.gca()\n", "ax.set_title(\n", " \"Q-Q-Diagramm für die Körpergrösse der \\n in der Stichprobe befindlichen Studentinnen\"\n", ")\n", "ax.set_xlabel(\"Theoretische Quantillen\")\n", "ax.set_ylabel(\"Stichproben Quantillen\")" ] }, { "cell_type": "markdown", "id": "775fd3eb-329f-4a16-bada-8e5186c700fc", "metadata": {}, "source": [ "Wir sehen, dass die Daten ungefähr auf einer Geraden liegen. Auf der Grundlage des grafischen Auswertungsansatzes kommen wir zu dem Schluss, dass die interessierende Variable ungefähr normalverteilt ist." ] }, { "cell_type": "markdown", "id": "ea6d2ae1-97cd-423c-b6e8-f158a6775044", "metadata": {}, "source": [ "### Überprüfung der Hypothesen" ] }, { "cell_type": "markdown", "id": "decc4831-dca4-4616-abfd-f51d14f691b6", "metadata": {}, "source": [ "Zur Durchführung des **$\\chi^2$-Tests auf Standardabweichung** folgen wir dem Verfahren der schrittweisen Durchführung von Hypothesentests." ] }, { "cell_type": "markdown", "id": "b0db16fb-3712-4218-b1f1-13a421192817", "metadata": {}, "source": [ "**Schritt 1 : Geben Sie die Nullhypothese $H_0$ und alternative Hypothese $H_A$ an**" ] }, { "cell_type": "markdown", "id": "935e6e93-8d04-4b39-8a33-03d08432ff83", "metadata": {}, "source": [ "Die Nullhypothese besagt, dass die Standardabweichung der Körpergröße der Studentinnen ($\\sigma$) gleich der Standardabweichung der Grundgesamtheit ($\\sigma_0 \\approx 11,08$ cm) ist." ] }, { "cell_type": "markdown", "id": "3658df4d-4c7e-4afc-ada9-c6be97c11328", "metadata": {}, "source": [ "$$H_0: \\quad \\sigma = \\sigma_0$$" ] }, { "cell_type": "markdown", "id": "328cb671-b216-4aea-8873-9e8b4c501b96", "metadata": {}, "source": [ "**Alternative Hypothese**" ] }, { "cell_type": "markdown", "id": "41c9944d-079f-4e94-a13c-a698c3b6b03a", "metadata": {}, "source": [ "$$H_A: \\quad \\sigma < \\sigma_0$$" ] }, { "cell_type": "markdown", "id": "450f4e53-5c28-4226-ba81-95e245a69613", "metadata": {}, "source": [ "Diese Formulierung führt zu einem linksseitigen Hypothesentest." ] }, { "cell_type": "markdown", "id": "4c18e2ac-ece6-4f22-afa9-65fe23698a0f", "metadata": {}, "source": [ "**Schritt 2: Legen Sie das Signifikanzniveau,$\\alpha$ fest**" ] }, { "cell_type": "markdown", "id": "bc4c1def-ede9-40ec-8698-39b3e5aca3df", "metadata": {}, "source": [ "$$\\alpha = 0,05$$" ] }, { "cell_type": "code", "execution_count": 12, "id": "13d454c2-a0e0-40b4-ae93-40a4153ccdaf", "metadata": {}, "outputs": [], "source": [ "alpha = 0.05" ] }, { "cell_type": "markdown", "id": "1fbf8e56-b281-4166-949c-d5678cbd52e4", "metadata": {}, "source": [ "**Schritt 3 und 4: Berechnen Sie den Wert der Teststatistik und den $p$-Wert**" ] }, { "cell_type": "markdown", "id": "4056dbf4-e25e-44cf-98f5-18a68e5403b3", "metadata": {}, "source": [ "Zur Veranschaulichung berechnen wir die Teststatistik manuell in Python. Erinnern Sie sich an die Gleichung für die Teststatistik von oben:" ] }, { "cell_type": "markdown", "id": "ee0fade8-03a5-4901-8243-d3923acd18a0", "metadata": {}, "source": [ "$$\\chi^2 = \\frac{n-1}{\\sigma^2_0}s^2$$" ] }, { "cell_type": "code", "execution_count": 22, "id": "421fa43e-60c1-4862-bfbe-69cab86be5b2", "metadata": {}, "outputs": [ { "data": { "text/plain": [ "14.272211660048107" ] }, "execution_count": 22, "metadata": {}, "output_type": "execute_result" } ], "source": [ "# Berechne Teststatistik\n", "n = len(female_sample)\n", "s_2 = np.var(female_sample,ddof=1)\n", "sigma0_2 = np.var(students[\"height\"],ddof=1)\n", "x2 = ((n - 1) / sigma0_2) * s_2\n", "x2" ] }, { "cell_type": "markdown", "id": "b6fcce28-b4d7-4131-9735-566013b42b0b", "metadata": {}, "source": [ "Der numerische Wert der Teststatistik ist $14,27221166$.\n", "\n", "Um den $p$-Wert zu berechnen, wenden wir die Funktion `chi2.ppf()` an. Erinnern Sie sich daran, wie man die Freiheitsgrade berechnet:" ] }, { "cell_type": "markdown", "id": "3c5bccc2-08d8-478d-9c91-3e1e6ead20e2", "metadata": {}, "source": [ "$$df=n-1$$" ] }, { "cell_type": "code", "execution_count": 23, "id": "b8b066a9-aebf-4c5a-a228-7584d7b20046", "metadata": {}, "outputs": [ { "data": { "text/plain": [ "0.010089951471801363" ] }, "execution_count": 23, "metadata": {}, "output_type": "execute_result" } ], "source": [ "# Berechne df\n", "df = n - 1\n", "\n", "# Berechne p-Wert\n", "p = chi2.cdf(x2, df=df)\n", "p" ] }, { "cell_type": "markdown", "id": "c1ae44a4-c4a8-465e-bb2c-2ef8afc73010", "metadata": {}, "source": [ "**Schritt 5: Wenn $p \\le \\alpha , H_0$ ablehnen; ansonsten $H_0$ nicht ablehnen**" ] }, { "cell_type": "code", "execution_count": 24, "id": "37d4fe3f-ea6e-41f3-8115-0ded6ff9e743", "metadata": {}, "outputs": [ { "data": { "text/plain": [ "True" ] }, "execution_count": 24, "metadata": {}, "output_type": "execute_result" } ], "source": [ "p <= alpha" ] }, { "cell_type": "markdown", "id": "b318f422-5b3c-4297-ba43-4bbdf40ff86c", "metadata": {}, "source": [ "Der $p$-Wert ist kleiner als das angegebene Signifikanzniveau von $0,05$; wir verwerfen $H_0$. Die Testergebnisse sind statistisch signifikant auf dem $5 \\%$-Niveau und liefern starke Beweise gegen die Nullhypothese." ] }, { "cell_type": "markdown", "id": "5bba3ef9-e297-42f0-aefc-69b3e0bc2b14", "metadata": {}, "source": [ "**Schritt 6: Interpretieren Sie das Ergebnis des Hypothesentests**" ] }, { "cell_type": "markdown", "id": "a8cf0dc0-30a2-4ac7-b293-3aec4c3547f3", "metadata": {}, "source": [ "$p=0,01008995$. Bei einem Signifikanzniveau von $5 \\%$ lassen die Daten den Schluss zu, dass die Standardabweichung der Körpergröße von Studentinnen weniger als $11$ cm beträgt." ] }, { "cell_type": "markdown", "id": "4962de4c-0246-4265-930f-e042848d0279", "metadata": {}, "source": [ "### Hypothesentests in Python" ] }, { "cell_type": "markdown", "id": "e7183808-23d8-4020-993c-7651eb2648a4", "metadata": {}, "source": [ "Wir haben gerade einen $\\chi^2$-Test mit einer Standardabweichung in Python manuell durchgeführt. Meines Wissens bietet Python keine eingebaute Funktion zur Berechnung eines Standardabweichung $\\chi^2$-Test. Wir können jedoch eine solche Funktion selbst implementieren. Unsere Funktion `simple_chi2_test()` nimmt als Eingabe einen Stichprobenvektor `x`, die Standardabweichung der Grundgesamtheit `sigma0`, das Signifikanzniveau `alpha` und die angegebene Methode, `right`, `left` und `two-sided`." ] }, { "cell_type": "code", "execution_count": 25, "id": "adbc86eb-a4f2-4d49-a207-ac4cf6588899", "metadata": {}, "outputs": [], "source": [ "def simple_chi2_test(x, sigma0, alpha, method=\"two-sided\"):\n", " df = len(x) - 1\n", " v = np.var(x,ddof=1)\n", " # Berechne Teststatistik\n", " testchi = df / (sigma0**2) * v\n", "\n", " # linksseitiger Test\n", " if method == \"left\":\n", " p = chi2.cdf(x=testchi, df=df)\n", " # rechtsseitiger Test\n", " elif method == \"right\":\n", " p = 1 - chi2.cdf(x=testchi, df=df)\n", "\n", " # beidseitiger Test (default)\n", " else:\n", " p_upper = 1 - chi2.cdf(x=testchi, df=df)\n", " p_lower = chi2.cdf(x=testchi, df=df)\n", " if p_upper * 2 > 1:\n", " p = p_lower * 2\n", " else:\n", " p = p_upper * 2\n", " # evaluiere p < alpha\n", " if p < alpha:\n", " reject = True\n", " else:\n", " reject = False\n", "\n", " # Ausgabe\n", " print(\"Significance level:\", alpha)\n", " print(\"Degrees of freedom:\", df)\n", " print(\"Test statistic:\", round(testchi, 4))\n", " print(\"p-value:\", p)\n", " print(\"Reject H0:\", reject)" ] }, { "cell_type": "markdown", "id": "d3d28277-c5c6-42dc-92f8-8c18c3ce31c5", "metadata": {}, "source": [ "Wenden wir nun unsere selbst erstellte Funktion `simple_x2_test()` auf die obigen Beispieldaten an." ] }, { "cell_type": "code", "execution_count": 26, "id": "fb1125df-ab6d-4183-be81-d390a5bee7df", "metadata": {}, "outputs": [ { "name": "stdout", "output_type": "stream", "text": [ "Significance level: 0.05\n", "Degrees of freedom: 29\n", "Test statistic: 14.2722\n", "p-value: 0.010089951471801363\n", "Reject H0: True\n" ] } ], "source": [ "simple_chi2_test(x=female_sample, sigma0=sigma0, alpha=0.05, method=\"left\")" ] }, { "cell_type": "markdown", "id": "ca681053-bfc8-47e3-a76b-b6dd22400af9", "metadata": {}, "source": [ "Perfekt! Vergleichen Sie die Ausgabe der Funktion `simple_chi2_test()` mit unserem Ergebnis von oben. Auch hier können wir zu dem Schluss kommen, dass die Daten bei einem Signifikanzniveau von $5 \\%$ starke Anhaltspunkte dafür liefern, dass die Standardabweichung der Körpergröße von Studentinnen weniger als $11$ cm beträgt." ] }, { "cell_type": "code", "execution_count": 1, "id": "9b6039be-79c1-4768-a8ef-3cf2318f23de", "metadata": {}, "outputs": [ { "name": "stdout", "output_type": "stream", "text": [ "\n", "---------------------------------\n", "Working on the host: Joachims-MacBook-Pro.local\n", "\n", "---------------------------------\n", "Python version: 3.10.2 | packaged by conda-forge | (main, Feb 1 2022, 19:30:18) [Clang 11.1.0 ]\n", "\n", "---------------------------------\n", "Python interpreter: /opt/miniconda3/envs/srh/bin/python\n" ] } ], "source": [ "%matplotlib inline\n", "# Load the \"autoreload\" extension\n", "%load_ext autoreload\n", "# always reload modules\n", "%autoreload 2\n", "# black formatter for jupyter notebooks\n", "#%load_ext nb_black\n", "# black formatter for jupyter lab\n", "%load_ext lab_black\n", "\n", "%run ../../src/notebook_env.py" ] }, { "cell_type": "markdown", "id": "2d9d0bbf-d1c6-458d-b642-1becd42e6031", "metadata": { "tags": [] }, "source": [ "## Inferenz für Standardabweichungen zweier Grundgesamtheiten\n", "----------------------------------------" ] }, { "cell_type": "code", "execution_count": 27, "id": "0dee29d0-aea6-47ef-bff2-f435d84f1665", "metadata": {}, "outputs": [], "source": [ "import matplotlib.pyplot as plt\n", "import numpy as np\n", "import pandas as pd\n", "from random import sample\n", "from scipy.stats import f\n", "import statsmodels.api as smi" ] }, { "cell_type": "markdown", "id": "25d7551f-9717-427e-af1a-dfd1a07864aa", "metadata": {}, "source": [ "In diesem Abschnitt werden Hypothesentests für die Standardabweichungen zweier Grundgesamtheiten behandelt. Oder anders ausgedrückt, wir erörtern Methoden der Inferenz für die Standardabweichungen einer Variablen aus zwei verschiedenen Grundgesamtheiten. Diese Methoden beruhen auf der $F$-Verteilung, benannt zu Ehren von Sir Ronald Aylmer Fisher.\n", "\n", "Die $F$-Verteilung ist eine rechtsschiefe Wahrscheinlichkeitsdichteverteilung mit zwei Formparametern, $v_1$ und $v_2$, den Freiheitsgraden für den Zähler ($v_1$) und den Freiheitsgraden für den Nenner ($v_2$)." ] }, { "cell_type": "markdown", "id": "a8156479-a44d-41b4-bdcd-ff79eddaec2c", "metadata": {}, "source": [ "$$df = (v_1,v_2)$$" ] }, { "cell_type": "markdown", "id": "b56a0197-7315-4ffe-ad61-6be54f9d98b1", "metadata": {}, "source": [ "Wie bei jeder anderen Dichtekurve entspricht die Fläche unter der Kurve der $F$-Verteilung den Wahrscheinlichkeiten. Die Fläche unter der Kurve und damit die Wahrscheinlichkeit für ein gegebenes Intervall und einen gegebenen $df$-Wert wird mittels Software berechnet. Alternativ kann man sie auch in einer Tabelle nachschlagen. In diesen Tabellen werden im Allgemeinen die Freiheitsgrade für den Zähler ($v_1$) am oberen Rand angezeigt, während die Freiheitsgrade für den Nenner ($v_2$) in den äußeren Spalten auf der linken Seite angezeigt werden.\n", "\n", "Um einen Hypothesentest für zwei Grundgesamtheitsstandardabweichungen durchzuführen, wird der Wert berechnet, der einer bestimmten Fläche unter einer $F$-Kurve entspricht, berechnet.\n", "\n", "Für gegebenes $\\alpha$,wobei $\\alpha$ einer Wahrscheinlichkeit zwischen $0$ und $1$ entspricht, bezeichnet $F_\\alpha$ den Wert, der eine Fläche $\\alpha$ zu seiner Rechten unter einer $F$-Kurve hat." ] }, { "cell_type": "code", "execution_count": 28, "id": "2df9f1c3-869f-4469-aaf3-da6d9dd9cc9c", "metadata": { "tags": [ "hide-cell" ] }, "outputs": [ { "data": { "text/plain": [ "[,\n", " ,\n", " ,\n", " ,\n", " ,\n", " ]" ] }, "execution_count": 28, "metadata": {}, "output_type": "execute_result" }, { "data": { "image/png": "", "text/plain": [ "
" ] }, "metadata": { "needs_background": "light" }, "output_type": "display_data" } ], "source": [ "from scipy.stats import chi2\n", "import numpy as np\n", "import matplotlib.pyplot as plt\n", "\n", "v1 = 9\n", "v2 = 14\n", "alpha = 0.95\n", "x = np.linspace(0, 5, 1000)\n", "fig, ax = plt.subplots(figsize=(16, 7))\n", "ax.plot(x, f.pdf(x, v1, v2))\n", "ax.set_xlim(-0.05, 4)\n", "ax.axvline(0, color=\"k\")\n", "ax.axhline(0, color=\"k\")\n", "ax.vlines(\n", " f.ppf(alpha, v1, v2),\n", " ymin=0,\n", " ymax=f.pdf(f.ppf(alpha, v1, v2), v1, v2),\n", " color=\"k\",\n", " linestyle=\"dashed\",\n", ")\n", "\n", "ax.fill_between(\n", " x, f.pdf(x, v1, v2), where=x >= f.ppf(alpha, v1, v2), color=\"r\", alpha=0.5\n", ")\n", "\n", "ax.set_title(r\"$F$-Dichtefunktion, $df(v1=9, v2=14)$, $\\alpha=0.05$\")\n", "\n", "\n", "ax.annotate(\n", " r\"F-Kurve\",\n", " xy=(1.5, 0.35),\n", " xytext=(2, 0.5),\n", " # textcoords=\"data\",\n", " arrowprops=dict(headwidth=15, headlength=30, width=4, color=\"k\"),\n", " size=18,\n", ")\n", "\n", "ax.annotate(\n", " r\"Fläche = 0.05\",\n", " xy=(2.9, 0.015),\n", " xytext=(3, 0.3),\n", " # textcoords=\"data\",\n", " arrowprops=dict(headwidth=15, headlength=30, width=4, color=\"k\"),\n", " size=18,\n", ")\n", "\n", "ax.text(s=\"$F_{0.05}$\", x=f.ppf(alpha, v1, v2), y=0.08, size=18)\n", "ax.text(s=r\"Fläche = $1 - \\alpha$\", x=0.5, y=0.4, size=18)\n", "\n", "ticks = [0, 1, 2, f.ppf(alpha, v1, v2), 3, 4]\n", "ax.set_xticks(ticks)" ] }, { "cell_type": "markdown", "id": "3eb1fa64-7c30-40db-ba11-04b43bf2fe84", "metadata": {}, "source": [ "In der obigen Abbildung ergibt $F_{0,05}$ für $df=(9,14)$ den Wert $\\approx 2,6458$.\n", "\n", "Eine interessante Eigenschaft von $F$-Kurven ist die **reziproke Charakteristik**. Sie besagt, dass für eine $F$-Kurve mit $df=(v_1,v_2)$ der $F$-Wert mit der Fläche $\\alpha$ auf der linken Seite gleich dem Kehrwert des $F$-Wertes mit der Fläche $\\alpha$ auf der rechten Seite für eine $F$-Kurve mit $df=(v_2,v_1)$ ist ({cite:t}`fahrmeirstatistik` s.282). Übertragen auf das obige Beispiel, bei dem $F_{0,05}$ für $df=(9,14) \\approx 2,6458$ beträgt, bedeutet dies, dass $F_{0,95}$ für $df=(14,9) \\ ; \\ \\frac{1}{2,6458}=0,378$ beträgt." ] }, { "cell_type": "code", "execution_count": 29, "id": "1d978b65-823d-403a-9671-dc0430e0c6d7", "metadata": { "tags": [ "hide-cell" ] }, "outputs": [ { "data": { "text/plain": [ "[,\n", " ,\n", " ,\n", " ,\n", " ,\n", " ]" ] }, "execution_count": 29, "metadata": {}, "output_type": "execute_result" }, { "data": { "image/png": "", "text/plain": [ "
" ] }, "metadata": { "needs_background": "light" }, "output_type": "display_data" } ], "source": [ "from scipy.stats import chi2\n", "import numpy as np\n", "import matplotlib.pyplot as plt\n", "\n", "v1 = 14\n", "v2 = 9\n", "alpha = 0.05\n", "x = np.linspace(0, 5, 1000)\n", "fig, ax = plt.subplots(figsize=(16, 7))\n", "ax.plot(x, f.pdf(x, v1, v2))\n", "ax.set_xlim(-0.05, 4)\n", "ax.axvline(0, color=\"k\")\n", "ax.axhline(0, color=\"k\")\n", "ax.vlines(\n", " f.ppf(alpha, v1, v2),\n", " ymin=0,\n", " ymax=f.pdf(f.ppf(alpha, v1, v2), v1, v2),\n", " color=\"k\",\n", " linestyle=\"dashed\",\n", ")\n", "\n", "ax.fill_between(\n", " x, f.pdf(x, v1, v2), where=x <= f.ppf(alpha, v1, v2), color=\"r\", alpha=0.5\n", ")\n", "\n", "ax.set_title(r\"$F$-Dichtefunktion, $df(v1=14, v2=9)$, $\\alpha=0.95$\")\n", "\n", "\n", "ax.annotate(\n", " r\"F-Kurve\",\n", " xy=(1.5, 0.35),\n", " xytext=(2, 0.5),\n", " # textcoords=\"data\",\n", " arrowprops=dict(headwidth=15, headlength=30, width=4, color=\"k\"),\n", " size=18,\n", ")\n", "\n", "ax.annotate(\n", " r\"Fläche = 0.05\",\n", " xy=(0.27, 0.15),\n", " xytext=(0.28, 0.7),\n", " # textcoords=\"data\",\n", " arrowprops=dict(headwidth=15, headlength=30, width=4, color=\"k\"),\n", " size=18,\n", " horizontalalignment=\"center\",\n", ")\n", "\n", "ax.text(s=\"$F_{0.05}$\", x=f.ppf(alpha, v1, v2), y=0.08, size=18)\n", "ax.text(s=r\"Fläche = $1 - \\alpha$\", x=0.5, y=0.4, size=18)\n", "\n", "ticks = [0, 1, 2, f.ppf(alpha, v1, v2), 3, 4]\n", "ax.set_xticks(ticks)" ] }, { "cell_type": "markdown", "id": "12457b42-e401-4cc2-be2b-81a69b4bfc16", "metadata": {}, "source": [ "### Intervall-Schätzung von $\\sigma_1-\\sigma_2$" ] }, { "cell_type": "markdown", "id": "b19eb24e-7a9c-4e1c-9788-107445f9acfb", "metadata": {}, "source": [ "Das $100(1-\\alpha)\\%$-Konfidenzintervall für $\\sigma$ beträgt" ] }, { "cell_type": "markdown", "id": "8906daaa-678a-415f-9525-28afdca16014", "metadata": {}, "source": [ "$$\\frac{1}{\\sqrt{F_{\\alpha /2}}} \\times \\frac{s_1}{s_2} \\le \\sigma \\le \\frac{1}{\\sqrt{F_{1-\\alpha /2}}} \\times \\frac{s_1}{s_2}\\text{,}$$" ] }, { "cell_type": "markdown", "id": "4a6f50a3-ceb1-4a97-aa23-d7a87b2942a0", "metadata": {}, "source": [ "wobei $s_1$ und $s_2$ die Standardabweichungen der Stichprobe sind." ] }, { "cell_type": "markdown", "id": "c30c39ae-ae99-4f01-8481-2236b8e23058", "metadata": { "tags": [] }, "source": [ "### $F$-Test für zwei Standardabweichungen" ] }, { "cell_type": "markdown", "id": "84d9f024-89e7-443e-8979-a1db268e215d", "metadata": {}, "source": [ "Das Hypothesentestverfahren für die Standardabweichung wird als F-Test für zwei Standardabweichungen bezeichnet. Der Hypothesentest für zwei Standardabweichungen der Grundgesamtheit folgt demselben schrittweisen Verfahren wie andere Hypothesentests." ] }, { "cell_type": "markdown", "id": "48346e81-8632-479a-9e0d-df030e55c67d", "metadata": {}, "source": [ "$$\n", "\\begin{array}{l}\n", "\\hline\n", "\\ \\text{Schritt 1} & \\text{Geben Sie die Nullhypothese } H_0 \\text{ und alternative Hypothese } H_A \\text{ an.}\\\\\n", "\\ \\text{Schritt 2} & \\text{Legen Sie das Signifikanzniveau, } \\alpha\\text{ fest.} \\\\\n", "\\ \\text{Schritt 3} & \\text{Berechnen Sie den Wert der Teststatistik.} \\\\\n", "\\ \\text{Schritt 4} &\\text{Bestimmen Sie den p-Wert.} \\\\\n", "\\ \\text{Schritt 5} & \\text{Wenn }p \\le \\alpha \\text{, } H_0 \\text{ ablehnen } \\text{; ansonsten } H_0 \\text{ nicht ablehnen} \\text{.} \\\\\n", "\\ \\text{Schritt 6} &\\text{Interpretieren Sie das Ergebnis des Hypothesentests.} \\\\\n", "\\hline \n", "\\end{array}\n", "$$" ] }, { "cell_type": "markdown", "id": "a4350189-69c9-4ff8-a2b2-12996a5cf537", "metadata": {}, "source": [ "Die Teststatistik für einen Hypothesentest für eine normalverteilte Variable und für unabhängige Stichproben der Größen $n_1$ und $n_2$ ist gegeben durch" ] }, { "cell_type": "markdown", "id": "1002d2b3-0d2e-45e3-b4cb-1d33ece88865", "metadata": {}, "source": [ "$$F = \\frac{s_1^2/\\sigma_1^2}{s_2^2/\\sigma_2^2}\\text{,}$$" ] }, { "cell_type": "markdown", "id": "e26ae144-0f4b-47f8-b114-0ec1f12ef164", "metadata": {}, "source": [ "mit $df=(n_1-1,n_2-1)$.\n", "\n", "Wenn $H_0: \\sigma_1 = \\sigma_2$ wahr ist, dann vereinfacht sich die Gleichung zu" ] }, { "cell_type": "markdown", "id": "912318f6-534e-49b7-9a45-fe94960f28e3", "metadata": {}, "source": [ "$$F = \\frac{s_1^2}{s_2^2}$$" ] }, { "cell_type": "markdown", "id": "44488088-59ac-4dfd-beb1-2fcdc766e475", "metadata": {}, "source": [ "### $F$-Test für zwei Standardabweichungen : Ein Beispiel" ] }, { "cell_type": "markdown", "id": "288ef57c-8517-4c33-bf13-20e0361afeee", "metadata": {}, "source": [ "Um einige praktische Erfahrungen zu sammeln, wenden wir den **$F$-Test für zwei Standardabweichungen** in einer Übung an. Dazu laden wir den `students` Datensatz. Sie können die Datei `students.csv` hier herunterladen. Importieren Sie den Datensatz und geben Sie ihm einen passenden Namen." ] }, { "cell_type": "code", "execution_count": 30, "id": "036bed03-c382-4f19-b3c1-6710e2997a1f", "metadata": {}, "outputs": [], "source": [ "# Lese Datei students.csv als Dataframe ein; Indexspalte wird übersprungen\n", "students = pd.read_csv(\"../../data/students.csv\", index_col=0)" ] }, { "cell_type": "markdown", "id": "d5c2a98e-3292-4007-8e69-a1df1253163c", "metadata": {}, "source": [ "Der `students` Datensatz besteht aus $8239$ Zeilen, von denen jede einen bestimmten Studenten repräsentiert, und $16$ Spalten, von denen jede einer Variable/einem Merkmal entspricht, das sich auf diesen bestimmten Studenten bezieht. Diese selbsterklärenden Variablen sind: *stud_id, name, gender, age, height, weight, religion, nc_score, semester, major, minor, score1, score2, online_tutorial, graduated, salary.*" ] }, { "cell_type": "markdown", "id": "8832e32a-78d2-4e2a-8724-5a6fa2e34187", "metadata": {}, "source": [ "Um den **$F$-Test für zwei Standardabweichungen** zu zeigen, untersuchen wir die Streuung der Körpergröße in cm der Studentinnen und vergleichen sie mit der Streuung der Körpergröße aller Studenten (unserer Grundgesamtheit). **Wir wollen testen, ob sich die Standardabweichung der Körpergröße der weiblichen Studenten ($\\sigma_1$) von der Standardabweichung der Körpergröße der männlichen Studenten ($\\sigma_2$) unterscheidet**." ] }, { "cell_type": "markdown", "id": "70a678f1-ee18-4eee-b23c-877d070ecedc", "metadata": {}, "source": [ "### Vorbereitung der Daten" ] }, { "cell_type": "markdown", "id": "6cba4b2c-d439-40c0-a0c1-5be3d78f6cb1", "metadata": {}, "source": [ "\n", "- Wir unterteilen den Datensatz anhand der Variable `gender`.\n", "- Dann nehmen wir $25$ weibliche und $25$ männliche Studenten in die Stichprobe auf.\n", "- Dann berechnen wir die Standardabweichungen der interessierenden Variable (Körpergröße in cm) für beide Stichproben und weisen ihnen die Variablen `std_female` und `std_male` zu." ] }, { "cell_type": "code", "execution_count": 31, "id": "a14938df-ba44-4d57-a958-59f3d794119f", "metadata": {}, "outputs": [], "source": [ "# Unterteile Datensatz nach Variable `gender`\n", "male = students.loc[students[\"gender\"] == \"Male\"]\n", "female = students.loc[students[\"gender\"] == \"Female\"]\n", "\n", "# Entnehme Probe von jeweils 25 Studenten\n", "n = 25\n", "male_sample = male[\"height\"].sample(n=25, random_state=1)\n", "female_sample = female[\"height\"].sample(n=25, random_state=1)" ] }, { "cell_type": "code", "execution_count": 32, "id": "f54b81f8-499e-4e99-8984-a4b94cc1e5b3", "metadata": {}, "outputs": [ { "data": { "text/plain": [ "7.009041779492163" ] }, "execution_count": 32, "metadata": {}, "output_type": "execute_result" } ], "source": [ "std_female = np.std(female_sample, ddof=1)\n", "std_female" ] }, { "cell_type": "code", "execution_count": 33, "id": "83a0dd60-8555-4a2f-b965-53fc0a108c97", "metadata": {}, "outputs": [ { "data": { "text/plain": [ "8.203251387915241" ] }, "execution_count": 33, "metadata": {}, "output_type": "execute_result" } ], "source": [ "std_male = np.std(male_sample, ddof=1)\n", "std_male" ] }, { "cell_type": "markdown", "id": "a27679fd-5a8e-4e64-bdc3-1fc7f55ff556", "metadata": {}, "source": [ "Außerdem überprüfen wir die Normalverteilungsannahme, indem wir ein Q-Q-Diagramm erstellen. In Python können wir die Funktion `qqplot()` verwenden, um Q-Q-Plots zu erstellen." ] }, { "cell_type": "code", "execution_count": 34, "id": "47ef6bcd-8392-4fdb-aed9-719b4e9b2015", "metadata": {}, "outputs": [ { "data": { "text/plain": [ "Text(0, 0.5, 'Stichproben Quantillen')" ] }, "execution_count": 34, "metadata": {}, "output_type": "execute_result" }, { "data": { "image/png": "", "text/plain": [ "
" ] }, "metadata": { "needs_background": "light" }, "output_type": "display_data" } ], "source": [ "# Erzeuge Q-Q Plot\n", "qqp = smi.qqplot(female_sample, line=\"r\")\n", "ax = qqp.gca()\n", "ax.set_title(\n", " \"Q-Q-Diagramm für die Körpergrösse der \\n in der weiblichen Studentinnen (Stichprobe)\"\n", ")\n", "ax.set_xlabel(\"Theoretische Quantillen\")\n", "ax.set_ylabel(\"Stichproben Quantillen\")" ] }, { "cell_type": "code", "execution_count": 35, "id": "9b8f2769-0989-4db4-9103-71a1c810dd85", "metadata": {}, "outputs": [ { "data": { "text/plain": [ "Text(0, 0.5, 'Stichproben Quantillen')" ] }, "execution_count": 35, "metadata": {}, "output_type": "execute_result" }, { "data": { "image/png": "", "text/plain": [ "
" ] }, "metadata": { "needs_background": "light" }, "output_type": "display_data" } ], "source": [ "# Erzeuge Q-Q Plot\n", "qqp = smi.qqplot(male_sample, line=\"r\")\n", "ax = qqp.gca()\n", "ax.set_title(\n", " \"Q-Q-Diagramm für die Körpergrösse der \\n in der männlichen Studenten (Stichprobe)\"\n", ")\n", "ax.set_xlabel(\"Theoretische Quantillen\")\n", "ax.set_ylabel(\"Stichproben Quantillen\")" ] }, { "cell_type": "markdown", "id": "ba6d5c46-07ca-4a9d-9e96-b33dd8233ff5", "metadata": {}, "source": [ "Wir sehen, dass die Daten ungefähr auf einer Geraden liegen. Auf der Grundlage des grafischen Auswertungsansatzes kommen wir zu dem Schluss, dass die interessierende Variable ungefähr normalverteilt ist." ] }, { "cell_type": "markdown", "id": "104666fc-9eff-472c-9d66-150c60e1e853", "metadata": {}, "source": [ "### Überprüfung der Hypothesen" ] }, { "cell_type": "markdown", "id": "307af3d3-10eb-4953-a89d-679e01efa9ed", "metadata": {}, "source": [ "Zur Durchführung des **$F$-Tests für zwei Standardabweichungen** folgen wir dem Verfahren der schrittweisen Durchführung von Hypothesentests." ] }, { "cell_type": "markdown", "id": "2a423dc7-fab0-49b0-b85f-e568c40e8298", "metadata": {}, "source": [ "**Schritt 1 : Geben Sie die Nullhypothese $H_0$ und alternative Hypothese $H_A$ an**" ] }, { "cell_type": "markdown", "id": "c94810ca-86d9-4e56-b90c-e332f846d159", "metadata": {}, "source": [ "Die Nullhypothese besagt, dass die Standardabweichung der Körpergröße der weiblichen Studenten ($\\sigma_1$) gleich der Standardabweichung der Körpergröße der männlichen Studenten ($\\sigma_2$) ist." ] }, { "cell_type": "markdown", "id": "4edfff4a-21f9-4fe4-aef6-a1f88ad54284", "metadata": {}, "source": [ "$$H_0: \\quad \\sigma_1 = \\sigma_2$$" ] }, { "cell_type": "markdown", "id": "e3fac2df-b9f4-48d9-899f-99bb5d6c96e0", "metadata": {}, "source": [ "**Alternative Hypothese**" ] }, { "cell_type": "markdown", "id": "6928bdd2-304d-401e-9737-1ee0ab5adb8a", "metadata": {}, "source": [ "$$H_A: \\quad \\sigma_1 \\ne \\sigma_2$$" ] }, { "cell_type": "markdown", "id": "c258df2a-c3d5-48ed-a20e-77ff462c68bf", "metadata": {}, "source": [ "Diese Formulierung führt zu einem zweiseitigen Hypothesentest." ] }, { "cell_type": "markdown", "id": "896119f6-1624-4484-9308-4bc0b8a3cc0a", "metadata": {}, "source": [ "**Schritt 2: Legen Sie das Signifikanzniveau,$\\alpha$ fest**" ] }, { "cell_type": "markdown", "id": "78946df7-f7d5-441d-b80f-9961dd8ab746", "metadata": {}, "source": [ "$$\\alpha = 0,05$$" ] }, { "cell_type": "code", "execution_count": 36, "id": "21f4b2fb-35c1-49f0-88fb-6339a5215104", "metadata": {}, "outputs": [], "source": [ "alpha = 0.05" ] }, { "cell_type": "markdown", "id": "20191cd5-abfd-4474-bfbe-e7887aea61f6", "metadata": {}, "source": [ "**Schritt 3 und 4: Berechnen Sie den Wert der Teststatistik und den $p$-Wert**" ] }, { "cell_type": "markdown", "id": "09896237-db5b-4bf5-8bcb-394c812238a5", "metadata": {}, "source": [ "Zur Veranschaulichung berechnen wir die Teststatistik manuell in Python. Erinnern Sie sich an die Gleichung für die Teststatistik von oben:" ] }, { "cell_type": "markdown", "id": "878f2436-0f14-486a-9545-6ca5feb0474f", "metadata": {}, "source": [ "$$F = \\frac{s_1^2}{s_2^2}$$" ] }, { "cell_type": "code", "execution_count": 37, "id": "ce0c013f-57e6-451d-9a36-8cf7ba820256", "metadata": {}, "outputs": [ { "data": { "text/plain": [ "0.7300376461264116" ] }, "execution_count": 37, "metadata": {}, "output_type": "execute_result" } ], "source": [ "# Berechne die Teststatistik\n", "Ftest = std_female**2 / std_male**2\n", "Ftest" ] }, { "cell_type": "markdown", "id": "ac667f43-3c65-48ec-b5cc-0d9adabf7058", "metadata": {}, "source": [ "Der numerische Wert der Teststatistik beträgt $\\approx 0,73$.\n", "\n", "Um den $p$-Wert zu berechnen, wenden wir die Funktion `f.cdf()` an. Erinnern Sie sich daran, wie man die Freiheitsgrade berechnet." ] }, { "cell_type": "markdown", "id": "59add00f-75c6-4e96-9cd9-f9ad0750e075", "metadata": {}, "source": [ "$$df = (n_1 - 1, n_2 - 1)$$" ] }, { "cell_type": "code", "execution_count": 38, "id": "1f6026e6-13b7-424f-8a40-a7a2762a1f8e", "metadata": {}, "outputs": [ { "data": { "text/plain": [ "0.4465246946119613" ] }, "execution_count": 38, "metadata": {}, "output_type": "execute_result" } ], "source": [ "# Berechne df\n", "df1 = len(female_sample) - 1\n", "df2 = len(male_sample) - 1\n", "\n", "# Berechne p-Wert\n", "p_upper = 1 - f.cdf(Ftest, dfn=df1, dfd=df2)\n", "p_lower = f.cdf(Ftest, dfn=df1, dfd=df2)\n", "\n", "if p_upper * 2 > 1:\n", " p = p_lower * 2\n", "else:\n", " p = p_upper * 2\n", "p" ] }, { "cell_type": "markdown", "id": "e925335a-33f3-4b89-9f02-d1685495706d", "metadata": {}, "source": [ "**Schritt 5: Wenn $p \\le \\alpha , H_0$ ablehnen; ansonsten $H_0$ nicht ablehnen**" ] }, { "cell_type": "code", "execution_count": 39, "id": "6de50b47-1cc6-420d-afdd-fb4be50e1bb2", "metadata": {}, "outputs": [ { "data": { "text/plain": [ "False" ] }, "execution_count": 39, "metadata": {}, "output_type": "execute_result" } ], "source": [ "p <= alpha" ] }, { "cell_type": "markdown", "id": "30d2942a-893f-4f33-adf1-e8d7563c4093", "metadata": {}, "source": [ "Der $p$-Wert ist größer als das angegebene Signifikanzniveau von $0,05$; wir verwerfen $H_0$ nicht. Die Testergebnisse sind auf dem $5 \\%$-Niveau statistisch signifikant und liefern keinen ausreichenden Beweis gegen die Nullhypothese." ] }, { "cell_type": "markdown", "id": "abe8fd70-960a-4c80-a8c0-8f41a308aab5", "metadata": {}, "source": [ "**Schritt 6: Interpretieren Sie das Ergebnis des Hypothesentests**" ] }, { "cell_type": "markdown", "id": "cb145141-8c18-4a98-9067-e7f756c0b8fd", "metadata": {}, "source": [ "$p=0,44652469$. Bei einem Signifikanzniveau von $5 \\%$ liefern die Daten keine ausreichenden Beweise für die Schlussfolgerung, dass die Standardabweichungen der Körpergröße von weiblichen und männlichen Studenten unterschiedlich sind." ] }, { "cell_type": "markdown", "id": "57592b0f-866c-4462-8b05-c097e4c9b4a3", "metadata": {}, "source": [ "### Hypothesentests in Python" ] }, { "cell_type": "markdown", "id": "ee2ab916-89fd-4866-aa21-df1edd5c3506", "metadata": {}, "source": [ "Wir haben gerade einen $F$-Test für zwei Standardabweichungen in Python manuell durchgeführt. OK, wir haben eine Menge gelernt, aber jetzt nutzen wir die Mittel von Python, um das gleiche Ergebnis wie oben mit nur einer Zeile Code zu erhalten!\n", "\n", "Um einen $F$-Test für zwei Standardabweichungen in Python durchzuführen, verwenden wir unsere Funktion `simple_x2_test()` und verändern sie geringfügig. Wir geben zwei Vektoren als Dateneingabe an: `female_sample` und `male_sample`. Das Argument `alternative` muss nicht angegeben werden, da `alternative = 'two-sided'` die Vorgabe ist." ] }, { "cell_type": "code", "execution_count": 40, "id": "6b8426cc-3578-4312-8575-835f10f6b9df", "metadata": {}, "outputs": [], "source": [ "def simple_f_test(x, y, dfn, dfd, alpha, method=\"two-sided\"):\n", " df1 = len(female_sample) - 1\n", " df2 = len(male_sample) - 1\n", " std_male = np.std(male_sample, ddof=1)\n", " std_female = np.std(female_sample, ddof=1)\n", " # Berechne Teststatistik\n", " Ftest = std_female**2 / std_male**2\n", "\n", " # linksseitiger Test\n", " if method == \"left\":\n", " p = scipy.stats.f.cdf(x=Ftest, dfn=df1, dfd=df2)\n", " # rechtsseitiger Test\n", " elif method == \"right\":\n", " p = 1 - scipy.stats.f.cdf(x=Ftest, dfn=df1, dfd=df2)\n", "\n", " # beidseitiger Test (default)\n", " else:\n", " p_upper = 1 - f.cdf(Ftest, dfn=df1, dfd=df2)\n", " p_lower = f.cdf(Ftest, dfn=df1, dfd=df2)\n", "\n", " if p_upper * 2 > 1:\n", " p = p_lower * 2\n", " else:\n", " p = p_upper * 2\n", " # evaluiere p < alpha\n", " if p < alpha:\n", " reject = True\n", " else:\n", " reject = False\n", "\n", " # Ausgabe\n", " print(\"Significance level:\", alpha)\n", " print(\"Degrees of freedom:\", df1, df2)\n", " print(\"Test statistic:\", round(Ftest, 4))\n", " print(\"p-value:\", p)\n", " print(\"Reject H0:\", reject)" ] }, { "cell_type": "code", "execution_count": 41, "id": "f1fbdcf8-f1eb-42e8-b818-be3f59b39aef", "metadata": {}, "outputs": [ { "name": "stdout", "output_type": "stream", "text": [ "Significance level: 0.05\n", "Degrees of freedom: 24 24\n", "Test statistic: 0.73\n", "p-value: 0.4465246946119613\n", "Reject H0: False\n" ] } ], "source": [ "simple_f_test(female_sample, male_sample, df1, df2, alpha=alpha)" ] }, { "cell_type": "markdown", "id": "071c0cf0-582c-4323-b25a-dc6895cf7e45", "metadata": {}, "source": [ "Es hat gut funktioniert! Vergleichen Sie die Ausgabe der Funktion `simple_f_test()` mit unserem Ergebnis von oben. Auch hier können wir zu dem Schluss kommen, dass die Daten bei einem Signifikanzniveau von $5 \\%$ keine ausreichenden Beweise dafür liefern, dass die Standardabweichungen der Körpergröße von weiblichen und männlichen Studenten unterschiedlich sind." ] } ], "metadata": { "kernelspec": { "display_name": "Python 3 (ipykernel)", "language": "python", "name": "python3" }, "language_info": { "codemirror_mode": { "name": "ipython", "version": 3 }, "file_extension": ".py", "mimetype": "text/x-python", "name": "python", "nbconvert_exporter": "python", "pygments_lexer": "ipython3", "version": "3.10.2" }, "vscode": { "interpreter": { "hash": "31f2aee4e71d21fbe5cf8b01ff0e069b9275f58929596ceb00d14d90e3e16cd6" } } }, "nbformat": 4, "nbformat_minor": 5 }