{"id":880,"date":"2024-08-10T12:01:41","date_gmt":"2024-08-10T10:01:41","guid":{"rendered":"podlove-2024-08-08t13:45:40+00:00-aee7c69b12b67e4"},"modified":"2024-08-09T10:52:30","modified_gmt":"2024-08-09T08:52:30","slug":"dl053-normalverteilung","status":"publish","type":"podcast","link":"https:\/\/www.datenleben.de\/index.php\/2024\/08\/10\/dl053-normalverteilung\/","title":{"rendered":"dl053: normalverteilung"},"content":{"rendered":"\n\t\t\n            <div class=\"podlove-web-player intrinsic-ignore podlove-web-player-loading\" id=\"player-6a38313b0cd4a\"><root data-test=\"player--xl\" style=\"max-width:950px;min-width:260px;\">\n  <div class=\"tablet:px-6 tablet:pt-6 mobile:px-4 mobile:pt-4 flex flex-col\">\n    <div class=\"flex-col items-center mobile:flex tablet:hidden\">\n      <show-title class=\"text-sm\"><\/show-title>\n      <episode-title class=\"text-base mb-2\"><\/episode-title>\n      <subscribe-button class=\"mb-4 mobile:flex tablet:hidden\"><\/subscribe-button>\n      <poster class=\"rounded-sm w-48 shadow overflow-hidden\"><\/poster>\n      <divider class=\"w-full my-6\"><\/divider>\n    <\/div>\n\n    <div class=\"tablet:flex flex-grow\">\n      <div class=\"w-64 mobile:hidden tablet:block tablet:mr-6\">\n        <poster class=\"rounded-sm shadow overflow-hidden\"><\/poster>\n      <\/div>\n      <div class=\"w-full\">\n        <div class=\"hidden tablet:block\">\n          <show-title class=\"text-base\"><\/show-title>\n          <episode-title class=\"text-xl desktop:text-2xl\"><\/episode-title>\n          <divider class=\"w-full my-4\"><\/divider>\n        <\/div>\n        <div class=\"flex items-center justify-between\">\n          <div class=\"block\">\n            <play-state on=\"active\">\n              <speed-control class=\"flex items-center\"><\/speed-control>\n            <\/play-state>\n          <\/div>\n\n          <div class=\"flex\">\n            <play-state on=\"active\">\n              <chapter-previous class=\"mx-2 block\"><\/chapter-previous>\n            <\/play-state>\n            <play-state on=\"active\">\n              <step-backward class=\"mx-2 block\"><\/step-backward>\n            <\/play-state>\n\n            <play-button class=\"mx-2 block\" :label=\"$t('PLAYER.PLAY_EPISODE')\"><\/play-button>\n\n            <play-state on=\"active\">\n              <step-forward class=\"mx-2 block\"><\/step-forward>\n            <\/play-state>\n            <play-state on=\"active\">\n              <chapter-next class=\"mx-2 block\"><\/chapter-next>\n            <\/play-state>\n          <\/div>\n\n          <div class=\"block\">\n            <play-state on=\"active\">\n              <volume-control class=\"flex items-center\"><\/volume-control>\n            <\/play-state>\n          <\/div>\n        <\/div>\n        <div class=\"flex w-full\">\n          <progress-bar><\/progress-bar>\n        <\/div>\n        <div class=\"flex w-full -mt-2\">\n          <div class=\"w-3\/12 text-left\">\n            <timer-current class=\"text-sm\"><\/timer-current>\n          <\/div>\n          <div class=\"w-6\/12 text-center truncate\">\n            <play-state on=\"active\">\n              <current-chapter class=\"text-sm\"><\/current-chapter>\n            <\/play-state>\n          <\/div>\n          <div class=\"w-3\/12 text-right\">\n            <timer-duration class=\"text-sm\"><\/timer-duration>\n          <\/div>\n        <\/div>\n      <\/div>\n    <\/div>\n    <divider class=\"w-full mt-6 mb-3\"><\/divider>\n    <div class=\"flex justify-between\">\n      <div class=\"flex mobile:w-full tablet:w-3\/12 desktop:w-3\/12 justify-between\">\n        <tab-trigger tab=\"chapters\">\n          <icon type=\"chapter\"><\/icon>\n        <\/tab-trigger>\n        <tab-trigger tab=\"transcripts\">\n          <icon type=\"transcripts\"><\/icon>\n        <\/tab-trigger>\n        <tab-trigger tab=\"files\">\n          <icon type=\"download\"><\/icon>\n        <\/tab-trigger>\n        <tab-trigger tab=\"playlist\">\n          <icon type=\"playlist\"><\/icon>\n        <\/tab-trigger>\n        <tab-trigger tab=\"share\">\n          <icon type=\"share\"><\/icon>\n        <\/tab-trigger>\n      <\/div>\n      <subscribe-button class=\"mt-1 mobile:hidden tablet:flex\"><\/subscribe-button>\n    <\/div>\n  <\/div>\n  <div class=\"w-full relative overflow-hidden\">\n    <tab name=\"chapters\">\n      <tab-chapters><\/tab-chapters>\n    <\/tab>\n    <tab name=\"transcripts\">\n      <tab-transcripts><\/tab-transcripts>\n    <\/tab>\n    <tab name=\"files\">\n      <tab-files><\/tab-files>\n    <\/tab>\n    <tab name=\"playlist\">\n      <tab-playlist><\/tab-playlist>\n    <\/tab>\n    <tab name=\"share\">\n      <tab-share><\/tab-share>\n    <\/tab>\n    <tab-overflow><\/tab-overflow>\n  <\/div>\n  <error><\/error>\n<\/root>\n<\/div>\n            <script>\n              document.addEventListener(\"DOMContentLoaded\", function() {\n                var player = document.getElementById(\"player-6a38313b0cd4a\");\n                podlovePlayerCache.add([{\"url\":\"https:\\\/\\\/www.datenleben.de\\\/index.php\\\/wp-json\\\/podlove-web-player\\\/shortcode\\\/publisher\\\/880\",\"data\":{\"version\":5,\"show\":{\"title\":\"datenleben\",\"subtitle\":\"der podcast \\u00fcber data science\",\"summary\":\"Was ist Data Science? Was bedeuten die Daten f\\u00fcr unser Leben? Woher kommen sie und wozu werden sie benutzt?\\r\\nDas sind alles Fragen, mit denen wir uns auseinander setzen werden.\\r\\nWer schon immer mehr \\u00fcber Daten und deren Effekt auf unser Leben wissen wollte, ist hier genau richtig.\",\"poster\":\"https:\\\/\\\/www.datenleben.de\\\/podlove\\\/image\\\/687474703a2f2f7777772e646174656e6c6562656e2e64652f77702d636f6e74656e742f75706c6f6164732f323032302f30362f636f7665722e706e67\\\/500\\\/0\\\/0\\\/datenleben\",\"link\":\"https:\\\/\\\/www.datenleben.de\"},\"title\":\"dl053: normalverteilung\",\"subtitle\":\"Warum ist die Normalverteilung eigentlich normal?\",\"summary\":\"Es geht dieses Mal um ein sehr mathematisches Thema, das nicht nur in unserem Podcast schon \\u00f6fter erw\\u00e4hnt wurde, sondern allgemein h\\u00e4ufiger mal eine Rolle spielt: Die Normalverteilung. Fragen, die wir uns in diesem Kontext gestellt haben: Was ist die Normalverteilung? Warum ist die Normalverteilung eigentlich normal? Liegt \\u00fcberhaupt eine Normalverteilung vor \\u2013 und wie k\\u00f6nnte ich das \\u00fcberpr\\u00fcfen? Und ein bisschen mehr... nat\\u00fcrlich wieder mit einigen Beispielen. Und wir haben eine kleine Geschichte rund um das Gehirn von Carl Friedrich Gau\\u00df entdeckt, die wir nat\\u00fcrlich auch einbringen wollen.\",\"publicationDate\":\"2024-08-10T12:01:41+02:00\",\"duration\":\"00:49:35.164\",\"poster\":\"https:\\\/\\\/www.datenleben.de\\\/podlove\\\/image\\\/68747470733a2f2f7777772e646174656e6c6562656e2e64652f77702d636f6e74656e742f75706c6f6164732f323032342f30382f3035335f436f7665725f322e706e67\\\/500\\\/0\\\/0\\\/dl053-normalverteilung\",\"link\":\"https:\\\/\\\/www.datenleben.de\\\/index.php\\\/2024\\\/08\\\/10\\\/dl053-normalverteilung\\\/\",\"chapters\":[{\"start\":\"00:00:00.000\",\"title\":\"Intro\",\"href\":\"\",\"image\":\"\"},{\"start\":\"00:00:18.452\",\"title\":\"Thema des Podcasts\",\"href\":\"\",\"image\":\"\"},{\"start\":\"00:00:37.357\",\"title\":\"Thema der Folge\",\"href\":\"\",\"image\":\"\"},{\"start\":\"00:01:59.011\",\"title\":\"Warum ist dieses Thema interessant?\",\"href\":\"\",\"image\":\"\"},{\"start\":\"00:02:25.031\",\"title\":\"Einspieler: Die vertauschten Gehirne\",\"href\":\"\",\"image\":\"\"},{\"start\":\"00:05:53.303\",\"title\":\"Was ist die Normalverteilung?\",\"href\":\"\",\"image\":\"\"},{\"start\":\"00:17:49.267\",\"title\":\"Warum ist die Normalverteilung normal?\",\"href\":\"\",\"image\":\"\"},{\"start\":\"00:32:46.149\",\"title\":\"Habe ich eine Normalverteilung?\",\"href\":\"\",\"image\":\"\"},{\"start\":\"00:35:54.689\",\"title\":\"Mit welchen Plots die Normalverteilung \\u00fcberpr\\u00fcfen?\",\"href\":\"\",\"image\":\"\"},{\"start\":\"00:39:43.824\",\"title\":\"Wie mit statistischen Tests die Normalverteilung \\u00fcberpr\\u00fcfen?\",\"href\":\"\",\"image\":\"\"},{\"start\":\"00:46:19.689\",\"title\":\"Fazit\",\"href\":\"\",\"image\":\"\"},{\"start\":\"00:47:57.022\",\"title\":\"N\\u00e4chste Folge: Gesundheitsdaten im September\",\"href\":\"\",\"image\":\"\"},{\"start\":\"00:48:34.754\",\"title\":\"Call to Action\",\"href\":\"\",\"image\":\"\"},{\"start\":\"00:49:23.121\",\"title\":\"Outro\",\"href\":\"\",\"image\":\"\"}],\"audio\":[{\"url\":\"https:\\\/\\\/www.datenleben.de\\\/podlove\\\/file\\\/177\\\/s\\\/webplayer\\\/c\\\/website\\\/DL053-normalverteilung.mp3\",\"size\":\"50901853\",\"title\":\"MP3 Audio (mp3)\",\"mimeType\":\"audio\\\/mpeg\"}],\"files\":[{\"url\":\"https:\\\/\\\/www.datenleben.de\\\/podlove\\\/file\\\/177\\\/s\\\/webplayer\\\/DL053-normalverteilung.mp3\",\"size\":\"50901853\",\"title\":\"MP3 Audio\",\"mimeType\":\"audio\\\/mpeg\"}]}}, {\"url\":\"https:\\\/\\\/www.datenleben.de\\\/index.php\\\/wp-json\\\/podlove-web-player\\\/shortcode\\\/config\\\/default\\\/theme\\\/datenleben\",\"data\":{\"activeTab\":\"chapters\",\"subscribe-button\":null,\"share\":{\"channels\":[\"link\",\"facebook\",\"twitter\",\"whats-app\",\"linkedin\",\"pinterest\",\"xing\",\"mail\"],\"outlet\":\"https:\\\/\\\/www.datenleben.de\\\/wp-content\\\/plugins\\\/podlove-web-player\\\/web-player\\\/share.html\",\"sharePlaytime\":true},\"related-episodes\":{\"source\":\"disabled\",\"value\":null},\"version\":5,\"theme\":{\"tokens\":{\"brand\":\"#fff\",\"brandDark\":\"#fff\",\"brandDarkest\":\"#000\",\"brandLightest\":\"#8cc240\",\"shadeDark\":\"#807E7C\",\"shadeBase\":\"#807E7C\",\"contrast\":\"#000\",\"alt\":\"#8cc240\"},\"fonts\":{\"ci\":{\"name\":\"ci\",\"family\":[\"-apple-system\",\"BlinkMacSystemFont\",\"Segoe UI\",\"Roboto\",\"Helvetica\",\"Arial\",\"sans-serif\",\"Apple Color Emoji\",\"Segoe UI Emoji\\\", \\\"Segoe UI Symbol\"],\"src\":[],\"weight\":800},\"regular\":{\"name\":\"regular\",\"family\":[\"-apple-system\",\"BlinkMacSystemFont\",\"Segoe UI\",\"Roboto\",\"Helvetica\",\"Arial\",\"sans-serif\",\"Apple Color Emoji\",\"Segoe UI Emoji\\\", \\\"Segoe UI Symbol\"],\"src\":[],\"weight\":300},\"bold\":{\"name\":\"bold\",\"family\":[\"-apple-system\",\"BlinkMacSystemFont\",\"Segoe UI\",\"Roboto\",\"Helvetica\",\"Arial\",\"sans-serif\",\"Apple Color Emoji\",\"Segoe UI Emoji\\\", \\\"Segoe UI Symbol\"],\"src\":[],\"weight\":700}}},\"base\":\"https:\\\/\\\/www.datenleben.de\\\/wp-content\\\/plugins\\\/podlove-web-player\\\/web-player\\\/\"}}]);\n                podlovePlayer(player, \"https:\/\/www.datenleben.de\/index.php\/wp-json\/podlove-web-player\/shortcode\/publisher\/880\", \"https:\/\/www.datenleben.de\/index.php\/wp-json\/podlove-web-player\/shortcode\/config\/default\/theme\/datenleben\").then(function() {\n                  player && player.classList.remove(\"podlove-web-player-loading\");\n                });\n              });\n            <\/script>\n            <style>\n              .podlove-web-player.podlove-web-player-loading {\n                opacity: 0;\n              }\n            <\/style>\n        \n\t\n\t\t\n<p>Es geht dieses Mal um ein sehr mathematisches Thema, das nicht nur in unserem Podcast schon \u00f6fter erw\u00e4hnt wurde, sondern allgemein h\u00e4ufiger mal eine Rolle spielt: Die Normalverteilung. Fragen, die wir uns in diesem Kontext gestellt haben: Was ist die Normalverteilung? Warum ist die Normalverteilung eigentlich normal? Liegt \u00fcberhaupt eine Normalverteilung vor \u2013 und wie k\u00f6nnte ich das \u00fcberpr\u00fcfen? Und ein bisschen mehr... nat\u00fcrlich wieder mit einigen Beispielen. Und wir haben eine kleine Geschichte rund um das Gehirn von Carl Friedrich Gau\u00df entdeckt, die wir nat\u00fcrlich auch einbringen wollen.<\/p>\n<h3>Links und Quellen<\/h3>\n<ul>\n<li>datenleben\n<ul>\n<li><a href=\"https:\/\/www.datenleben.de\/\">www.datenleben.de<\/a><\/li>\n<li>Social Media: Mastodon <a href=\"https:\/\/podcasts.social\/@datenleben\">@datenleben@podcasts.social<\/a><\/li>\n<li>YouTube: <a href=\"https:\/\/www.youtube.com\/@datenleben\">@datenleben<\/a><\/li>\n<\/ul>\n<\/li>\n<li>Erw\u00e4hnte datenleben-Folgen\n<ul>\n<li>whiper<\/li>\n<li><a href=\"https:\/\/www.datenleben.de\/index.php\/2021\/04\/24\/dl013-daten-visualisieren\/\">dl013: daten visualisieren<\/a><\/li>\n<li>exoplaneten<\/li>\n<\/ul>\n<\/li>\n<li>Quellen:\n<ul>\n<li><a href=\"https:\/\/academic.oup.com\/brain\/article\/137\/4\/e269\/365559\">BRAIN, Renate Schweizer et al: A rare anatomical variation newly identifies the brains of C.F. Gauss and C.H. Fuchs in a collection at the University of G\u00f6ttingen<\/a><\/li>\n<li><a href=\"https:\/\/www.mpg.de\/7585895\/gehirn_gauss\">Max-Planck-Gesellschaft: Wahre Identit\u00e4t des Gau\u00df-Gehirns aufgekl\u00e4rt<\/a><\/li>\n<li><a href=\"https:\/\/de.wikipedia.org\/wiki\/Conrad_Heinrich_Fuchs\">Wikipedia: Conrad Heinrich Fuchs<\/a><\/li>\n<li><a href=\"https:\/\/github.com\/clarks03\/osu-keypress-analyzer\">GitHub.com, clarks03: osu-keypress-analyzer<\/a><\/li>\n<li><a href=\"https:\/\/media.kswillisau.ch\/nt\/zufall\/index.html\">media.kswillisau.ch: M\u00fcnzwurf-Simulation<\/a><\/li>\n<\/ul>\n<\/li>\n<\/ul>\n<h3>Schlagworte zur Folge<\/h3>\n<p>Normalverteilung, Gau\u00df, Gau\u00df'sche Glockenkurve, Datenvisualisierung, Histogramm, QQ-Plot, statistische Tests<\/p>\n<h3>Intro (00:00:00)<\/h3>\n<h3>Thema des Podcasts (00:00:18)<\/h3>\n<p>Helena: Willkommen zur 53. Folge beim Datenleben Podcast, dem Podcast \u00fcber Data Science. Wir sind Helena<\/p>\n<p>Janine: und Janine<\/p>\n<p>Helena: und m\u00f6chten euch in die Welt der Daten mitnehmen. In unserer Welt wird es immer wichtiger, Daten in das gro\u00dfe Ganze einordnen zu k\u00f6nnen. Deswegen wollen wir Data Science anhand von Themen erkl\u00e4ren, die uns alle betreffen.<\/p>\n<h3>Thema der Folge (00:00:37)<\/h3>\n<p>Janine: Ja, und damit willkommen zu unserer vermutlich mathematischsten Folge, die wir bisher hatten. Das wird f\u00fcr einige vielleicht spannender als f\u00fcr andere, aber wir wollten uns mal eine Sache genauer angucken, die immer mal wieder erw\u00e4hnt wird, nicht nur bei uns im Podcast schon h\u00e4ufiger mal, sondern auch an vielen anderen Stellen einfach. Und zwar geht es heute um die Normalverteilung oder auch Glockenkurve bzw. gau\u00df'sche Glockenkurve genannt. Zu dem Begriff hatte unser Whisper-Transkriptionstool ja mal die gau\u00df'sche Schokoladenkurve erfunden. Ja, genau. Fragen, die wir uns in diesem Kontext gestellt haben. Was ist die Normalverteilung? Und ja, dazu geh\u00f6ren noch so ein paar andere Randthemen, weil mathematische Konzepte selten ganz allein kommen. Das ist auch der zentrale Grenzwertsatz, wo wir uns die Frage stellen, warum ist die Normalverteilung eigentlich normal? Und ja, es geht dann weiter mit so Fragen, liegt \u00fcberhaupt eine Normalverteilung vor? Manches sieht ja vielleicht nur so aus. Und dann noch, mit welchen Plots, also Diagrammen, kann ich eine Normalverteilung eigentlich erkennen? Und da haben wir ja hier und da nat\u00fcrlich auch wieder Beispiele.<\/p>\n<h3>Warum ist das Thema interessant? (00:01:59)<\/h3>\n<p>Helena: Ja, wir dachten uns, wir reden jetzt mal \u00fcber das Thema Normalverteilung, einfach weil es bei sehr vielen Themen, die wir bisher besprochen haben, immer wieder eine Rolle gespielt hat und \u00f6fter auch erw\u00e4hnt wurde. Und ja, die Normalverteilung wird durchaus h\u00e4ufiger mal irgendwo erw\u00e4hnt. Aber warum sie jetzt eigentlich normal ist und Normalverteilung hei\u00dft, das wird eigentlich selten erkl\u00e4rt. Deswegen wollen wir das heute einmal machen.<\/p>\n<h3>Einspieler: Die vertauschten Gehirne (00:02:25)<\/h3>\n<p>Janine: Die vertauschten Gehirne. 2013 hat eine Untersuchung ergeben, dass das konservierte Gehirn, das bisher als das Gauss-Gehirn untersucht wurde, gar nicht sein Gehirn war. Und zwar gab es eine Vertauschung in der Sammlung des Instituts f\u00fcr Ethik und Geschichte der Medizin der Universit\u00e4tsmedizin G\u00f6ttingen. Aber wer war dieser Gauss eigentlich? Der schon zu Lebzeiten ber\u00fchmt gewordene Mathematiker Carl Friedrich Gauss wurde im Jahr 1777 in Braunschweig geboren. Bereits als Kind fiel seine besondere Begabung f\u00fcr den Umgang mit Zahlen auf. Im Alter von 14 Jahren wurde er Herzog Karl Wilhelm Ferdinand von Braunschweig vorgestellt, der ihm schlie\u00dflich tats\u00e4chlich als F\u00f6rderer die weitere Ausbildung finanzierte. 1807 \u00fcbernahm Gauss in G\u00f6ttingen den Lehrstuhl f\u00fcr Astronomie und wurde der Direktor der G\u00f6ttinger Sternwarte. Dort lebte und wirkte er bis zu seinem Tod im Jahr 1855. Gauss hat nicht nur mit seiner Methode der kleinsten Quadrate dazu beigetragen, den Zwergplaneten Ceres wiederzuentdecken, auf ihn geht auch im Wesentlichen die Entwicklung der Normalverteilung zur\u00fcck. Er arbeitete in den Gebieten Algebra, Zahlentheorie, Astronomie, Potentialtheorie, Landvermessung und Geod\u00e4sie, Magnetismus, Elektrizit\u00e4t und Telegrafie. Nach seinem Tod im Februar 1855 wurde sein Gehirn entnommen und zu Forschungszwecken konserviert. Die pathologisch-anatomische Sammlung der Universit\u00e4t G\u00f6ttingen wurde damals von Konrad Heinrich Fuchs gegr\u00fcndet. Die Verwechslung \u2013 das Gehirn des &quot;F\u00fcrsten der Mathematik&quot;, wie Gauss auch genannt wurde, wurde zuerst von Rudolf Wagner untersucht. Er ver\u00f6ffentlichte die Ergebnisse dieser und anderer Untersuchungen in den 1860er Jahren. Dabei erstellte er detaillierte Kupferstiche und Lithographien, um die Gehirne zu dokumentieren. In den folgenden 150 und mehr Jahren wurden mehrere Untersuchungen am Gehirn von Gauss und auch anderen Gehirnen durchgef\u00fchrt. Die Neurowissenschaftlerin Renate Schweitzer entdeckte auf Bildern aus dem Magnetresonanztomografen von 1998, dass das Gehirn von Gauss eine seltene Variation aufweist \u2013 eine sichtbare Zweiteilung der Zentralfurche. Um ihren Befund zu \u00fcberpr\u00fcfen, zog sie die erste Ver\u00f6ffentlichung von Rudolf Wagner aus dem Jahr 1860 heran. Dort fand sie allerdings in dem sehr genau gearbeiteten Kupferstich keine vergleichbare Besonderheit. Das ganze Gehirn schien ein anderes zu sein. Wie sich herausstellte: Das Gehirn des Mediziners Konrad Heinrich Fuchs, in dessen Lithographie diese geteilte Zentralfurche deutlich zu erkennen ist. Fuchs ist im selben Jahr wie Gauss gestorben, etwa zehn Monate nach ihm, und sein Gehirn wurde ebenfalls von Rudolf Wagner konserviert und dokumentiert. Im Laufe der n\u00e4chsten Jahre m\u00fcssen die Gehirne bei einer erneuten Untersuchung vertauscht worden sein, sodass \u00fcber viele Jahrzehnte Fuchs' Gehirn in Gauss' Glas lag und umgekehrt. Mit erneuten MRT-Scans konnte dieser Verdacht schlie\u00dflich im Vergleich mit der Ver\u00f6ffentlichung von Wagner bewiesen werden. So kam es dazu, dass Gauss' Gehirn nicht Gauss' Gehirn war, aber jetzt doch wieder im richtigen Glas konserviert werden konnte.<\/p>\n<h3>Was ist die Normalverteilung? (00:05:53)<\/h3>\n<p>Helena: Was ist die Normalverteilung? Ja, die Normalverteilung oder auch Gau\u00df'sche Glockenkurve, wenn man sich das vorstellt, man hat irgendwie Daten und erfasst die und m\u00f6chte dann gucken, ja, welche Daten sind wie h\u00e4ufig, dann rechnet man ja vielleicht f\u00fcr diese Daten eine Statistik aus, so was wie Mittelwert und Standardabweichung. Und wenn man davon ausgeht, dass die Daten normal verteilt sind, dann reichen Mittelwert und Standardabweichung auch vollst\u00e4ndig aus, um diese Daten zu beschreiben. Da braucht man eigentlich keine weiteren Informationen mehr. Und ja, der Mittelwert, also quasi der Wert, wenn man alle Sachen irgendwie addiert und dann durch die Anzahl der Werte teilt, ist bei normal verteilten Gr\u00f6\u00dfen auch immer gleich dem Median. Der Median ist ja der mittlere Wert, nicht zu verwechseln mit dem Mittelwert. Das hei\u00dft, wenn man alle Daten sortiert und dann einfach den in der Mitte nimmt, das ist dann der Median. Und bei normal verteilten Gr\u00f6\u00dfen sind Mittelwert und Median auch immer gleich. Wenn Sie das nicht sind, ist das ein erster Hinweis darauf, dass die Daten eben nicht normal verteilt sind. Und es gibt dann noch bei manchen Verteilungen gibt es noch weitere sogenannte Moden. Eine Mode ist zum Beispiel der Mittelwert. Es gibt aber auch noch andere Moden wie die Schr\u00e4gheit, also wie schr\u00e4g ist die Verteilung, Skewness auf Englisch, aber auch verschiedener h\u00f6herer Ordnungen. Und die Normalverteilung hat eben die Eigenschaft, dass bis auf den Mittelwert alle Moden null sind. Die sind quasi nicht vorhanden. Das hei\u00dft, hier reicht wirklich einfach nur Mittelwert und Standardabweichung. Und wenn man das hat, dann kann man damit weiterrechnen. Das ist ziemlich n\u00fctzlich. Dann muss man noch bedenken, dass die Normalverteilung zun\u00e4chst einmal eine Wahrscheinlichkeitsdichte-Funktion ist. Also was hei\u00dft das? Wenn man jetzt etwas messen will oder wissen will von einer Gr\u00f6\u00dfe oder von einer Information, die einen kontinuierlichen Wert hat, das absolute Standardbeispiel f\u00fcr Normalverteilung sind die Gr\u00f6\u00dfenverteilung oder L\u00e4ngenverteilung von Menschen, wie gro\u00df ist ein Mensch und wie gro\u00df sind verschiedene Menschen, dann ist ja die eigentliche Gr\u00f6\u00dfe im Rahmen der Messgenauigkeit ziemlich kontinuierlich. Da kann man auf einen Atom genau theoretisch messen, wie gro\u00df ein Mensch ist. Und dann existiert jede Gr\u00f6\u00dfe, wenn man die in Atomradien angeben w\u00fcrde, vielleicht nur ein einziges Mal. Und wenn man jetzt allerdings anguckt, wie oft bestimmte Werte in einem bestimmten Bereich liegen, zum Beispiel ob jemand 1,80 Meter gro\u00df ist, dann guckt man sich an, wie genau m\u00f6chte ich das denn jetzt messen? Zum Beispiel auf 1 Millimeter genau, dann w\u00fcrde man ja quasi alle Leute, die 1,799 bis 1,801 gro\u00df sind, in eine Gruppe packen und dann gucken, wie oft ist diese Gruppe. Bei K\u00f6rpergr\u00f6\u00dfen von Menschen w\u00fcrde man vielleicht nicht so pr\u00e4zise sein, weil das so genau die Messgenauigkeit nicht ist, weil Menschen k\u00f6nnen ja auch schief stehen und dann sind die unterschiedlich gro\u00df, da ist dann 1 Millimeter Messgenauigkeit irgendwie ein bisschen unrealistisch. Da misst man vielleicht eher auf 1 Zentimeter genau. Das hei\u00dft, man packt alle Leute in eine Gruppe, die jetzt 1,795 gro\u00df sind und bis 1,805 Meter gro\u00df. Und das ist dann quasi ein Bereich. Und dann w\u00fcrde man eben bei der Normalverteilung gucken, welche Fl\u00e4che liegt jetzt unter dieser Normalverteilung zwischen beiden Werten. Und dadurch, dass bei der Normalverteilung die Fl\u00e4che auf 1 normiert ist, also das hei\u00dft, die Fl\u00e4che der Normalverteilung, die unter der Normalverteilung liegt, der Glockenkurve, hat den Wert 1, was 100% entspricht. Und dann ist quasi die Fl\u00e4che unter dieser Linie, die von 1,795 und 1,805 ist, das ist dann auch im Grunde der Anteil oder der Prozentsatz der Leute, die diese Gr\u00f6\u00dfe haben, wenn man bei der K\u00f6rpergr\u00f6\u00dfe eben von normal verteilten Gr\u00f6\u00dfen ausgeht. Das hei\u00dft, auf der einen Seite gilt die Normalverteilung erstmal f\u00fcr kontinuierliche Werte, aber man packt die ja immer in Abschnitte zusammen, die man zusammenz\u00e4hlt, um die H\u00e4ufigkeit zu bekommen. Ja, und kontinuierliche Werte sind sowas wie die L\u00e4ngen von etwas, die Gr\u00f6\u00dfen oder auch sowas wie Zeiten oder ein Gewicht. Das sind alles kontinuierliche Werte, im Gegensatz zu Kategorien. So, man kann die zwar in verschiedene Gruppen zusammenfassen, aber das kann man dann auch wieder anpassen, je nachdem, wie man es gerade braucht, was man jetzt bei reinen Kategorien-Sachen nicht machen kann. Kategorien w\u00e4ren jetzt zum Beispiel, welche Partei hat jemand gew\u00e4hlt? Also, wie gesagt, ein bekanntes Beispiel, was man in vielen Texten zum Thema Normalverteilung findet, ist eben K\u00f6rpergr\u00f6\u00dfe von Menschen, dass die grunds\u00e4tzlich erstmal normal verteilt ist. Wenn man sich das jetzt genauer anguckt, funktioniert das allerdings nur f\u00fcr eine Altersgruppe und dann auch nur f\u00fcr ein Geschlecht, das man zusammenpackt. Dann sind die Menschen ungef\u00e4hr normal verteilt. Aber allein das Alter ist schon wieder relevant, weil Menschen in verschiedenen Altersgruppen auch unterschiedlich gro\u00df geworden sind, weil sich zum Beispiel die Ern\u00e4hrung oder so verbessert hat \u00fcber die Jahrzehnte. Und deswegen ist das zwar grunds\u00e4tzlich normal verteilt, aber nicht auf alle Menschen bezogen. Ja, ein anderes Beispiel f\u00fcr etwas, was normal verteilt ist, ist, wenn man sich jetzt anguckt, wenn man jetzt ein Spiel spielt. Es gibt sogenannte Rhythmusspiele, wo man dann in einem bestimmten Rhythmus bestimmte Dinge machen muss. Da l\u00e4uft dann meistens irgendwie eine Hintergrundmusik und dann muss man im Takt der Musik Dinge tun. Und wie pr\u00e4zise man dann eben diesen Takt h\u00e4lt, ist dann quasi auch normal verteilt. Man hat dann zwischen zwei Mal, dass man dr\u00fccken muss, immer einen bestimmten zeitlichen Abstand. Und dann gibt es quasi den mittleren Abstand, aber den schafft ein Mensch jetzt nicht unbedingt immer exakt. Das hei\u00dft, man ist immer etwas zu fr\u00fch oder zu sp\u00e4t oder oft genug kriegt man den Abstand auch gut hin, wenn man gut im Takt ist. Aber wenn man sich das auf Millisekunden genau anguckt, dann ist das immer nicht exakt. Und sowas kann man eben auch verwenden oder wird im Bereich der Rhythmusspiele durchaus auch benutzt, um Cheater zu entdecken. Bei dem Spiel Osu! gab es jetzt vor kurzem einen Fall, dass jemand seine Tastatur so manipuliert hatte, dass der zweite Tastendruck immer exakt gleich nach dem ersten passiert ist, weil die Tastatur so Automatisierungsfunktionen hatte. Und da hat man gesehen, ja, das ist eindeutig nicht mehr menschlich, weil Menschen k\u00f6nnen nicht so pr\u00e4zise dr\u00fccken. Und so hat man dann eben einen Cheater gefunden, weil etwas nicht mehr normal verteilt war.<\/p>\n<p>Janine: Wie frech, einfach so betr\u00fcgen. Ja, wir hatten ja schon gesagt, das hei\u00dft auch die Gau\u1e9e'sche Glockenkurve, denn dieser Carl Friedrich Gauss ist bekannt daf\u00fcr, die Normalverteilung eingef\u00fchrt zu haben. Und erstmals hat er sie in einem Aufsatz im Jahr 1809 ver\u00f6ffentlicht, wo \u00fcbrigens auch die kleinsten Quadrate drin vorkommen. Da geht es um den Nachweis, beziehungsweise um den Beweis, dass Ceres demn\u00e4chst wieder auftaucht und dann mit dieser Methode auch wieder gefunden werden konnte. Das hatten wir, ich glaube, in der letzten Folge.<\/p>\n<p>Helena: Ja, genau. In der letzten Folge hatten wir tats\u00e4chlich die gleiche Arbeit schon von Gauss, nur haben wir uns auf einen anderen Aspekt konzentriert. Diesmal geht es eben um die Normalverteilung.<\/p>\n<p>Janine: Was eigentlich ein ziemlicher Zufall ist, also nicht ganz, aber schon auch ein bisschen. Jedenfalls in dem Aufsatz von Gauss, den er da 1809 ver\u00f6ffentlicht hatte, war die Normalverteilung noch nicht die Normalverteilung namentlich, sondern er hatte ihr einen anderen Namen gegeben. Gauss nannte es Fehlerverteilung. Das ist ja was ganz anderes und erst mal verwirrend, finde ich.<\/p>\n<p>Helena: Naja, es ist ja insofern nicht was anderes, als dass er ja auch die Methode der kleinsten Quadrate entwickelt hat in der gleichen Arbeit und eben diese Fehler um diese Berechnungen herum dann eben auch normalverteilt sind, also um die Kurve. Man misst ja mit einer bestimmten Genauigkeit und dann ist halt die Messungenauigkeit ist dann eben auch normalverteilt. Und deswegen, weil er das in diesem Kontext benutzt hat, war das ja auch wirklich die Verteilung, die seine Fehler hatten.<\/p>\n<p>Janine: Ja.<\/p>\n<p>Helena: Das ergibt schon Sinn. Und was ich auch noch interessant fand, also mir war nicht klar, dass Gauss das damals so genannt hat, also Normalverteilung kam halt erst einige Jahrzehnte sp\u00e4ter als Name auf. Aber es gibt jetzt immer noch etwas, das nennt sich Fehlerfunktion, was im Grunde genommen einfach das Integral der Normalverteilung ist. Und w\u00e4hrend man jetzt, wie ich das vorhin erkl\u00e4rt hatte, um jetzt f\u00fcr zwischen bestimmten Werten die Wahrscheinlichkeit auszurechnen, muss man halt zwischen diesen Werten integrieren bei der Glockenkurve. Wenn man jetzt allerdings die Fehlerfunktion benutzt, dann muss man nicht mehr integrieren, also abgesehen davon, dass man sie nicht analytisch ausrechnen kann und mathematisch immer noch integriert wird. Numerisch gibt es da Algorithmen f\u00fcr. Aber im Prinzip kann man daraus dann direkt eben die Wahrscheinlichkeit von einem bestimmten Bereich ausrechnen, weil man es ja schon fertig integriert hat. Also die Fehlerfunktion habe ich durchaus auch schon \u00f6fter verwendet.<\/p>\n<p>Janine: Also f\u00fcr mich klingt das jetzt so ein bisschen von au\u00dfen, ich bin ja in der Mathematik nicht ganz so tief drin, dass ja Gaus halt f\u00fcr sein spezifisches Problem mit den kleinsten Quadraten quasi eben eine Bezeichnung gefunden hat, die er Fehlerverteilung nannte. Und im weiteren hat sich das dann eben anders entwickelt, so wie Helena gerade sagte. Jahrzehnte sp\u00e4ter wurde dann der Name Normalverteilung gewisserma\u00dfen etabliert. Und ja, auch das, was Gaus da gemacht hat, ist nat\u00fcrlich nicht aus dem Nichts heraus entstanden. Die Normalverteilung geh\u00f6rt zum Gebiet der Wahrscheinlichkeitsverteilung und das, wie man sich vorstellen kann, ist ein ziemlich komplexes Gebiet der Mathematik. Und da gibt es eben auch reichlich Vorarbeiten, verwandte Konzepte, die darauf hingef\u00fchrt haben oder auch noch daraus entstanden sind, beziehungsweise im Nachgang anders aufeinander bezogen wurden. Also die dann vielleicht eine bessere N\u00fctzlichkeit bekommen haben oder anders benutzt wurden, sich besser herauskristallisiert haben. Und ja, das Ganze ist f\u00fcr mich von au\u00dfen relativ undurchdringlich, aber wir versuchen trotzdem so die Zusammenh\u00e4nge ein bisschen darzustellen, wo wir sie brauchen und wo sie f\u00fcr uns auch n\u00fctzlich sind. Und deswegen haben wir dann noch zwei Begriffe herausgepickt, um ein bisschen mehr zur Normalverteilung sagen zu k\u00f6nnen. Das ist der zentrale Grenzwertsatz. Ja, und da haben wir einen kurzen Satz im Vorfeld schon mal, was der zentrale Grenzwertsatz ist, und zwar besagt er, dass unter bestimmten Umst\u00e4nden Wahrscheinlichkeiten am Ende immer eine Normalverteilung ergeben k\u00f6nnen. Und wir haben den Begriff Binomialverteilung und die besagt, wie wahrscheinlich bestimmte Werte zum Beispiel beim M\u00fcnzenwerfen sind. Und ja, warum haben wir genau diese beiden Begriffe herausgesucht? Beim ersten scheint es jetzt gerade vielleicht ein bisschen offensichtlicher. Aber ja, sie helfen uns, folgende Frage zu beantworten, die ich jetzt Helena stelle.<\/p>\n<h3>Warum ist die Normalverteilung normal? (00:17:49)<\/h3>\n<p>Janine: Warum ist die Normalverteilung normal?<\/p>\n<p>Helena: Ja, das ist eine gute Frage. Und die kurze Antwort darauf w\u00e4re der zentrale Grenzwertsatz. Und in der langen Antwort versuche ich, das jetzt einmal zu erl\u00e4utern. Also, wir fangen jetzt einmal an mit einem M\u00fcnzwurf. Wenn man eine M\u00fcnze wirft, dann kriegt man entweder Kopf oder Zahl heraus. Ich gehe jetzt mal davon aus, das sind die einzigen Szenarien, also dass man die nicht zwischen ausversehen verliert oder sie auf der Kante liegt, sondern dass sie wirklich nur Kopf oder Zahl zeigen kann. So, und wenn man jetzt eine M\u00fcnze mehrfach wirft, dann ist die Wahrscheinlichkeit f\u00fcr jedes Ereignis Kopf oder Zahl 50 Prozent, f\u00fcr jeden einzelnen Wurf. Und das ist unabh\u00e4ngig davon, wie oft man die M\u00fcnze vorher schon geworfen hat. Jeder neue M\u00fcnzwurf quasi f\u00e4ngt wieder von vorne an. So, es kann halt auch mal sein, dass mehrmals das Gleiche herauskommt, also dass man dreimal Zahl wirft oder viermal. Aber man hat eigentlich immer eine sogenannte Gleichverteilung. Das hei\u00dft, die beiden Ereignisse sind gleich h\u00e4ufig. Und am Ende l\u00e4uft es darauf hinaus, wenn man sehr oft wirft, dass dann ungef\u00e4hr genauso oft Zahl wie Kopf herausgekommen ist. Und wenn man jetzt mehrere M\u00fcnzen gleichzeitig wirft und dann die Anzahl, wie oft Zahl geworfen ist, z\u00e4hlt, und dann sagt man, jetzt ist nicht mehr die Frage, ist Kopf oder Zahl herausgekommen, das Ergebnis, sondern wie oft ist Zahl herausgekommen, ist das Ergebnis, dann bekommt man die sogenannte Binomialverteilung, die besagt, wie wahrscheinlich jede einzelne dieser M\u00fcnzw\u00fcrfe ist, dass man eben dreimal Zahl hat, viermal Zahl und so weiter. Und dazu gibt es eine ganz nette Webseite, auf der man sehr viele M\u00fcnzw\u00fcrfe gleichzeitig simulieren kann. Da kann man dann irgendwie sagen, ja, ich m\u00f6chte, also auf der Seite gehen bis zu 17 M\u00fcnzen, und dann m\u00f6chte ich diese zehnmal hintereinander werfen und vielleicht auch hundertmal und so weiter. Und wenn man das halt macht, dann sieht man, dass bestimmte Werte besonders h\u00e4ufig vorkommen. Also bei 17 M\u00fcnzen liegt quasi die Mitte irgendwo bei, das kann ja auch nullmal rauskommen, das hei\u00dft, es gibt 18 m\u00f6gliche Werte, die rauskommen k\u00f6nnen, nullmal Zahl und 17mal Zahl. Das hei\u00dft, die Mitte ist irgendwie bei neun, das hei\u00dft, das am h\u00e4ufigsten ist, dass man auch neunmal Zahl wirft, aber es wird ja nicht jedes Mal so sein, sondern dann wird auch mal achtmal Zahl geworfen oder zehnmal Zahl. Und je \u00f6fter man das wirft, desto mehr n\u00e4hert sich das Ganze dann eben den berechneten Werten aus der Binomialverteilung an. Und diese Binomialverteilung wird, wenn man quasi die Anzahl der M\u00fcnzen immer gr\u00f6\u00dfer macht, dann, keine Ahnung, hundert oder tausend M\u00fcnzen gleichzeitig wirft, und das ganz oft wiederholt, dann n\u00e4hert sich diese Binomialverteilung immer mehr der Normalverteilung an. Also ein bisschen, wenn man sich das anguckt, sieht man auf dieser Webseite schon, dass das immer mehr diese Glockenform bekommt, aber damit es wirklich am Ende normal verteilt wird, muss man eben auch die Anzahl der M\u00fcnzen, die man gleichzeitig ber\u00fccksichtigt, immer weiter erh\u00f6hen. Gut, mathematisch betrachtet hei\u00dft das Ganze dann, dass bestimmte mathematische Voraussetzungen gelten m\u00fcssen, damit ein Zufallsexperiment, das man ganz oft wiederholt und vor allen Dingen mehrfach kombiniert, dass diese auch am Ende eine Normalverteilung ergeben k\u00f6nnen. Das erste dazu ist, die verschiedenen Verteilungen oder Zufallsexperimente, die man macht, m\u00fcssen unabh\u00e4ngig voneinander sein. Also wie bei einem M\u00fcnzwurf, jede M\u00fcnze ist unabh\u00e4ngig von der, die man davor geworfen hat, weil sie immer wieder ihren Zustand auf null zur\u00fccksetzt. Wenn das nicht der Fall ist, w\u00fcrde das hier eben nicht funktionieren. Also beim Lottozahlenziehen zum Beispiel ist die Zahl, die man gezogen hat, ja dann raus aus dem Topf, und die kann man nur einmal ziehen. Das hei\u00dft, damit k\u00f6nnte man keine Normalverteilung erzeugen. Dann m\u00fcssen all die Verteilungen, die man halt kombiniert, eigentlich gleich sein. Das hei\u00dft, man muss wie den M\u00fcnzwurf den M\u00fcnzwurf halt viele, viele Male wiederholen und zusammenpacken. Man kann jetzt nicht, wenn jedes Mal die Verteilung unterschiedlich ist, die dann auch so kombinieren. Ja, dann gibt es noch eine sehr mathematische Voraussetzung, n\u00e4mlich, dass die Varianz nicht unendlich gro\u00df sein darf bei den Verteilungen, die man da benutzt. Die Varianz ist im Wesentlichen das Quadrat von der Standardabweichung. Und man benutzt ja normalerweise die Standardabweichung, um normal vergeteilte Gr\u00f6\u00dfen zu beschreiben, weil der Wert, der da rauskommt, ist etwas, was wir verstehen k\u00f6nnen. Man wei\u00df ja vielleicht auch, innerhalb von einer Standardabweichung liegen 67% aller Werte einer Normalverteilung. Innerhalb von zwei Standardabweichungen um den Mittelwert herum sind, ich glaube, etwa 95% aller Werte. Und bei drei Standardabweichungen sind es ungef\u00e4hr 99% aller Werte liegen in diesem Bereich. Und das ist eine L\u00e4nge, die halt die gleiche Einheit hat wie der Wert, den man misst. Die Varianz hingegen ist ja das Quadrat. Das hei\u00dft, man kann sich mit dieser Zahl nicht so viel vorstellen. Wenn man allerdings zwei normal verteilte Gr\u00f6\u00dfen hat und die sich \u00fcberlagern l\u00e4sst, sodass man quasi deren Ergebnisse addiert, in der dann entstehenden neuen Verteilung kann man dann die Mittelwerte ja addieren und kriegt dann den richtigen Mittelwert raus. Aber man kann nicht die Standardabweichung addieren, sondern man muss die Varianzen addieren und dann kriegt man die neue Standardabweichung. Also es gibt durchaus Situationen, wo die Varianz das mathematisch praktischere Tool ist, aber meistens versteht man ja eher, was meint jetzt eigentlich diese Standardabweichung. Das hei\u00dft, der zentrale Grenzwertsatz besagt unter den genannten Voraussetzungen, also dass man sehr viele Verteilungen kombiniert, diese Verteilungen unabh\u00e4ngig voneinander sind, aber sie jeweils gleich sind und die Varianz nicht unendlich gro\u00df ist, da kriegt man immer eine Normalverteilung am Ende heraus. Was es in der Statistik dann auch noch gibt, ist das sogenannte Gesetz der gro\u00dfen Zahl. Da geht es auch darum, dass man ein Zufallsexperiment sehr oft wiederholt und dann besagt dieses Gesetz, ja, wenn man, keine Ahnung, eine Million mal eine M\u00fcnze wirft, dann n\u00e4hert sich die relative H\u00e4ufigkeit, also wie oft habe ich Zahl im Verh\u00e4ltnis zu Kopf geworfen, dem theoretischen Wert der Wahrscheinlichkeit an. Das hei\u00dft, wenn ich das sehr oft wiederhole, dann kriege ich bei 50% Kopf raus und bei 50% Zahl. Und das ist insofern, weil beides irgendwie mit sehr vielen Wiederholungen zusammenh\u00e4ngt, k\u00f6nnte man das vielleicht verwechseln, aber beim Gesetz der gro\u00dfen Zahl geht es eher darum, dass man dar\u00fcber feststellen kann, ja, ist jetzt diese M\u00fcnze oder dieser W\u00fcrfel wirklich so verteilt, wie man das dachte? Wenn man einfach dieses eine Experiment sehr oft wiederholt.<\/p>\n<p>Janine: Das hei\u00dft, da k\u00f6nnte man zum Beispiel herausfinden, dass eine M\u00fcnze oder ein W\u00fcrfel manipuliert ist, in dem eine Seite mehr Gewicht hat, wenn sie eben nicht entsprechend der Wahrscheinlichkeit sich verh\u00e4lt?<\/p>\n<p>Helena: Genau, wenn du das jetzt irgendwie tausendmal wiederholst und dann feststellst, ja, 600 Mal habe ich Zahl geworfen, dann ist das wahrscheinlich manipuliert.<\/p>\n<p>Janine: Ahja. <\/p>\n<p>Helena: Also, wenn man jetzt irgendwie w\u00fcrfelt mit einem normalen Sechserw\u00fcrfel, man w\u00fcrfelt 10 Mal, dann kann es schon sein, dass man unter diesen 10 Mal viermal eine Eins w\u00fcrfelt. Wenn man aber 100 Mal w\u00fcrfelt und dann 40 Mal eine Eins bekommt, dann ist das wiederum sehr unwahrscheinlich. Das hei\u00dft, es spricht dann daf\u00fcr, dass es manipuliert ist. Und das Gesetz der gro\u00dfen Zahl besagt dann eben, dass sich dieser W\u00fcrfel eben der erwarteten Wahrscheinlichkeit, dass alle mit einem Sechstel der Wahrscheinlichkeiten drankommen soll, ann\u00e4hert. Und der zentrale Grenzwertsatz hingegen ist dann, wenn man jetzt ganz viele W\u00fcrfel hat, und dann muss man aber noch ber\u00fccksichtigen, ja, diese W\u00fcrfel m\u00fcssen eben auch sich \u00fcberlagern. Also im Falle von den W\u00fcrfeln hei\u00dft das, wenn man jetzt so ein Spiel wie Kniffel spielt, dann interessiert einen ja nur, wie oft hat man jetzt eine Sechs geworfen. Habe ich jetzt f\u00fcnf Sechsen oder nur eine? Und dann entspricht das eher, was einem interessiert, dem Gesetz der gro\u00dfen Zahl. Man kriegt aber keine Normalverteilung raus, wenn man das l\u00e4nger spielt, weil es geht nur darum, dass man jedes Mal eben einzelne Zahlen w\u00fcrft. Wenn man jetzt aber so was wie Siedler von Catan spielt, dann hat man ja zwei W\u00fcrfel und einen interessiert ja nicht, ob man eine Eins gew\u00fcrfelt hat, sondern man addiert die Sachen zusammen und dann sieht man ja, die Sieben ist am h\u00e4ufigsten und so weiter. Und dann will man ja taktisch so spielen, dass man bei h\u00e4ufigen Sachen auch in der N\u00e4he seine H\u00e4user baut und so weiter. Und wenn man jetzt hier die Anzahl der W\u00fcrfel immer weiter erh\u00f6hen w\u00fcrde beim Siedler spielen, dann w\u00fcrde sich das eben einer Normalverteilung ann\u00e4hern. Ja, es gibt dann noch eine weitere Fehlannahme, die man haben kann \u00fcber den zentralen Grenzwertsatz. Also der besagt ja, wenn man halt eine bestimmte Zufallsverteilung ganz oft miteinander kombiniert, dann bekommt man am Ende eine Normalverteilung. Wenn man jetzt allerdings sagt, ja, ich habe jetzt hier Menschen und suche zuf\u00e4llig aus der Bev\u00f6lkerung Menschen raus und dann messe ich, wie gro\u00df die sind oder so, dann bekomme ich, wenn ich das sehr oft wiederhole, nicht die Normalverteilung heraus, weil im Extremfall habe ich ja einmal alle Menschen durchgemessen und wenn dann die K\u00f6rpergr\u00f6\u00dfe in Wirklichkeit gar nicht normal verteilt ist, weil es zum Beispiel sehr viele Kinder gibt, die einfach kleiner sind, oder die Leute sind halt je nachdem, wo die herkommen, unterschiedlich gro\u00df, dann kriegt man am Ende, wenn man dieses Zufallsexperiment wiederholt, auch eigentlich nur die Verteilung, die tats\u00e4chlich in der Bev\u00f6lkerung schon stattfindet, heraus. Weil das eben ja nicht zuf\u00e4llig ist. Weil nicht jeder Mensch quasi neu erschaffen wird f\u00fcr die Messung und zugrunde liegt eine Normalverteilung, sondern ich kann im Extremfall halt ja nur die reale Menschenpopulation messen. Und insofern gibt es dann eben keine Normalverteilung, wenn die nicht auf andere Weise schon normal verteilt sind. Dazu habe ich aber noch ein anderes Beispiel. Wir alle kennen ja Regenb\u00f6gen. Die entstehen, wenn Sonnenlicht auf Regen trifft und es gleichzeitig regnet und die Sonne scheint, dann sieht man einen Regenbogen. Dieser Regenbogen hat eben die Eigenschaft, dass die Farben eben die Spektralfarben sind. Jetzt ist es aber so, dass bestimmte Gase oder sowas manche von diesen Farben halt absorbieren k\u00f6nnen. Das ist auch in der Sonne der Fall. Auch die Sonne hat einen Gas au\u00dfen, was dann bestimmte Farben absorbiert. Das hei\u00dft, w\u00fcrde man jetzt sehr genau in diesen Regenbogen gucken, dann sieht man da so L\u00f6cher, die dann schwarz sind und gar nicht ihre eigene Farbe haben. Wenn man sich jetzt anguckt, auf welche dieser Wellenl\u00e4ngen, auf welche dieser Farben eben ein Gas reagiert, dann sieht man ja, f\u00fcr ein bestimmtes Gas ist auch eine bestimmte Wellenl\u00e4nge typisch. Aber um diese Wellenl\u00e4nge herum bildet sich dann eben auch wieder eine Normalverteilung. Und das kommt hier jetzt daher, dass alle Gasmolek\u00fcle sich eben bewegen, weil es ist halt warm. Wir haben W\u00e4rme und W\u00e4rme ist im Wesentlichen nur Bewegung von Molek\u00fclen. Das hei\u00dft, die bewegen sich in alle m\u00f6glichen Richtungen und es ist dann bei vielen, vielen Milliarden, und das ist immer noch zu klein, Molek\u00fclen, die gleichzeitig irgendwie sich zuf\u00e4llig in irgendeine Richtung bewegen, hat man eben sehr viele von diesen Zufallsexperimenten quasi. Man misst ein Molek\u00fcl und dann gleichzeitig noch ein anderes und davon sehr viele, dass sich das alles eben so stark mittelt, wie die sich verhalten, dass es auch normal verteilt ist, diese Breite von dieser Linie, die absorbiert wird. W\u00fcrde man jetzt alles auf den absoluten Neupunkt herunterk\u00fchlen, dann bek\u00e4me man eben nicht mehr die Normalverteilung, sondern diese sogenannte nat\u00fcrliche Linienbreite, die Lorenz verteilt ist. Das ist eine Verteilung, die auf den ersten Blick durchaus der Normalverteilung \u00e4hnelt, aber sie tats\u00e4chlich eigentlich nicht ist, sondern sie ist ein bisschen spitzer. Und die kommt eben aus einem quantenmechanischen Effekt heraus. Und wenn man diese Lorenzverteilung, also die grundlegende Zufallsverteilung, mit den Bewegungen eben kombiniert, dann hat man ganz viele Wahrscheinlichkeiten, die sich \u00fcberlagern, und dann hat man wieder eine Normalverteilung am Ende.<\/p>\n<p>Janine: Okay, also noch etwas anderes, wo man quasi eine bestimmte Verteilung hat oder einen bestimmten Grundsatz. Wenn es dann etwas weitergeht, also in diesem Fall ein neuer Aspekt hinzukommt oder die H\u00e4ufigkeit hinzukommt, dann gleitet das \u00fcber in eine Normalverteilung.<\/p>\n<p>Helena: Ja.<\/p>\n<p>Janine: Also ich nehme bisher auf jeden Fall mit, wesentliche Aspekte der Normalverteilung ist halt, dass wenn etwas h\u00e4ufig genug getestet wird oder die Datengrundlage einfach gro\u00df genug ist, dann kann ich eine Normalverteilung vorliegen haben. Und gleichzeitig auch, was ich jetzt vor allem aus deinem Linienbreitenbeispiel der Spektrallinien mitnehme, dass halt auch in diesem Fall durch die Bewegung quasi mehr Zufall, also die Zuf\u00e4lligkeit hier eine Rolle spielt. So das hei\u00dft, ja, wenn der Zufall h\u00f6her ist, kann ich auch eher eine Normalverteilung vorfinden.<\/p>\n<p>Helena: Naja, man hat halt vor allen Dingen sehr viele Molek\u00fcle, die sich \u00fcberlagern, die alle unterschiedlich sich in verschiedene Richtungen bewegen. Das ist so der Punkt.<\/p>\n<p>Janine: Also auch eher die Menge.<\/p>\n<p>Helena: Genau, das ist auch einfach die Menge. Also physikalisch funktioniert das dann wieder \u00fcber den Dopplereffekt, dass f\u00fcr die betrachtende Person dann, wenn die Sachen in die eigene Richtung sich bewegen, halt die Wellenl\u00e4nge anders darstellt, als w\u00fcrden sie von einem weg bewegen. Und durch die Bewegung ist das dann wieder normal verteilt, was man dann als Linienbreite misst, obwohl, wenn man sich die Geschwindigkeiten angucken w\u00fcrde von den Molek\u00fclen selber, sind die ja nicht normal verteilt.<\/p>\n<p>Janine: Okay, gut. Dann hatten wir jetzt auf jeden Fall M\u00fcnzen, W\u00fcrfel, Licht und andere Dinge. Aber wir hatten ja in unserem Teaser in der letzten Folge auch Dinosaurier versprochen. Wie kommen die denn jetzt ins Spiel?<\/p>\n<h3>Habe ich eine Normalverteilung? (00:32:46)<\/h3>\n<p>Helena: Genau, die Dinosaurier kommen dadurch ins Spiel, dass man ja auch zweidimensionale Daten haben kann. Also ich kann eine normal verteilte Gr\u00f6\u00dfe haben auf der x-Achse, aber dann kann ich ja auch davon abh\u00e4ngig noch andere Werte haben, die f\u00fcr sich genommen vielleicht auch normal verteilt sein k\u00f6nnen, auf der y-Achse. Und das kann man dann aufmalen und mit Linien verbinden. Und da gibt es dann einen Beispieldatensatz, der nennt sich &quot;DataSaurusDozen&quot;, also das Datensaurus-Dutzend. Das sind dann ein Dutzend Datens\u00e4tze, die, wenn man sie als zweidimensionalen Plot sich anguckt, alle unterschiedlich aussehen. Aber die einzelnen Werte in x-Richtung bzw. in y-Richtung haben alle die gleiche Standardabweichung und die gleiche Mittelwert.<\/p>\n<p>Janine: Also das, was wir f\u00fcr die Normalverteilung quasi br\u00e4uchten.<\/p>\n<p>Helena: Genau, das, was halt so bei der Normalverteilung ausreichen w\u00fcrde, um diese Daten zu beschreiben. Und das hat man jetzt DatensaurusDozen genannt, weil einer dieser F\u00e4lle sieht halt aus wie so ein Dizensaurierkopf. Ja, jetzt haben wir hierf\u00fcr einfach nur Standardabweichung und Mittelwert, aber wir haben ja auch die einzelnen Werte. Ja.<\/p>\n<p>Janine: Ja, genau. Und da ist die Frage ja dann eigentlich, wie kann ich erkennen, ob es dann tats\u00e4chlich eine Normalverteilung ist? Nur wenn diese Sachen passen, muss es ja am Ende vielleicht tats\u00e4chlich keine sein.<\/p>\n<p>Helena: Genau, weil bei einer Normalverteilung w\u00fcrden diese Sachen halt reichen, um das zu beschreiben, aber wir wissen ja nicht, ob die Sachen wirklich normal verteilt sind. Grunds\u00e4tzlich hat man ja erstmal das Problem, man muss ja sehr viele Messungen machen, damit man am Ende wirklich diese Normalverteilung hat. Aber man guckt sich ja, wenn man jetzt zum Beispiel Menschen hat, die man misst, dann misst man ja auch nicht die gesamte Bev\u00f6lkerung, sondern immer nur einen Bruchteil der Menschen, bei dem man bestimmte Sachen sich anguckt. Man zieht also eine sogenannte Stichprobe, also man sampelt, also sampeln ist letztlich nur das englische Wort f\u00fcr Stichprobe, also zum Beispiel zieht man 100 Personen aus einer Gesamtbev\u00f6lkerung heraus. Und wenn man jetzt davon ausgeht, dass die 100 Menschen auch wirklich zuf\u00e4llig irgendwie ausgew\u00e4hlt wurden, ja, passt dann dazu, dass in der Gesamtpopulation diese Eigenschaft, die man sich jetzt anguckt, wirklich normal verteilt ist? Und die zweite Frage ist, ist jetzt wirklich auch diese Stichprobe zuf\u00e4llig? Die zweite Frage setzen wir jetzt erstmal voraus, dass man da schon irgendwie hingekriegt hat, dass die Stichprobe zuf\u00e4llig ist. W\u00fcrde man jetzt, keine Ahnung, sich auf K\u00f6rpergr\u00f6\u00dfen beziehen, wie wir das ja schon mal gemacht haben, und man guckt sich jetzt nur Basketballspieler an, dann ist das vielleicht keine zuf\u00e4llige Stichprobe, mit der man eine Aussage \u00fcber die Gesamtpopulation machen kann. Ja, und jetzt hat man im Wesentlichen zwei M\u00f6glichkeiten, wenn man halt so eine Stichprobe genommen hat, zu gucken, passt das denn zu einer Normalverteilung? Das eine ist das Plotting, also das grafische Darstellen, und das andere sind sogenannte statistische Tests.<\/p>\n<h3>Mit welchen Plots die Normalverteilung \u00fcberpr\u00fcfen? (00:35:55)<\/h3>\n<p>Janine: Genau, Helena sagt ja gerade Plotting, das grafische Darstellen. Damit ist das Visualisieren der Daten gemeint, also dass aus den zugrunde liegenden Daten eben ein Plot, ein Diagramm erzeugt wird, das dann als Bild interpretiert werden kann, beziehungsweise dessen Darstellung dann interpretiert werden kann. Wir haben dar\u00fcber schon mal recht ausf\u00fchrlich in Folge 13 \u00fcber eben Datenvisualisierung gesprochen, und vor allem dar\u00fcber, dass Datenvisualisierung verschiedene Zwecke hat, unter anderem die Exploration, also das Erkunden von Daten, um sich mit ihnen und verschiedenen Aspekten der Daten dann vertraut zu machen, und auch die Verifikation spielt hier eine Rolle, also das \u00dcberpr\u00fcfen, ob eine Annahme \u00fcber die Daten und deren Interpretation halt richtig ist. Also wenn euch das Thema n\u00e4her interessiert, dazu haben wir in Folge 13 geredet.<\/p>\n<p>Helena: Ja, und Verifikation spielt hier insofern eine Rolle, weil die Annahme, dass die Daten normal verteilt sind, ist erst mal ein Modell, ein Modell, was man \u00fcber die Daten hat. Und um das zu verifizieren, kann man eben bestimmte grafische Darstellungen verwenden, die man aber auch im Vorhinein schon mal zur Exploration nutzen kann. Also die haben durchaus verschiedene Zwecke. Und das Offensichtlichste erst mal, oder das Einfachste, ist hier das sogenannte Histogramm. Bei einem Histogramm teilt man quasi die Daten, die man hat, in spezifische Werte auf, die man dann zusammenfasst. Und je nachdem, wie viel man zusammenfasst, das wird dann binning genannt, also die Bereiche, ja zum Beispiel 1 cm Bereich bei der K\u00f6rpergr\u00f6\u00dfe, und dann z\u00e4hlt man, wie oft ist dieser Bereich. Und das ist dann ein Histogramm. Und hier kann man nat\u00fcrlich wundersch\u00f6n diese Glockenform sehen, wenn es normal verteilt ist. Also wenn man jetzt irgendwie sieht, ja die meisten sind bei den kleinen und bei den gro\u00dfen Werten, und dazwischen ist nicht so viel, dann ist es eindeutig nicht normal verteilt. Also wenn man dann eben eine Glockenform sieht, dann ist es m\u00f6glicherweise normal verteilt. Und ja, diese Glockenform wird deutlicher zu erkennen, je mehr Daten man hat. Also wenn man einige tausend Daten hat, dann kann man das schon relativ deutlich sehen. Wenn man irgendwie 100 hat, dann sieht es m\u00f6glicherweise halt komplett anders aus. Was nicht hei\u00dft, dass es nicht normal verteilt ist. So, eine Alternative dazu ist das sogenannte Quantil-Quantil-Diagramm oder auch QQ-Plot. Dabei werden die Daten gem\u00e4\u00df ihrer sogenannten Quantile aufgetragen. Und ein Quantil ist dann zum Beispiel, wie viel der Daten liegen in den ersten 10%, wie viel liegen in den zweiten 10%, wie viel liegen in den dritten 10%. Im Prinzip ist der Median auch das 50-Quantil, weil es in der Mitte liegt, also bei 50%. Und dann w\u00fcrde man eben auf der einen Achse auftragen, wo die Messwerte hingeh\u00f6ren. Und auf der anderen Achse w\u00fcrde man auftragen, was erwartet man denn, wenn das wirklich eine Normalverteilung ist. Und wenn man so einen Plot eben f\u00fcr eine normal verteilte Gr\u00f6\u00dfe macht, dann liegen alle auf der einen Achse, auf der einen Linie, die quasi direkt zwischen den beiden Achsen lang geht. So eine 45-Grad-Linie zwischen den Achsen. Und wenn man jetzt unten, also bei 0 rum, sieht, da ist so eine Kurve, die sich erst auf diese Linie ann\u00e4hern muss. Und die bewegt sich vielleicht am Ende von den Daten auch wieder von dieser Linie weg. Dann sieht man, dass es nicht normal verteilt.<\/p>\n<p>Janine: Also es muss tats\u00e4chlich sehr gerade heraus aus dem Nullpunkt hervorgehen.<\/p>\n<p>Helena: Ja, genau. So ein bisschen, was mal rausf\u00e4llt, dann ist das okay. Aber je mehr das rausf\u00e4llt, desto eindeutiger ist es nicht normal verteilt.<\/p>\n<h3>Wie mit statistischen Tests die Normalverteilung \u00fcberpr\u00fcfen? (00:39:44)<\/h3>\n<p>Janine: Ja, und das ist die eine Variante, wenn das Ganze \u00fcber, also wenn man herausfinden m\u00f6chte, ob das eine Normalverteilung ist, \u00fcber visuelle Darstellung. Das andere war ja statistische Tests. Denn manchmal m\u00f6chte man ja vielleicht das einfach in Zahlen sehen und direkt benennen k\u00f6nnen. Wie laufen denn diese statistischen Tests ab?<\/p>\n<p>Helena: Ja, also statistische Tests werden auch manchmal Hypothesentests genannt. Und dann gibt es immer zwei Hypothesen. Eine davon ist die sogenannte Nullhypothese, die man erst mal annimmt f\u00fcr den Normalfall. Also hier, ist es denn eine Normalverteilung? Und dann gibt es immer noch die Alternativhypothese, die dann besagt, es ist keine Normalverteilung in diesem Fall. Ja, und dann rechnet ein Test die Wahrscheinlichkeit aus, mit der durch Zufall, ja, die quasi besagt, wie wahrscheinlich ist, dass durch Zufall einfach jetzt die Nullhypothese stimmt, obwohl die Daten vielleicht auf andere Weise erzeugt worden sein k\u00f6nnten. Ja, und diese Wahrscheinlichkeit, mit der dann eben diese These stimmt, ist dann der sogenannte p-Wert. Der p-Wert, also p, ja, f\u00fcr percentage, ist dann oft 0,05, beziehungsweise 5%. Das ist so, in einem von 20 F\u00e4llen ist dieses Ergebnis durch reinen Zufall erzeugt worden. Und das ist dann, diese 5% wird sehr oft einfach als die Grenze angenommen. Also das hat nat\u00fcrlich auch gewisse Schwierigkeiten, wenn man jetzt immer von diesem Wert ausgeht, was jetzt nicht Teil dieser Folge ist. Also man sollte diesen 5% nicht immer vertrauen, weil man kann ja auch vorher bereits mit den Daten etwas gemacht haben, die dazu f\u00fchren, dass diese, ja, 20% oder 5%, also dieses 1\/20 anders erzeugt wird. Also wenn man 20 verschiedene Sachen testet und eins davon stimmt, dann hei\u00dft das ja nicht, dass das wirklich Sinn macht, sondern dass das reiner Zufall sein kann. Aber darum soll es jetzt erstmal nicht gehen. Es soll jetzt darum gehen, ja, wenn jetzt dieser Wert also unter 0,05 ist, also unter 5%, dann w\u00fcrde man die Nullhypothese verwerfen und die Alternativhypothese annehmen. Ja, da ist halt immer noch ein bisschen Interpretationsspielraum drin. Gut, und da gibt es jetzt verschiedene Tests, zum Beispiel den sogenannten Shapiro-Wilk-Test oder den Kolmogorov-Smirnov-Test. Aber es gibt insgesamt 20 verschiedene Tests, mit der getestet werden kann, ob etwas normal verteilt ist, je nachdem, welche Details einem wichtig sind. Und ein Problem ist hier jetzt irgendwie, ja, ist ja sch\u00f6n, dass es eine Normalverteilung ist, wenn man die Alternativhypothese nicht annehmen kann, weil der p-Wert \u00fcber 5% ist. Aber irgendwie f\u00fchlt es sich auch ein bisschen komisch an, dass das, was man testen will, dann eigentlich nicht die Nullhypothese ist. Weil normalerweise nimmt man immer den, also in den meisten statistischen Tests w\u00fcrde das, was einen interessiert, ja die Alternativhypothese sein und die Nullhypothese ist ja, der Effekt ist nicht vorhanden. Und die Alternativhypothese, dann w\u00e4re ja der Effekt ist vorhanden und das ist eine Normalverteilung. Und dass das hier irgendwie andersrum ist, ist so ein bisschen, ja, schwierig von der Interpretation her. Letztlich besagt es einem dann, ja, das meiste kann man erstmal irgendwie als normal verteilt annehmen, weil es ist ja nur mit 10%iger Wahrscheinlichkeit normal verteilt. Ja, keine Ahnung, ich finde diese Tests, die sind durchaus hilfreich, weil manchmal ist es eben, dieser p-Wert kann ja auch, ja, sehr klein werden in manchen F\u00e4llen. Und ich habe das zum Beispiel auch auf diese Data-Saurus-Dozen-Sachen angewendet und die Y-Werte waren irgendwie \u00fcberhaupt nicht normal verteilt bei den Sachen, die ich ausprobiert habe. Und die X-Werte waren laut Shapiro-Wilk-Test durchaus normal verteilt, aber dann nicht mehr nach Kolmogorov-Smirnov-Test. Also es macht schon Sinn, wenn man das macht, auch mehrere von diesen Tests zu machen. Und sie geben einem durchaus auch eine Idee. Und insbesondere bei kleineren Stichproben kann das hilfreich sein, dass man zumindest sagt, ja, es ist nicht unplausibel von normal verteilt auszugehen, weil dann kann man auch besser weiterrechnen. Ja, dabei muss man dann allerdings noch bedenken, dass bei sehr gro\u00dfen Stichproben wie 1000 Datenpunkte diese Tests auch immer empfindlicher werden. Und Sachen, die dann wunderbar wie, ja, eine Glocke aussehen im Histogramm, werden dann pl\u00f6tzlich als eindeutig nicht normal verteilt angesehen, weil es irgendwo ein paar Ausrei\u00dfer gibt. Und dann ist nat\u00fcrlich immer die Frage, will man jetzt lieber diesen Tests glauben oder lieber dessen, was man gesehen hat? Also die sind nicht automatisch besser als ein Plot, nur wenn man eine Zahl rauskriegt. Weil man muss sich auch immer die Frage stellen, wenn man etwas auf Normalverteilung testet, warum mache ich das und woran bin ich interessiert? Und wenn ich jetzt kleinste Abweichungen in Daten sehen will, um die besser zu analysieren, dann ist es nat\u00fcrlich interessant, das hiermit festzustellen, ja, es ist nicht exakt normal verteilt, da ist es irgendwie eine Abweichung, die will ich mir genauer angucken. Dann ist das gut. Aber wenn mich das gar nicht interessiert, sondern mir es eher um, ja, wie sieht es denn allgemein aus, geht, dann bleibe ich doch lieber bei der Normalverteilung, wenn die im QQPlot oder im Histogramm eigentlich sehr gut normal verteilt aussehen. Also in der Physik zum Beispiel hat das auch was damit zu tun, wie man, ja, Messfehler berechnet. Also die sind ja, man geht ja immer erst mal von normal verteilt aus, deswegen ja auch Fehlerkurve. Wenn man jetzt aber feststellt, die Sachen sind nicht normal verteilt, die Fehler, dann muss man ja ganz anders mit den Messfehlern weiterrechnen, als wenn die normal verteilt sind. Aber gleichzeitig ist in der Physik auch manchmal genau dieser Punkt, man will ja genau diese Abweichung herausfinden. Also, ja, mit normal verteilten Gr\u00f6\u00dfen weiterzurechnen ist halt viel einfacher, als wenn das andere sind, aber man kann das auch machen. Man kann mit Wahrscheinlichkeitsfunktionen rechnen. Man muss nicht immer nur Mittelwert und Standardabweichung benutzen.<\/p>\n<p>Janine: Sehr gut. Ich glaube, dann haben wir ann\u00e4hernd alles einmal gesagt, was wir gesagt haben wollten, oder?<\/p>\n<p>Helena: Ja, ich denke auch.<\/p>\n<h3>Fazit (00:46:20)<\/h3>\n<p>Helena: Kommen wir zum Fazit. Also mein Fazit bei dieser Folge ist, wenn man genug zuf\u00e4llige Dinge, die sich \u00fcberlagern und unabh\u00e4ngig voneinander sind, ja, zusammenpackt, dann bekommt man immer eine Normalverteilung und deswegen hei\u00dft die auch &quot;normal&quot;.<\/p>\n<p>Janine: Ja, das ist, glaube ich, eine ganz gute Zusammenfassung. Ich habe eigentlich diesen sehr knappen Fazit nicht sehr viel hinzuzuf\u00fcgen, au\u00dfer vielleicht nochmal so der kurze Abriss durch die Folge. Wir hatten damit begonnen, dass die Normalverteilung von Gauss eingef\u00fchrt wurde und ver\u00f6ffentlicht wurde und sich auch danach noch weiterentwickelt hat und eben auch mit anderen Konzepten zusammenh\u00e4ngt, wie zum Beispiel dem zentralen Grenzwertsatz, der eben besagt, dass wenn ich etwas h\u00e4ufig genug wiederhole, dann wird es eine Normalverteilung sein k\u00f6nnen und dergleichen. Also, ja, was Helena eben auch schon gesagt hatte, das nehme ich auf jeden Fall daraus mit. Und auch, ja, wie ich unterscheiden kann, es liegt eine Normalverteilung vor oder nicht, da sind eben verschiedene Methoden denkbar. Zum einen \u00fcber das Erstellen von Plots, wie dem Histogramm oder dem QQ-Plot, oder eben halt mit den statistischen Tests, wo eben auch was ganz Gut ist, wenn man manche Sachen miteinander abgleicht, je nach Fragestellung auch, wie Helena gerade ausgef\u00fchrt hat. Ja, ich denke, das ist so ein bisschen das Wichtigste, was wir heute gesagt haben. Oder was Helena heute gesagt hat, meine Redeanteil war etwas kleiner.<\/p>\n<h3>N\u00e4chste Folge: Gesundheitsdaten im September (00:47:57)<\/h3>\n<p>Helena: Ja, und in unserer n\u00e4chsten Folge wollen wir dann mal \u00fcber das Thema Gesundheitsdaten sprechen. Das ist ja ein durchaus sehr wichtiges und gro\u00dfes Thema und gerade auch angesichts dessen, dass jetzt gerade die elektronische Gesundheitsakte verpflichtend f\u00fcr alle eingef\u00fchrt wird. Ja, den Aspekt finde ich jetzt ehrlich gesagt etwas schwieriger, deswegen konzentrieren wir uns eher auf den Aspekt der Daten, die wir selbst erheben und beobachten k\u00f6nnen, wie zum Beispiel Selbst\u00fcberwachung mit Armb\u00e4ndern oder Gesundheits-Apps. Und hier spielt nat\u00fcrlich auch die Sicherheit dieser Daten eine wichtige Rolle.<\/p>\n<h3>Call to Action (00:48:35)<\/h3>\n<p>Janine: Genau, und wenn ihr das nicht verpassen wollt, weil versehentlich fast alle von uns, die ein Smartphone besitzen, garantiert Gesundheits-Apps auf diesem Handy haben, die flei\u00dfig Daten erfassen, dann folgt uns doch auf Mastodon unter datenleben@podcasts.social. Da ver\u00f6ffentlichen wir immer, wann eine Folge rausgekommen ist. Oder guckt auf unserer Webseite vorbei, www.datenleben.de, da k\u00f6nnt ihr uns auch gerne Feedback hinterlassen oder eben ganz altmodisch per E-Mail. Wir freuen uns immer sehr \u00fcber Kommentare zu unseren Folgen und nehmen auch Themenvorschl\u00e4ge gerne an. Und falls euch unsere Arbeits- und Denkweise gef\u00e4llt, k\u00f6nnt ihr uns auch als Data Scientist f\u00fcr Analysen oder Projekte buchen.<\/p>\n<p>Helena: Ja, dann bleiben wir nur noch f\u00fcr eure Aufmerksamkeit zu danken und bis zum n\u00e4chsten Mal. Ciao!<\/p>\n<p>Janine: Tsch\u00fcss! <\/p>\n","protected":false},"author":2,"featured_media":879,"comment_status":"open","ping_status":"open","template":"","meta":{"footnotes":""},"tags":[],"class_list":["post-880","podcast","type-podcast","status-publish","has-post-thumbnail","hentry","post"],"_links":{"self":[{"href":"https:\/\/www.datenleben.de\/index.php\/wp-json\/wp\/v2\/episodes\/880","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/www.datenleben.de\/index.php\/wp-json\/wp\/v2\/episodes"}],"about":[{"href":"https:\/\/www.datenleben.de\/index.php\/wp-json\/wp\/v2\/types\/podcast"}],"author":[{"embeddable":true,"href":"https:\/\/www.datenleben.de\/index.php\/wp-json\/wp\/v2\/users\/2"}],"replies":[{"embeddable":true,"href":"https:\/\/www.datenleben.de\/index.php\/wp-json\/wp\/v2\/comments?post=880"}],"version-history":[{"count":2,"href":"https:\/\/www.datenleben.de\/index.php\/wp-json\/wp\/v2\/episodes\/880\/revisions"}],"predecessor-version":[{"id":882,"href":"https:\/\/www.datenleben.de\/index.php\/wp-json\/wp\/v2\/episodes\/880\/revisions\/882"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/www.datenleben.de\/index.php\/wp-json\/wp\/v2\/media\/879"}],"wp:attachment":[{"href":"https:\/\/www.datenleben.de\/index.php\/wp-json\/wp\/v2\/media?parent=880"}],"wp:term":[{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/www.datenleben.de\/index.php\/wp-json\/wp\/v2\/tags?post=880"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}