{"id":171,"date":"2020-07-04T12:10:00","date_gmt":"2020-07-04T10:10:00","guid":{"rendered":"podlove-2020-07-03t11:48:41+00:00-bc72a1814f814a8"},"modified":"2020-07-04T12:23:45","modified_gmt":"2020-07-04T10:23:45","slug":"dl001-data-science","status":"publish","type":"podcast","link":"https:\/\/www.datenleben.de\/index.php\/2020\/07\/04\/dl001-data-science\/","title":{"rendered":"dl001: data science"},"content":{"rendered":"\n\t\t\n            <div class=\"podlove-web-player intrinsic-ignore podlove-web-player-loading\" id=\"player-69f2d7ef9ee01\"><root data-test=\"player--xl\" style=\"max-width:950px;min-width:260px;\">\n  <div class=\"tablet:px-6 tablet:pt-6 mobile:px-4 mobile:pt-4 flex flex-col\">\n    <div class=\"flex-col items-center mobile:flex tablet:hidden\">\n      <show-title class=\"text-sm\"><\/show-title>\n      <episode-title class=\"text-base mb-2\"><\/episode-title>\n      <subscribe-button class=\"mb-4 mobile:flex tablet:hidden\"><\/subscribe-button>\n      <poster class=\"rounded-sm w-48 shadow overflow-hidden\"><\/poster>\n      <divider class=\"w-full my-6\"><\/divider>\n    <\/div>\n\n    <div class=\"tablet:flex flex-grow\">\n      <div class=\"w-64 mobile:hidden tablet:block tablet:mr-6\">\n        <poster class=\"rounded-sm shadow overflow-hidden\"><\/poster>\n      <\/div>\n      <div class=\"w-full\">\n        <div class=\"hidden tablet:block\">\n          <show-title class=\"text-base\"><\/show-title>\n          <episode-title class=\"text-xl desktop:text-2xl\"><\/episode-title>\n          <divider class=\"w-full my-4\"><\/divider>\n        <\/div>\n        <div class=\"flex items-center justify-between\">\n          <div class=\"block\">\n            <play-state on=\"active\">\n              <speed-control class=\"flex items-center\"><\/speed-control>\n            <\/play-state>\n          <\/div>\n\n          <div class=\"flex\">\n            <play-state on=\"active\">\n              <chapter-previous class=\"mx-2 block\"><\/chapter-previous>\n            <\/play-state>\n            <play-state on=\"active\">\n              <step-backward class=\"mx-2 block\"><\/step-backward>\n            <\/play-state>\n\n            <play-button class=\"mx-2 block\" :label=\"$t('PLAYER.PLAY_EPISODE')\"><\/play-button>\n\n            <play-state on=\"active\">\n              <step-forward class=\"mx-2 block\"><\/step-forward>\n            <\/play-state>\n            <play-state on=\"active\">\n              <chapter-next class=\"mx-2 block\"><\/chapter-next>\n            <\/play-state>\n          <\/div>\n\n          <div class=\"block\">\n            <play-state on=\"active\">\n              <volume-control class=\"flex items-center\"><\/volume-control>\n            <\/play-state>\n          <\/div>\n        <\/div>\n        <div class=\"flex w-full\">\n          <progress-bar><\/progress-bar>\n        <\/div>\n        <div class=\"flex w-full -mt-2\">\n          <div class=\"w-3\/12 text-left\">\n            <timer-current class=\"text-sm\"><\/timer-current>\n          <\/div>\n          <div class=\"w-6\/12 text-center truncate\">\n            <play-state on=\"active\">\n              <current-chapter class=\"text-sm\"><\/current-chapter>\n            <\/play-state>\n          <\/div>\n          <div class=\"w-3\/12 text-right\">\n            <timer-duration class=\"text-sm\"><\/timer-duration>\n          <\/div>\n        <\/div>\n      <\/div>\n    <\/div>\n    <divider class=\"w-full mt-6 mb-3\"><\/divider>\n    <div class=\"flex justify-between\">\n      <div class=\"flex mobile:w-full tablet:w-3\/12 desktop:w-3\/12 justify-between\">\n        <tab-trigger tab=\"chapters\">\n          <icon type=\"chapter\"><\/icon>\n        <\/tab-trigger>\n        <tab-trigger tab=\"transcripts\">\n          <icon type=\"transcripts\"><\/icon>\n        <\/tab-trigger>\n        <tab-trigger tab=\"files\">\n          <icon type=\"download\"><\/icon>\n        <\/tab-trigger>\n        <tab-trigger tab=\"playlist\">\n          <icon type=\"playlist\"><\/icon>\n        <\/tab-trigger>\n        <tab-trigger tab=\"share\">\n          <icon type=\"share\"><\/icon>\n        <\/tab-trigger>\n      <\/div>\n      <subscribe-button class=\"mt-1 mobile:hidden tablet:flex\"><\/subscribe-button>\n    <\/div>\n  <\/div>\n  <div class=\"w-full relative overflow-hidden\">\n    <tab name=\"chapters\">\n      <tab-chapters><\/tab-chapters>\n    <\/tab>\n    <tab name=\"transcripts\">\n      <tab-transcripts><\/tab-transcripts>\n    <\/tab>\n    <tab name=\"files\">\n      <tab-files><\/tab-files>\n    <\/tab>\n    <tab name=\"playlist\">\n      <tab-playlist><\/tab-playlist>\n    <\/tab>\n    <tab name=\"share\">\n      <tab-share><\/tab-share>\n    <\/tab>\n    <tab-overflow><\/tab-overflow>\n  <\/div>\n  <error><\/error>\n<\/root>\n<\/div>\n            <script>\n              document.addEventListener(\"DOMContentLoaded\", function() {\n                var player = document.getElementById(\"player-69f2d7ef9ee01\");\n                podlovePlayerCache.add([{\"url\":\"https:\\\/\\\/www.datenleben.de\\\/index.php\\\/wp-json\\\/podlove-web-player\\\/shortcode\\\/publisher\\\/171\",\"data\":{\"version\":5,\"show\":{\"title\":\"datenleben\",\"subtitle\":\"der podcast \\u00fcber data science\",\"summary\":\"Was ist Data Science? Was bedeuten die Daten f\\u00fcr unser Leben? Woher kommen sie und wozu werden sie benutzt?\\r\\nDas sind alles Fragen, mit denen wir uns auseinander setzen werden.\\r\\nWer schon immer mehr \\u00fcber Daten und deren Effekt auf unser Leben wissen wollte, ist hier genau richtig.\",\"poster\":\"https:\\\/\\\/www.datenleben.de\\\/podlove\\\/image\\\/687474703a2f2f7777772e646174656e6c6562656e2e64652f77702d636f6e74656e742f75706c6f6164732f323032302f30362f636f7665722e706e67\\\/500\\\/0\\\/0\\\/datenleben\",\"link\":\"https:\\\/\\\/www.datenleben.de\"},\"title\":\"dl001: data science\",\"subtitle\":\"Was ist Data Science?\",\"summary\":\"Was bedeuten die Daten f\\u00fcr unser Leben? Woher kommen sie und wozu werden sie benutzt?\\r\\nDas sind alles Fragen, mit denen wir uns auseinander setzen werden.\\r\\nWer schon immer mehr \\u00fcber Daten und deren Effekt auf unser Leben wissen wollte, ist hier genau richtig.\",\"publicationDate\":\"2020-07-04T12:10:00+02:00\",\"duration\":\"00:44:09.240\",\"poster\":\"https:\\\/\\\/www.datenleben.de\\\/wp-content\\\/cache\\\/podlove\\\/8d\\\/2b1bb5b3ea0985012f7be35f67df3f\\\/data-science_500x.png\",\"link\":\"https:\\\/\\\/www.datenleben.de\\\/index.php\\\/2020\\\/07\\\/04\\\/dl001-data-science\\\/\",\"chapters\":[{\"start\":\"00:00:00.000\",\"title\":\"Intro\",\"href\":\"\",\"image\":\"\"},{\"start\":\"00:00:18.000\",\"title\":\"Thema des Podcasts und der Folge\",\"href\":\"\",\"image\":\"\"},{\"start\":\"00:01:03.000\",\"title\":\"Vorstellung: Wer ist Helena?\",\"href\":\"\",\"image\":\"\"},{\"start\":\"00:03:52.000\",\"title\":\"Vorstellung: Wer ist Janine?\",\"href\":\"\",\"image\":\"\"},{\"start\":\"00:04:41.900\",\"title\":\"Warum ist Data Science ein wichtiges Thema?\",\"href\":\"\",\"image\":\"\"},{\"start\":\"00:06:53.900\",\"title\":\"Erz\\u00e4hlung: Wenn ein Data Scientist nicht schlafen kann\",\"href\":\"\",\"image\":\"\"},{\"start\":\"00:10:02.000\",\"title\":\"Was ist Data Science?\",\"href\":\"\",\"image\":\"\"},{\"start\":\"00:17:15.500\",\"title\":\"Wof\\u00fcr Data Science?\",\"href\":\"\",\"image\":\"\"},{\"start\":\"00:22:50.500\",\"title\":\"Was macht Helena als Data Scientist konkret?\",\"href\":\"\",\"image\":\"\"},{\"start\":\"00:35:41.000\",\"title\":\"Was muss man als Data Scientist k\\u00f6nnen?\",\"href\":\"\",\"image\":\"\"},{\"start\":\"00:42:12.000\",\"title\":\"Fazit\",\"href\":\"\",\"image\":\"\"},{\"start\":\"00:42:25.000\",\"title\":\"N\\u00e4chstes Thema: Coronadaten am 25.07.2020\",\"href\":\"\",\"image\":\"\"},{\"start\":\"00:43:41.000\",\"title\":\"Call to Action\",\"href\":\"\",\"image\":\"\"}],\"audio\":[{\"url\":\"https:\\\/\\\/www.datenleben.de\\\/podlove\\\/file\\\/1\\\/s\\\/webplayer\\\/c\\\/website\\\/DL001_Data_Science.mp3\",\"size\":\"55523124\",\"title\":\"MP3 Audio (mp3)\",\"mimeType\":\"audio\\\/mpeg\"}],\"files\":[{\"url\":\"https:\\\/\\\/www.datenleben.de\\\/podlove\\\/file\\\/1\\\/s\\\/webplayer\\\/DL001_Data_Science.mp3\",\"size\":\"55523124\",\"title\":\"MP3 Audio\",\"mimeType\":\"audio\\\/mpeg\"}]}}, {\"url\":\"https:\\\/\\\/www.datenleben.de\\\/index.php\\\/wp-json\\\/podlove-web-player\\\/shortcode\\\/config\\\/default\\\/theme\\\/datenleben\",\"data\":{\"activeTab\":\"chapters\",\"subscribe-button\":null,\"share\":{\"channels\":[\"link\",\"facebook\",\"twitter\",\"whats-app\",\"linkedin\",\"pinterest\",\"xing\",\"mail\"],\"outlet\":\"https:\\\/\\\/www.datenleben.de\\\/wp-content\\\/plugins\\\/podlove-web-player\\\/web-player\\\/share.html\",\"sharePlaytime\":true},\"related-episodes\":{\"source\":\"disabled\",\"value\":null},\"version\":5,\"theme\":{\"tokens\":{\"brand\":\"#fff\",\"brandDark\":\"#fff\",\"brandDarkest\":\"#000\",\"brandLightest\":\"#8cc240\",\"shadeDark\":\"#807E7C\",\"shadeBase\":\"#807E7C\",\"contrast\":\"#000\",\"alt\":\"#8cc240\"},\"fonts\":{\"ci\":{\"name\":\"ci\",\"family\":[\"-apple-system\",\"BlinkMacSystemFont\",\"Segoe UI\",\"Roboto\",\"Helvetica\",\"Arial\",\"sans-serif\",\"Apple Color Emoji\",\"Segoe UI Emoji\\\", \\\"Segoe UI Symbol\"],\"src\":[],\"weight\":800},\"regular\":{\"name\":\"regular\",\"family\":[\"-apple-system\",\"BlinkMacSystemFont\",\"Segoe UI\",\"Roboto\",\"Helvetica\",\"Arial\",\"sans-serif\",\"Apple Color Emoji\",\"Segoe UI Emoji\\\", \\\"Segoe UI Symbol\"],\"src\":[],\"weight\":300},\"bold\":{\"name\":\"bold\",\"family\":[\"-apple-system\",\"BlinkMacSystemFont\",\"Segoe UI\",\"Roboto\",\"Helvetica\",\"Arial\",\"sans-serif\",\"Apple Color Emoji\",\"Segoe UI Emoji\\\", \\\"Segoe UI Symbol\"],\"src\":[],\"weight\":700}}},\"base\":\"https:\\\/\\\/www.datenleben.de\\\/wp-content\\\/plugins\\\/podlove-web-player\\\/web-player\\\/\"}}]);\n                podlovePlayer(player, \"https:\/\/www.datenleben.de\/index.php\/wp-json\/podlove-web-player\/shortcode\/publisher\/171\", \"https:\/\/www.datenleben.de\/index.php\/wp-json\/podlove-web-player\/shortcode\/config\/default\/theme\/datenleben\").then(function() {\n                  player && player.classList.remove(\"podlove-web-player-loading\");\n                });\n              });\n            <\/script>\n            <style>\n              .podlove-web-player.podlove-web-player-loading {\n                opacity: 0;\n              }\n            <\/style>\n        \n\t\n\t\t\n<h2>Shownotes DL001: Data Science<\/h2>\n<h3>Intro (00:00:00)<\/h3>\n<h3>Thema des Podcasts und der Folge (00:00:18)<\/h3>\n<p>Willkommen zu unserer ersten Folge beim datenleben-Podcast!<br \/>Wir sind Helena und Janine und m\u00f6chten euch mitnehmen in die Welt der Daten.<br \/>Was ist Data Science? Was bedeuten die Daten f\u00fcr unser Leben? Woher kommen sie und wozu werden sie benutzt?<br \/>Das sind alles Fragen, mit denen wir uns auseinander setzen werden.<br \/>Wer schon immer mehr \u00fcber Daten und deren Effekt auf unser Leben wissen wollte, ist hier genau richtig.<\/p>\n<p>In unserer ersten Folge m\u00f6chten wir etwas allgemeiner in Data Science einf\u00fchren.<br \/>Wir m\u00f6chten euch zeigen, warum Data Science ein wichtiges Thema ist, was ein Data Scientist wie Helena zum Beispiel ausmacht und wie die Arbeit eines Data Scientist aussieht, vor allem wie vielf\u00e4ltig sie ist.<\/p>\n<h3>Vorstellung (00:01:03)<\/h3>\n<h4>Wer ist Helena? (00:01:03)<\/h4>\n<ul>\n<li>arbeitet freiberuflich als Data Scientist<\/li>\n<li>hat Physik studiert und in experimenteller Physik promoviert, sie bereitet sich auf ihre Disputation vor<\/li>\n<li>\u00a0sie ist Teil der Hackercommunity, hat den Braunschweiger Hackerspace <a href=\"https:\/\/stratum0.org\/\">Stratum0<\/a> mitgegr\u00fcndet<\/li>\n<\/ul>\n<h4>Wer ist Janine? (00:03:52)<\/h4>\n<ul>\n<li>promoviert in Literaturwissenschaft zum Thema Wissenschaft und Technik in der Gegenwartsliteratur<\/li>\n<li>wissenschafts- und technikaffin und interessiert sich f\u00fcr Themen rund um Naturwissenschaft, Datenschutz und digitale Gesellschaft<\/li>\n<li>nat\u00fcrlich aber vor allem f\u00fcr B\u00fccher und auch kreative Dinge mit allen m\u00f6glichen Materialien und Techniken<\/li>\n<\/ul>\n<h3>Warum ist Data Science ein wichtiges Thema? (00:04:42)<\/h3>\n<ul>\n<li>Data Science ist jetzt schon wichtig und wird in den kommenden Jahren immer wichtiger werden<\/li>\n<li>Immer mehr Daten werden erfasst und stehen zur Verf\u00fcgung, um benutzt zu werden<\/li>\n<li>Daten werden uns mittels Statistiken st\u00e4ndig gezeigt, in den Nachrichten, Sozialen Medien und verschiedenen anderen Formaten<\/li>\n<li>Oft fehlt der Kontext: Woher kommen die Daten, was sagen die Daten selbst und wof\u00fcr werden sie vielleicht benutzt?<\/li>\n<li>Statistik ist oft schwer zu verstehen: <a href=\"https:\/\/de.wikipedia.org\/wiki\/Liste_gefl%C3%BCgelter_Worte\/T#Traue_keiner_Statistik,_die_du_nicht_selbst_gef%C3%A4lscht_hast.\">\"Traue keiner Statistik, die du nicht selbst gef\u00e4lscht hast.\"<\/a><\/li>\n<li>Man muss sich immer fragen, wie Daten eigentlich erhoben werden, um zu wissen, welche Schl\u00fcsse man aus Statistiken ziehen kann<\/li>\n<li>Grundthese und unser Motto: Kenne dein Messverfahren!<\/li>\n<li>Beispiel Rauschprofil von Kameras: Hat eine Kamera in einer physikalischen Messung etwas Bedeutendes gezeigt oder war es nur ein Artefakt der Kamera?<\/li>\n<li>Daten und die Methode ihrer Erhebung m\u00fcssen immer hinterfragt werden<\/li>\n<\/ul>\n<h3>Erz\u00e4hlung: Wenn ein Data Scientist nicht schlafen kann (00:06:53)<\/h3>\n<ul>\n<li>Mit Data Science wird Wissen gewonnen<\/li>\n<li>Eine Fragestellung oder ein Problem braucht eine L\u00f6sung<\/li>\n<li>Daten erfassen \u00fcber das Problem (Schlafmangel) und seine Rahmenbedingungen (Verhalten, Ern\u00e4hurung, Stimmung)<\/li>\n<li>Daten korrelieren: Schlafmangel mit Verhalten, Ern\u00e4hrung und Stimmung abgleichen<\/li>\n<li>Aus den Beobachtungen Schl\u00fcsse ziehen<\/li>\n<li>Korrelation ist noch nicht Kausalit\u00e4t: den Blick weiten und auch die Daten anderer Tage angucken, gezogene Schl\u00fcsse \u00fcberpr\u00fcfen<\/li>\n<li>Kausalit\u00e4t im Experiment \u00fcberpr\u00fcfen: Rahmenbedingungen ver\u00e4ndern und neue Daten erfassen<\/li>\n<li>Ablesen, ob sich Hypothesen best\u00e4tigt haben, ggf. erneut anpassen und Daten sammeln<\/li>\n<li>Am Ende k\u00f6nnen auf Basis von Daten Entscheidungen getroffen werden<\/li>\n<\/ul>\n<h3>Was ist Data Science? (00:10:02)<\/h3>\n<ul>\n<li>Datenerfassung: Mikro, Kamera, Umfragen, Bewegungsprofile, Nutzerverhalten<\/li>\n<li>Datenanalyse: klassisch mit Statistik, Text aus Tonaufnahmen extrahieren, Objekterkennung auf Fotos<\/li>\n<li>Maschinelles Lernen, wird bereits manchmal als K\u00fcnstliche Intelligenz bezeichnet, ist aber noch nicht als solche zu verstehen<\/li>\n<li>Eine spezielle Form des Maschinellen Lernens sind Neuronale Netze<\/li>\n<li>Programmieren -&gt; Hackermentalit\u00e4t<\/li>\n<li>Statistik zu k\u00f6nnen reicht nicht aus, man muss auch programmieren k\u00f6nnen, um etwa Schritte zu automatisieren, die sich wiederholen<\/li>\n<li>Beispiel: Wildtierkamera<\/li>\n<li>Datenanalyse passiert schon bei der Datenerfassung: die Kamera soll nur ausl\u00f6sen, wenn ein Tier vor der Kamera ist<\/li>\n<li>Wenn die Kamera schlie\u00dflich aus dem Wald geholt wird, geschieht die umfassende Analyse: Welche Tiere wurden fotografiert?<\/li>\n<li>Wie oft sind an diesem konkreten Ort diese Tiere erfasst wurden und zu welcher Zeit?<\/li>\n<li>Daten mit anderen Kamerastandorten in Verbindung bringen und \u00fcber mehrere Jahre betrachten<\/li>\n<li>Zeigt die Ausbreitung und die Anzahl einer Population beobachteter Tierarten (Beispiel Ansiedlung Luchse im Harz)<\/li>\n<li>Mittels Maschinellem Lernen m\u00fcssen keine Menschen die umfangreichen Bildsammlungen auswerten, Auswertung wird automatisiert<\/li>\n<li>Software erkennt das Tier<\/li>\n<li>Das Trainieren des Programms ist aufw\u00e4ndig, die Anwendung dann aber nicht mehr, sie erleichtert viele Arbeitsschritte durch Automatisierung<\/li>\n<\/ul>\n<h3>Wof\u00fcr Data Science? (00:17:15)<\/h3>\n<ul>\n<li>Ziel von Data Science: informierte Entscheidungen treffen<\/li>\n<li>Data Science generiert Daten und daraus gewinnen wir Wissen \u00fcber die Welt um uns herum<\/li>\n<li>Dieses Wissen hilft uns zu entscheiden, z.B. wie Technik um uns herum funktionieren soll, welche Ziele sie haben kann<\/li>\n<li>Firmen beauftragen Data Scientists mit Datenerfassung und -analysen, um eine Gesch\u00e4ftsstrategie zu entwickeln<\/li>\n<li>Beispiel Glasfaserkabel: Ein Unternehmen m\u00f6chte wissen, in welcher Stadt sie mit dem Ausbau von Glasfaserkabeln anfangen sollten<\/li>\n<li>Beispiel Diskriminierung: Auch gesellschaftliche Aspekte lassen sich aus Daten ablesen, wie und wo findet etwa Diskriminierung statt?<\/li>\n<li>Beispiel Statistiken: Wahlumfragen verschiedener Institute fallen immer etwas anders aus, zeigt, dass es auch drauf ankommt, wer Daten sammelt und wie er sie auswertet<\/li>\n<li>Wahlstatistiken k\u00f6nnen dabei auch den Effekt haben, sich auf Wahlentscheidungen von W\u00e4hler*innen auszuwirken<\/li>\n<li>Das kann dabei v\u00f6llig unbewusst passieren, oder bewusst, weil man sich etwa an der 5%-H\u00fcrde orientiert<\/li>\n<li>Es ist auch immer die Frage, wer die Daten mit welchen Hintergrund analysiert<\/li>\n<li>Beispiel Kredite: Betrachten \u00fcbervorsichtig ihre Daten und neigen dazu die Vergangenheit zu reproduzieren (alte Klischees haben Bestand, Gruppen werden ausgeschlossen)<\/li>\n<li>Klassisches Beispiel ist hier auch die SchuFa<\/li>\n<li>Beispiel Postleitzahlen: Beim Einkaufen werden wir nach Postleitzahlen gefragt, das kann verschiedene Effetke haben<\/li>\n<li>Werbung verteilen: Reichweite messen, wo hat Werbung zu mehr Kunden gef\u00fchrt, woher kommen Kunden, welche Werbung funktioniert?<\/li>\n<li>Postleitzahlennutzung durch Dritte: Institutionen kaufen die Datens\u00e4tze auf und verkaufen sie weiter, z. B. an Kreditinstitute<\/li>\n<li>Diese k\u00f6nnen dann sehen, ob ein Kunde in einem Stadtteil mit hoher Kaufkraft lebt und ihre Entscheidung \u00fcber Kredite daran binden<\/li>\n<li>Data Science spielt gerade beim Umgang mit personenbezogenen Daten eine gro\u00dfe Rolle, gerade auch im Kontext Diskriminierung<\/li>\n<li>Zum Thema Diskriminierung durch Daten ist bereits eine Folge in Planung<\/li>\n<\/ul>\n<h3>Was macht Helena als Data Scientist konkret? (00:22:50)<\/h3>\n<ul>\n<li>Die Arbeit besteht aus sehr viel Softwareentwicklung<\/li>\n<li>F\u00fcr Kunden, die Daten vorliegen haben, werden eigene L\u00f6sungen entwickelt<\/li>\n<li>Dabei werden verschiedene statistische Modelle entwickelt oder implementiert<\/li>\n<li>Beispiel Wetterdaten: Projekt f\u00fcr das Europ\u00e4ische Zentrum f\u00fcr mittelfristige Wettervorhersagen (EZMW) zusammen mit einer Designerin<\/li>\n<li>Ziel war es aus den Daten eine Darstellung zu entwickeln, die nicht verschweigt, dass Wettervorhersagen unsicher sind<\/li>\n<li>Konzept entwickelt, wie man darstellen kann, mit welcher Wahrscheinlichkeit eine Wetterprognose f\u00fcr einen bestimmten Tag zutrifft<\/li>\n<li>Datenbasis des EZMW genutzt: Sie berechnen immer 50 Szenarien mit leicht verschiedenen Werten aus, die Wahrscheinlichkeit liegt nur bei 30%<\/li>\n<li>Ergebnis war eine Darstellung, die verst\u00e4ndlicher die Wahrscheinlichkeit von Wettervorhersagen vermitteln kann<\/li>\n<li>Leider ist der Dienst nicht mehr online, aber auf <a href=\"https:\/\/github.com\/ktrask\/ESOWC-2018-visualisation\">GitHub<\/a> kann man sich die grafischen Darstellungen dazu ansehen<\/li>\n<li>Arbeitsalltag eines Data Scientist<\/li>\n<li>Konkrete Aufgabenstellung, die man zu bearbeiten hat, oft innerhalb eines Teams, mit dem man sich besprechen muss<\/li>\n<li>Basis ist oft ein Testdatensatz, an dem man entwickeln kann: Algorithmen, Auswertemethoden und Analysen testen oder grafische Darstellungen und Plots<\/li>\n<li>Testdaten verhindern, dass Gesch\u00e4ftsgeheimnisse oder personenbezogene Daten an Data Scientists ausgegeben werden m\u00fcssen<\/li>\n<li>Nachteil ist, dass Testdaten oft andere Eigenschaften haben, sodass ein sp\u00e4terer Testlauf mit echten Daten oft zu Bugs (Fehlern) f\u00fchrt<\/li>\n<li>Spannend an Data Science: Neue R\u00e4tsel und Logik Puzzle l\u00f6sen, wo war die Annahme falsch, woran hat man nicht gedacht, was passiert mit den Daten?<\/li>\n<li>Beispiel Adressdaten: wenn man online einkauft, muss man oft seine Adresse angeben, die Eingabemaske kann schon zum Problem werden<\/li>\n<li>Fehlerquellen sind Sonderzeichen oder Adressen ohne Stra\u00dfenangabe und Hausnummer oder internationale Adressen (nicht einheitlicher Aufbau von Adressdaten)<\/li>\n<li>International verschickte Pakete sind daher anf\u00e4llig f\u00fcr Fehler in der Datenerfassung und -ermittlung<\/li>\n<li>Kaputte Adressdaten k\u00f6nnen Menschen (Paketzusteller, Paketshopmitarbeiter) zum Gl\u00fcck oft ausgleichen k\u00f6nnen, Drohnen w\u00e4ren damit vermutlich \u00fcberfordert<\/li>\n<li>Data Scientists haben oft Verschwiegenheitsverpflichtungen, deswegen kann Helena nicht wirklich \u00fcber aktuelle Projekte reden, an denen sie arbeitet<\/li>\n<\/ul>\n<h3>Was muss man als Data Scientist k\u00f6nnen? (00:35:41)<\/h3>\n<ul>\n<li>Muss man programmieren k\u00f6nnen? Wie sehr muss man sich im IT-Bereich auskennen?<\/li>\n<li>Im Bereich Statistik oder Mathematik kommt es nicht so sehr auf das Programmieren an, grafische Programme wie Tableu k\u00f6nnen einem das ein bisschen abnehmen<\/li>\n<li>Das w\u00e4ren dann aber f\u00fcr Helena eher Statistiker und keine Data Scientists<\/li>\n<li>F\u00fcr Helena geh\u00f6rt zu Data Science neben Statistik ganz klar auch das Programmieren, dass man Ideen umsetzen kann<\/li>\n<li>Um wirklich sicher mit Statistik umgehen zu k\u00f6nnen, reicht es nicht, nur mal ein Buch dar\u00fcber gelesen zu haben, man sollte es schon im Studium gehabt haben<\/li>\n<li>Man muss verschiedene Anwendungsbereiche k\u00f6nnen und kennen, sodass man die je nach Fall anwenden kann<\/li>\n<li>Es wird von den meisten Data Scientists erwartet, dass sie schon sehr viel gesehen haben und das Ganze in Software umsetzen k\u00f6nnen<\/li>\n<li>Ein Data Scientist muss sich in das Thema oder T\u00e4tigkeitsfeldes des Kunden einarbeiten und ein Verst\u00e4ndnis f\u00fcr das wirtschaftliche Interesse des Kunden haben<\/li>\n<li>Beispiel Flugversp\u00e4tungen: Es gibt bestimmte Kenngr\u00f6\u00dfen wie Flugversp\u00e4tungen dargestellt werden<\/li>\n<li>Man muss diese Kenngr\u00f6\u00dfen verstehen, damit die Analsysen diese Kenngr\u00f6\u00dfen ausliefern<\/li>\n<li>Und man muss verstehen, wo Probleme auftreten k\u00f6nnen, die das Ergebnis eventuell verzerren<\/li>\n<li>Ein Data Scientist muss viel Interesse, Verst\u00e4ndnis und Logik mitbringen und bereit sein sich in viele neue Bereiche hineinzudenken<\/li>\n<li>Neue Projekte sind daher immer spannend, weil man immer mit neuen Fragestellungen konfrontiert wird<\/li>\n<li>Manchmal muss man aber auch einfach nur eher unspannende Dinge abarbeiten, die gut bezahlt werden<\/li>\n<li>Was ist der Unterschied zwischen Data Scientists, Data Analysts und Data Engeniers?<\/li>\n<li>Helena unterscheidet f\u00fcr sich nicht nach solchen Kategorien und zweifelt daran, wie zielf\u00fchrend das ist<\/li>\n<li>In ihrer Praxis hat das bisher keine Rolle gespielt<\/li>\n<li>F\u00fcr Helena liegt der Reiz in der Vielseitigkeit, daher ist sie auch Freiberuflerin, weil sie so immer mit neuen Aufgaben konfrontiert wird<\/li>\n<li>Sie kann nat\u00fcrlich nur f\u00fcr sich selbst sprechen<\/li>\n<\/ul>\n<h3>Fazit (00:42:12)<\/h3>\n<ul>\n<li>Data Science ist eine Disziplin, deren Ziel es ist, Erkenntnisse zu gewinnen und daf\u00fcr Daten zu sammeln und zu verarbeiten<\/li>\n<li>In den n\u00e4chsten Folgen werden wir dann schauen, was es f\u00fcr Varianten gibt<\/li>\n<\/ul>\n<h3>N\u00e4chstes Thema: Coronadaten am 25.07.2020 (00:43:30)<\/h3>\n<ul>\n<li>Im Moment erleben wir die Covid-19-Epedemie<\/li>\n<li>Wir sind keine Epidemiologen, aber wir wollen einfach mal \u00fcber die jetzt anfallenden Daten sprechen<\/li>\n<li>Jeder spricht \u00fcber Fallzahlen, Sterblichkeit, \u00dcbersterblichkeit und Ansteckungswahrscheinlichkeiten<\/li>\n<li>Was gibt es f\u00fcr Daten? Was gibt es f\u00fcr Fallstricke mit diesen Daten? Wie kann man sie sinnvoll einordnen?<\/li>\n<li>Aber wir wollen keine inhaltliche Aussage treffen, sondern eher Muster beschreiben<\/li>\n<li>Wir kriegen jeden Tag neue Werte und Zahlen pr\u00e4sentiert und manche fragen sich: Worauf muss ich da achten?<\/li>\n<\/ul>\n<h3>Call to Action (00:43:40)<\/h3>\n<ul>\n<li>Wenn euch unsere erste Folge gefallen hat, empfehlt sie weiter und folgt uns<\/li>\n<li>Twitter unter <a href=\"https:\/\/twitter.com\/datenleben\">@datenleben<\/a><\/li>\n<li>Webseite: <a href=\"https:\/\/www.datenleben.de\/\">https:\/\/www.datenleben.de\/<\/a><\/li>\n<li>Schreibt uns bei Fragen oder Themenvorschl\u00e4gen!<\/li>\n<\/ul>\n<h3>Schlagworte zur Folge<\/h3>\n<p>Data Science, Messverfahren, Maschinelles Lernen, Berufsfeld Data Science, Arbeitsalltag<\/p>\n<h3>Quellen<\/h3>\n<ul>\n<li><a href=\"https:\/\/de.wikipedia.org\/wiki\/Liste_gefl%C3%BCgelter_Worte\/T#Traue_keiner_Statistik,_die_du_nicht_selbst_gef%C3%A4lscht_hast.\">Wikipedia: Liste gefl\u00fcgelter Worte \u2013Traue keiner Statistik, die du nicht selbst gef\u00e4lscht hast<\/a><\/li>\n<li><a href=\"https:\/\/github.com\/ktrask\/ESOWC-2018-visualisation\">GitHub, ktrask: ESOWC-2018-visualisation<\/a><\/li>\n<\/ul>\n<h3>Weiterf\u00fchrende Links<\/h3>\n<ul>\n<li><a href=\"https:\/\/stratum0.org\/\">Stratum0<\/a><\/li>\n<li><a href=\"https:\/\/www.deutschlandfunkkultur.de\/finanzexperte-dirk-ulbricht-ueber-die-schufa-die-haben-mich.1008.de.html?dram:article_id=434740\">DLF Kultur: Zusammenhang Postleitzahlen und Kredite<\/a><\/li>\n<li><a href=\"https:\/\/de.wikipedia.org\/wiki\/Postleitzahl#Postleitzahlen_in_der_Privatwirtschaft\">Wikipedia: Postleitzahlen in der Privatwirtschaft<\/a><\/li>\n<li><a href=\"https:\/\/www.antidiskriminierungsstelle.de\/SharedDocs\/Downloads\/DE\/publikationen\/Expertisen\/Studie_Diskriminierungsrisiken_durch_Verwendung_von_Algorithmen.pdf?__blob=publicationFile&amp;v=4\">Antidiskriminierungsstelle des Bundes: Diskriminierungsrisiken durch Verwendung von Algorithmen<\/a><\/li>\n<li><a href=\"https:\/\/www.sueddeutsche.de\/politik\/demoskopie-bitter-im-abgang-1.3669942\">S\u00fcddeutsche Zeitung: Wahlumfragen sind ein Problem f\u00fcr die Demokratie<\/a><\/li>\n<li><a href=\"https:\/\/www.bpb.de\/mediathek\/254967\/wahlkabine-zum-thema-wahlumfragen\">Bundeszentrale f\u00fcr politische Bildung: Wahlkabine zum Thema Wahlumfragen, bpb-Podcast zur Bundestagswahl 2017<\/a><\/li>\n<li><a href=\"https:\/\/www.bundestag.de\/resource\/blob\/501190\/93c528ed2eea2e3113b3b1210695eed3\/wd-1-045-16-pdf-data.pdf\">Deutscher Bundestag, Wissenschaftliche Dienste: Einfluss vonMeinungsumfragen und Demoskopien aufW\u00e4hlerverhal-ten und Wahlergebnisse<\/a><\/li>\n<li><a href=\"https:\/\/www.luchsprojekt-harz.de\/\">Luchsprojekt Harz<\/a><\/li>\n<li><a href=\"https:\/\/de.wikipedia.org\/wiki\/Maschinelles_Lernen\">Wikipedia: Maschinelles Lernen<\/a><\/li>\n<li><a href=\"https:\/\/de.wikipedia.org\/wiki\/Data_Science\">Wikipedia: Data Science<\/a><\/li>\n<\/ul>\n\n\n<p><\/p>\n","protected":false},"author":2,"featured_media":173,"comment_status":"open","ping_status":"open","template":"","meta":{"footnotes":""},"tags":[],"class_list":["post-171","podcast","type-podcast","status-publish","has-post-thumbnail","hentry","post"],"_links":{"self":[{"href":"https:\/\/www.datenleben.de\/index.php\/wp-json\/wp\/v2\/episodes\/171","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/www.datenleben.de\/index.php\/wp-json\/wp\/v2\/episodes"}],"about":[{"href":"https:\/\/www.datenleben.de\/index.php\/wp-json\/wp\/v2\/types\/podcast"}],"author":[{"embeddable":true,"href":"https:\/\/www.datenleben.de\/index.php\/wp-json\/wp\/v2\/users\/2"}],"replies":[{"embeddable":true,"href":"https:\/\/www.datenleben.de\/index.php\/wp-json\/wp\/v2\/comments?post=171"}],"version-history":[{"count":11,"href":"https:\/\/www.datenleben.de\/index.php\/wp-json\/wp\/v2\/episodes\/171\/revisions"}],"predecessor-version":[{"id":204,"href":"https:\/\/www.datenleben.de\/index.php\/wp-json\/wp\/v2\/episodes\/171\/revisions\/204"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/www.datenleben.de\/index.php\/wp-json\/wp\/v2\/media\/173"}],"wp:attachment":[{"href":"https:\/\/www.datenleben.de\/index.php\/wp-json\/wp\/v2\/media?parent=171"}],"wp:term":[{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/www.datenleben.de\/index.php\/wp-json\/wp\/v2\/tags?post=171"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}