dl022: jahresrückblick 2021

dl022: jahresrückblick 2021

Intro (00:00:00)

Thema des Podcasts (00:00:18)

Willkommen zur zweiundzwanzigsten Folge beim datenleben-Podcast, dem Podcast über Data Science!
Wir sind Helena und Janine und möchten euch mitnehmen in die Welt der Daten.
Was ist Data Science? Was bedeuten die Daten für unser Leben? Woher kommen sie und wozu werden sie benutzt?
Das sind alles Fragen, mit denen wir uns auseinander setzen.
Wer schon immer mehr über Daten und deren Effekt auf unser Leben wissen wollte, ist hier genau richtig.

Thema der Folge (00:00:44)

  • Willkommen in 2022!
  • Traditionell möchten wir das vergangene Jahr mit einem Jahresrückblick abschließen
  • Aus zuverlässiger Quelle (Downloadzahlen), wissen wir auch, dass das ein begehrtes Thema ist
  • Entsprechend wird das Thema dieses Jahr auch eine Rolle spielen, aber durchaus anders, als letztes Mal... denn wir sind alle furchtbar müde davon
  • Ein Schnelldurchlauf durch das Jahr mit ein paar dingen, die herausragen (von wahnsinnig vielen)
  • Natürlich werfen wir dann gleich als erstes erstmal einen Blick auf die Podcastzahlen
  • Stellen uns dann der frage: Was nehmen wir mit aus 2021 an Themen oder Erkenntnissen?
  • Helena hat wieder geschaut, welche Data Science Themen es im vergangenen Jahr gab
  • Am Ende fragen wir uns, was uns dieses Jahr wohl erwarten wird

Warum ist dieses Thema interessant? (00:02:24)

  • Weil es unsere Tradition ist und wir Lust drauf haben, zu schauen: Was ist so liegen geblieben, was gab es noch für Themen, wo wir keine Folge hatten?
  • Und auch einfach mal wieder meta über den Podcast sprechen zu können; der produziert ja auch Daten

Einspieler: Jahresrückblick — 2021 im Schnelldurchlauf (00:02:59)

Wie hat sich datenleben 2021 entwickelt? (00:07:51)

  • Statt im 4-Wochen-Rhythmus zu bleiben und eine Folge zu machen, haben wir Ende Dezember auf der rC3 einen Vortrag gehalten
  • Unser Podcast ist 1 Jahr geworden und wir haben noch immer Spaß dran und wollen weiter machen
  • Wir sind sehr happy, weil die Zahlen fröhlich vor sich hin wachsen
  • Die Downloadzahlen haben sich in 2021 gegenüber zu 2020 etwa um ein Drittel gesteigert
  • Rausgerechnet ist, dass das Jahr 2020 nur ein halbes Jahr für uns war, 2021 ein volles Jahr
  • Wir erfassen wie viele Downloads jede Folge in den ersten 24 Stunden, 7 Tagen, 4 Wochen etc. hatte
  • und da können wir klar sehen, dass die letzten Folgen jeweils immer die erfolgreichsten waren
  • D.h. neue Folgen haben zu diesen Meilensteinen jeweils mehr Downloads als die älteren zum gleichen Zeitpunkt hatten
  • Python lernen!-Folge räumt hier ordentlich ab, hat nach 4 wochen schon die bisher beste performance für die 3-Monats-Marke überholt
  • Danach kommen Drogenkonsum und 3d-modelle aus Fotos, die sich bei den Plätzen 2 und 3 abwechseln
  • Downloads insgesamt in 2021: Platz 1 hat Folge 1: Data Science (wie letztes jahr)
  • Platz 2 hat Folge 13: Daten visualisieren und an Platz 3 ist Folge 21: Python lernen!
  • Was beachtlich ist, weil sie nur knapp 3 wochen Zeit hatte, um ältere Folgen

Meilensteine der Downloadzahlen

  • was lernen wir daraus als podcasterinnen?
  • Folge 1 wird immer und immer wieder gehört, die Folge, in der man als Neupodcasterinnen am wenigsten erfahrung am Mikro hat, ist die, die am häufigsten gehört werden wird – yeah! oder so
  • Wir hoffen, sie ist immer noch gut. Gebt uns gerne Feedback!
  • Und: es macht Spaß zu sehen, dass die neuen Folgen so viel mehr gehört werden bei Veröffentlichung
  • Ausserdem: Folgen mit Gäst*innen laufen auch immer super
  • Thematisch: Klimathemen-Folgen werden weniger oft gehört als die technischeren Folgen, aber auch als die gesellschaftliche Themen
  • Gebt uns Feedback zu unseren bisherigen Themen, wir wollen Folgen machen, die euch interessieren
  • Was sind unsere Lieblingsfolgen 2021?
  • Helena: Daten visualiseren, sehr technische Folge mit vielen Details, war auch bei anderen beliebt
  • Helena: 3D-Modelle aus Fotos, weil es um Datenverarbeitung ging, um etwas völlig neues herzustellen und es ging um einen Datathon
  • Janine: Erdbeben, weil es um den Grund steht, auf dem wir leben, viel gelernt
  • Janine: Python lernen, weil Aufnahme schon Spaß gemacht hat, weil es um "wie lerne/lehre ich" ging

Was nehmen wir mit aus 2021 an Themen oder Erkenntnissen? (00:18:05)

  • Helena: Dieses Jahr an Data Science Themen gar nicht so viel mitbekommen
  • Hat ihren Nachrichtenkonsum stark eingeschränkt, weil die Pandemie alles so stark dominiert hat
  • Janine: auch erst Probleme beim Rückblick, bei selbst Erlebtem und was auf der Welt passiert ist
  • Konnte viel schlechter einordnen, wann etwas passiert ist, ob in diesem oder dem letzten Jahr
  • Fragt sich was mit dem Zeitempfinden noch passiert, oder 2022 ein Haken hinter die Pandemie kommt
  • Einfluss auf viele: Katastrophenzustand vs. Alltagspflicht
  • Meme aus zwei Kreisen: apocalyps vs. having to go to work, da wo sie sich überschneiden steht: somehow we endet up here

Somehow we ended up here

  • Das ist wahrscheinlich für viele Menschen sehr erschöpfend
  • 2021 bestand einfach aus super viel Coping
  • Trotzdem sind uns noch Dinge eingefallen, fangen wir mit der Bundestagswahl an

Zur Bundestagswahl 2021 (00:21:32)

  • Wir haben dazu sogar eine Folge gemacht, bzw. zum Thema Wahlen und Umfragen
  • Helena war Wahlhelferin, in Braunschweig war zusätzlich Kommunalwahl an einem anderen Termin
  • Kein Stress mit Maskenverweigerern, genug Stimmzettel waren auch da
  • Es gab einen kleinen Fuckup mit Briefwahlunterlagen, die angeblich ausgehändigt wurden
  • Wenn diese Beantragt wurden, darf man keine Stimmzettel im Wahllokal bekommen
  • Man müsste sie zur Stimmabgabe mitbringen
  • Damit niemand zwei Mal abstimmen kann
  • Es kam dann ein Mensch, der Stimmzettel wollte, laut Unterlagen aber schon Briefwahlunterlagen hatte; dieser Mensch wusste davon aber nichts
  • Erstmal musste er nach Hause geschickt werden, später konnte das noch geklärt werden, es ist ein fehlerhafter Eintrag im System gewesen; der Mensch konnte dann doch noch wählen
  • Super zu sehen, dass das System an sich funktioniert und alles auch geklärt werden konnte
  • Die Wahl hat dann ja tatsächlich zu einem Regierungswechsel geführt
  • Helena hatte in Wahlumfragen-Folge prognostiziert, dass die CDU die Bundestagswahl gewinnen könnte, wenn über den Sommer durch Ipmfung die Pandemie weitestgehend als beendet erklärt würde
  • Die Grundvoraussetzung ihrer Vorhersage ist aber nicht eingetreten, daher lässt sich die Richtigkeit der Vorhersage nicht überprüfen

Wissenschaft und Gesellschaft (00:27:15)

  • Thema 2021 für Janine ist Wissenschaft und Gesellschaft
  • Auch schon das Jahr davor, aber 2021 einfach das aufdringlichste Thematisch
  • Es geht um Diskrepanz, die zwischen Wissenschaft/Wissen/-skommunikation und Gesellschaft existiert
  • Das ist eine persönliche Beobachtung, die keine Zahlen hat
  • Eindruck aus Gesprächen: Es werden immer wieder Dinge gefragt werden oder erklärt werden müssen, die eigentlich seit über einem Jahr eher Allgemeinwissen für unsere aktuellen Lebensumstände sind
  • Wichtiges Thema: Wie wird Wissenschaft nachvollziebar gemacht?
  • Müssen uns auch als Podcasterinnen Gedanken machen, was und wie kommunizieren
  • Dass diese Diskrepanz so riesig ist, da spielen vermutlich verschiedene Faktoren rein
  • Die sicher auch andere schon zu genüge analyisiert haben, und hier gar nicht im Detail ausgeweitet werden sollen, aber um es konkret zu machen Beispiele
  • Informationsflut, der wir ausgesetzt sind: Am Anfang der Pandemie schon riesig, aber aufgrund der aktuellen Masse fällt es schwer informiert zu bleiben und vielleicht Widersprüche auch aufzulösen
  • Vermutlich stellen wir uns viele Fragen, die nicht mehr so einfach beantwortet werden können
  • Beispiel: Am Anfang #FlattenTheCurve, vermeidet jede Ansteckung
  • Jetzt ist ein großer Teil geimpft (leider noch nicht alle, die es könnten) und haben eine riesige inzidenz, wie wir sie noch nie hatten, während niemand mehr sagt #FlattenTheCurve
  • Wissen verändert sich, aber wir müssen auch damit umgehen, das adäquat anzupassen
  • Wie sollen Menschen, die da nicht qualifiziert das noch einordnen können, was ist die Relation zwischen einer Inzidenz von jetzt 500 zu 50 früher?
  • Da spielt das zweite und dritte Problem, das wir in diesem Komplex haben, mit rein
  • Zweites problem: Politik und politisches Handeln entspricht gerade nicht dem, was sinnvoll erscheint, wenn man versucht aus alle den Informationen eine Konsequenz zu ziehen
  • Stichworte wie: Mehr Home Office, Distanzunterricht, Luftfilter in Schulen etc. kommen hier ins Spiel
  • Janine findet die Kommunikation der Informationen überhaupt nicht gut gelungen
  • Maßnahmen so unverständlich wie Masse an Informationen - es fällt schwerer da noch durchzusteigen
  • Und da resignieren vielleicht auch viele
  • Drittes Problem: Reden wir eigentlich über das Gleiche?
  • Das war schon immer so, dass nicht; aber in der Pandemie hängen davon Empfehlungen und eigenverwantwortliches Handeln ab
  • Beispiel ist hier das Wort "mild"
  • WHO bezeichnet einen Verlauf, der einen Menschen ins Krankenhaus bringt, wo ihm Sauerstoff verabreicht wird, als mild (Ergänzung: Hier als "moderate")
  • Gleichzeitig beruhigen alle: Omikron erzeugt nur milde Verläufe
  • Umgangssprachlich heißt milder Verlauf: ich lag wie mit ner Erkältung flach
  • Die Frage ist: Was passiert da in unseren köpfen, kommt wirklich das richtige an?
  • Wie können wir es schaffen, dass wissenschaftliche Erkenntnisse so kommuniziert werden, dass auch bei der Bevölkerung die richtigen Rückschlüsse getroffen werden können?
  • Wir müssen inzwischen in dieser Pandemie aus den ganzen Informationen Rückschlüsse für uns ziehen, um unser Handeln daran anzupassen
  • Deswegen für Janine Thema in 2021: Wissenschaft, Wissenschaftskommunikation und Gesellschaft
  • Und das Thema ist ja auch nicht neu, die Covid-19-Pandemie hat das nur nochmal zugespitzt
  • Das Problem gibt es schon längst, wenn wir auf die Klimakatastrophe sehen
  • Als Podcasterinnen ist das thema Wissens- oder Wissenschaftskommunikation eh wichtig für uns...
  • 2021 hat nur einfach sehr drastisch gezeigt, wo Menschen genau hinsehen müssen bei diesen Dingen

Welche Data Science Themen gab es 2021? (00:35:33)

  • In der Programmiersprache R wurde in der Version 4.1 veröffentlicht
  • Eine besondere Neureung, auf die Nutzer*innen schon lange gewartet haben: Es gibt jetzt die Pipe
  • Vorher konnte das nur über Zusatzpakete benutzt werden
  • Was ist eine Pipe? Pipe steht für Rohr, siehe z.B. Pipelines
  • Data Science: Pipelines = wenn man irgendwo Daten reinkippt und dann fallen unten Ergebnisse raus
  • Die Pipe in R ermöglicht den Code schön kompakt zu schreiben und sehr gut verständlich
  • Das macht einige Dinge einfacher und viel mehr andere Pakete können sich darauf verlassen
  • Bis Helena das produktiv einsetzt, dauert es noch, weil das jetzt erstmal alle aktualisieren müssen
  • Das kann ein paar Jahre dauern, bis alle Menschen das aktualisiert haben
  • Es ist aber gut, dass es das Feature jetzt gibt
  • Dann gab es 2021 auch noch die Lost Tapes of the 27 Club
  • Der 27 Club ist eine Gruppe von Musiker*innen, die im Alter von 27 gestorben sind
  • Einer der Vertreter ist Kurt Cobain von Niravana
  • Lost tapes of the 27 Club: keine entdeckten Aufnahmen, sondern von sogenannter KI erzeugte Lieder
  • Der KI wurde Musik dieser Künstler*innen gegeben, daraus entstanden dann neue Lieder
  • Zum Beispiel: Nirvana - Drowned in the Sun (Music Video HD) - Lost Tapes of the 27 Club
  • Es klingt tatsächlich beeindruckend nah dran, wie haben die das gemacht?
  • Verwendete Software war Magenta von Google: https://magenta.tensorflow.org/
  • Basiert auf tensorflow dem neuronalen Netz Framework von Google
  • Magenta ist dafür da, um Noten zu erzeugen
  • Man füttert es dann mit allen Noten und dann erzeugt die KI Noten, die ähnliche Harmonien verwenden
  • Ähnlich wurde dann mit dem Text fortgefahren, um die Songtexte zu generieren
  • Aus den Noten wurde dann der Sound kreiert und der Text wurde von Sänger*innen mit ähnlichen Stimmen (Coverbands) eingesungen
  • Damit ist es natürlich möglich Musik in einem bestimmten Stil zu machen und damit kreativ zu arbeiten
  • Organisiert wurde das ganze von dem Projekt 'over the bridge'
  • Sie wollen damit auf die psychische Gesundheit von Musiker*innen aufmerksam machen
  • Deswegen auch der 27 Club, weil die nicht an natürlichen Umständen gestorben sind
  • Over the Bridge bieten auch Programme zu Suchtproblemen und Depressionen etc. an

Was erwartet uns wohl in diesem Jahr? (00:43:59)

  • Gesellschaftlich: mehr Pandemie, mehr Klimawandel; vor allem den Umgang damit zu lernen, damit wir noch eine vernünftige Zukunft haben und auch die Generationen nach uns
  • Wissenschaftlich: Witziger ist vermutlich Wissenschaft Richtung Raumfahrt, hier sind wir gespannt darauf, was das neue Weltraumteleskop an Daten und Bildern liefern wird
  • Podcasttechnisch: mehr neue Folgen, 4-Wochen-Rhythmus, Themen liegen auch schon rum
  • Und: Wir nehmen aktuell an einem Datathon an der Stanfort University teil: Women in Data Science
  • Es geht um Klimadaten: Mittels Maschinellem Lernen Energieeffizienz von Häusern vorhersagen
  • Eventuell gibt das sogar eine Folge dann später im Jahr
  • Letztes Jahr haben wir zum Sammeln von Luftdaten aufgerufen
  • Das haben wir gemacht und auch ein paar andere Menschen, ihr könnt auch immer noch einsteigen
  • Dazu wird es auch eine Folge geben und wir haben schon ein paar schöne Events in den Daten

Fazit (00:47:11)

  • Wie war das Jahr 2021 für Dich?
  • Helena: 2021 ging nicht sehr gut los, ist aber ab der zweiten Hälfte wieder in Schwung gekommen
  • Da gab es wieder mehr spannende Dinge, es war aber vor allem ein sehr anstrengendes Jahr
  • Es fehlt der Ausgleich, zum Beispiel Tanzen gehen, 2021 fehlte das noch mehr als 2020
  • Janine: Wirkte alles recht verschliert, aber beim Scrollen durch Bildergalerie festgestellt, dass es im Rahmen der Möglichkeiten (vor allem draußen) viele schöne Momente mit anderen Menschen gab
  • Ist sich der eigenen recht priveligierten Situation in dieser Pandemie bewusst
  • Fazit: Öfter mal durch die Bilder scrollen, um den dominanten Pandemie-Alltag zu relativieren
  • Vermutung: Hamsterrad des Alltags wird durch Pandemie verstärkt -> pandemisches Hamsterrad

Nächste Folge: Daten aus dem Internet am 26.02.2022 (00:50:17)

  • 2021 gab es in Braunschweig einen Weihnachtsmarkt mit Infektionsschutzkonzept
  • Gastronomieflächen wurden eingezäunt und eine maximale Personenzahl festgelegt, die aktuellen Besuchsdaten wurden im Internet live veröffentlicht
  • Daten im Internet! Die können gespeichert werden, um sie für eigene Analysen zu benutzen
  • Das ist Thema der nächsten Folge: Wie Daten auslesen, speichern, analysieren

Call to Action (00:51:43)

  • Wenn ihr uns weiter hören möchtet, folgt uns auf Twitter unter @datenleben
  • Oder besucht unsere Webseite: www.datenleben.de
  • Hinterlasst uns gerne Feedback, wir würden uns darüber sehr freuen
  • Ihr könnt uns als Data Scientists auch Buchen für Analysen oder Projekte
  • Habt ihr Fragen oder Themen, die euch interessieren? Dann schreibt uns!

Outro (00:52:28)

Schlagworte zur Folge

Jahresrückblick, 2021, datenleben, Downloadzahlen, Pandemie, Coronapandemie, Bundestagswahl 2021, Wissenschaftskommunikation, Programmiersprache R, 27 Club, Datathon

Quellen


Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht.