Vorwort

Vorwort

Im Jahr 2000 wurde der Datenwissenschaftler als der ” Sexiest Job of the 21st Century” bezeichnet (Harvard Business Review, 2012). Diese mutige Prognose beruht auf der Vorahnung eines Paradigmenwechsels in Wissenschaft und Forschung, der mehr und mehr auch zu sozio-ökonomischen Veränderungen führen würde.

Bereits im 17. Jahrhundert sind die experimentellen und theoretischen Wissenschaften entstanden, die heute als die beiden grundlegenden Forschungsparadigmen für das Verständnis der Natur gelten. In den letzten Jahrzehnten sind Computersimulationen zu einem dritten Paradigma geworden. Heute, an der Schwelle zur Big-Data-Ära hat sich ein viertes Paradigma herausgebildet, welches auf datenintensiven Methoden beruht. Viele Branchen machen sich das datengetrieben Paradigma bereits zu eigen und nutzen Daten, um Wert zu erschaffen. Daten gelten als eine Schlüsselressource für moderne Gesellschaften und erfüllen eine Reihe von Merkmalen, um eine technologische Revolution auszulösen. Dazu gehören unter anderem, dass die Kosten für die Nutzung von Daten niedrig sind, Daten eine unerschöpfliche Ressource darstellen, da sie beliebig oft und von beliebig vielen Akteuren genutzt werden können, und eine intelligente Nutzung von Daten die Effizienz von Prozessen und Verfahren erhöht. Viele große Technologieunternehmen haben den Wert von Daten bereits in den 1990er und 2000er Jahren erkannt, in denen auch der Begriff “Data ist the new oil ” geprägt wurde (Economist 2017).

Dabei sind statistische Methoden und der Einsatz von computer-gestützten Methoden essentiell für die Auswertung und Interpretation von Daten. Ziel dieses Moduls ist es die Grundlagen der deskriptiven und der schliessenden Statistik aber auch Programmierkenntnisse zu vermitteln, um diese zur Datenauswertung und Problemlösung einsetzen zu können. Die Verbindung eines mathematischen Fachwissens mit Programmierkenntnissen sowie eine problembezogene und lösungsorientierte Anwendung derselben wird oft als “Data Science” beschrieben.

In den letzten Jahrzehnten erfreute sich die Programmiersprache Python wachsender Beliebtheit. Python hat sich zunehmend als Standardsprache in der Data Science etabliert da sie einer einfachen gut leserlichen Syntax folgt aber auch strukturierte, objektorientierte, aspektorientierte und funktionale Programmierstile ermöglicht. Ein weitere Vorzug von Python ist der einfache Umgang mit umfangreichen Bibliotheken wie NumPy, pandas und matplotlib.

In diesem Sinne wünschen Ihnen die Autoren viel Erfolg uns Spaß mit dem Erlernen von statistischen Methoden und deren Anwendung mithilfe der Programmiersprache Python.

Berlin, August 2022
Dr. rer. nat. Joachim Krois