Data Scientist: Was macht der professionelle Datenauswerter?
Der Data Scientist zählt laut einer LinkedIn Studie zu den Top 15 Jobs für 2020. Mit Platz 8 belegt der professionelle Datenauswerter einen guten vorderen Platz. Hier erfahren Sie mehr über das Berufsbild und warum sich junge Studienabsolventen immer häufiger für einen Job im Bereich Business Intelligence entscheiden.
Daten sind Gold wert. Aber nur, wenn man sie richtig auswertet. Hier kommt der Data Scientist ins Spiel. Er muss nicht nur Ahnung von Statistik haben, sondern auch von der Materie, die er untersucht. Sonst kann es schnell zu Scheinkorrelationen kommen.
Wenn Händler gegen Saisonende ihre Waren loswerden möchten, fangen sie an, sie zu reduzieren. „Im Fachjargon spricht man von Abschriften“, erklärt David Krings, Data Scientist und Mitgründer der KI-Plattform Aifora GmbH. Dabei gelten bestimmte Regeln: Ein einmal abgeschriebener Artikel wird nie wieder im Preis erhöht, sondern wenn dann nur weiter reduziert. Aus diesem Grund ist es sehr wichtig, den passenden Zeitpunkt und die richtige Höhe der Reduktion zu wählen. „Wenn ich an einem zu frühen Zeitpunkt zu stark reduziere, habe ich das Produkt möglicherweise schon vor Saisonende und nicht zum bestmöglichen Preis verkauft. Wenn ich aber zu spät und zu schwach reduziere, werde ich die Ware vielleicht nicht mehr los“, so Krings.
Was macht ein Data Scientist?
Die Aufgabe des Data Scientist ist es nun, Modelle zu entwickeln, die den perfekten Zeitpunkt und die richtige Höhe der Reduzierung berechnen. „Um eine gewisse Regelmäßigkeit erkennen zu können, sollte dafür mindestens auf Daten der vergangenen drei Jahre zurückgegriffen werden“, erklärt Krings. Die historischen Daten müssen jedoch zuvor bereinigt und in das entsprechende Format überführt werden. Im Speziellen bedeutet das, dass Daten zueinander gemappt und von fehlerhaften und inkonsistenten Daten bereinigt werden müssen.
Auf Basis dieser Informationen entwickelt der Data Scientist ein mathematisches Modell, das die relevanten Einflussfaktoren für Kaufverhalten beinhaltet und gewichtet. Diese Modelle können verwendet werden, um auf Vergangenheitsdaten Simulationen durchzuführen, die das Potenzial einer intelligenten und automatisierten Abschriftensteuerung zeigen. „Wichtig ist, dass die Modelle über Tests und Trainings validiert werden, damit das Ergebnis aussagekräftig ist und der Realität entspricht“, erläutert Data Scientist Krings.
Programmierkenntnisse sind für den Data Scientist ist ein Muss
Ein Data Scientist sollte über solide Kenntnisse in Statistik und Stochastik sowie über Programmierkenntnisse verfügen. Wichtige Programmiersprachen sind in diesem Zusammenhang
- „R“
- Python
- Matlab
- Julia
- Scala
Die ersten beiden sind grundlegend, die anderen können je nach Branche dazukommen. Krings hat einen Bachelor in „Scientific Programming“ und einen Masterabschluss in „Technomathematik“ gemacht (mittlerweile heißt der Studiengang „Angewandte Mathematik“). Nebenbei hat Krings als studentische Hilfskraft am Supercomputing Centre Jülich gejobbt. Dort hat er sich mit der Programmierung auf Hochleistungsrechnern befasst. Dabei handelt es sich um Computer, die in der Lage sind, extrem große Datenmengen zu verarbeiten.
Der Job war eine gute Vorbereitung für seine spätere Tätigkeit. Denn auch ein Data Scientist muss in der Lage sein, mit sehr großen Datenmengen umzugehen.
Data Analyst: Mit Ingenieurswissen Scheinkorrelation verhindern
„Mittlerweile gibt es Anwendungen, die Algorithmen vorschlagen, sodass nicht mehr alles händisch programmiert werden muss. Nichtsdestotrotz muss ein Data Scientist natürlich verstehen, wie diese Modelle und die zugrunde liegenden Algorithmen funktionieren“, sagt Tom Becker, Geschäftsführer des auf Produkte im Bereich Data Science und Analytics spezialisierten Unternehmens Alteryx. An dieser Stelle überschneidet sich das Berufsbild des Data Scientist mit dem des Data Analyst. Letzterer sieht sich ebenso Daten an und durchforstet Datenmengen nach Trends und Zusammenhängen. Aber nur letzterer programmiert und modelliert die Daten zu einer Aussage.
Für Becker sind Ingenieure die idealen Kandidaten für den Beruf des Data Scientist. „Ingenieure können gut mit Zahlen umgehen. Gleichzeitig verfügen sie über ein breites Fachwissen zum Beispiel im Automobilbau“. Dadurch könnten sie beurteilen, welche Daten für die Analyse notwendig sind und welche Sensoren verbaut werden müssen, um diese Daten zu sammeln. Darüber hinaus versetzt sie ihr Fachwissen in die Lage, Sinn von Unsinn zu unterscheiden.
Denn es kann immer wieder vorkommen, dass Sachverhalte, die nichts miteinander zu tun haben, sich zufällig parallel zueinander entwickeln und daher in einen falschen Zusammenhang gebracht werden. Das bekannteste Beispiel für eine solche Scheinkorrelation ist der Zusammenhang zwischen Storchpopulation und Geburtenrate. Tatsächlich ist die Geburtenrate auf dem Land höher als in der Stadt. Ebenso gibt es in ländlichen Gebieten mehr Störche, was aber nicht zwangsläufig bedeutet, dass die Vögel die Babys bringen. Ein Data Scientist muss also in der Lage sein, die statistischen Modelle interpretieren zu können, bzw. sie so zu bauen, dass ein solcher Unsinn erst gar nicht herauskommt.
Wie wird man Data Scientist?
Zusammenfassend kann man sagen: Master und MOOCs machen den Data Meister. Es gibt allerdings zwei grundlegende Möglichkeiten, auf den Beruf Data Scientist hinzuarbeiten. Der klassische Weg führt über ein Hochschulstudium. Deutschlandweit gibt es über 25 spezialisierte Studiengänge und weitere Kombinationsangebote. Als grundständiges Studium mit dem Abschluss Bachelor of Science bieten folgende Hochschulen die Fachrichtung Data Science:
Fachrichtung | Hochschule | Zeitmodell |
Angewandte Data Science | Uni Göttingen | Teilzeit, Vollzeit |
Data Science | HS Aalen | Vollzeit |
Data Science | HS Otwestfalen-Lippe in Lemgo | dual, Vollzeit |
Data Science | Uni Marburg | Vollzeit |
Data Science | HAW XU Exponential in Potsdam | Vollzeit |
Data Science | AKAD Hochschule Stuttgart | berufsbegleitend, Fernstudium, Teilzeit |
Data Science | Uni Stuttgart | Vollzeit |
Data Science | Westsächsische Hochschule Zwickau | Teilzeit, Vollzeit |
Data Science and Artificial Intelligence | Universität des Saarlandes | Teilzeit, Vollzeit |
Data Science in der Medizin | TU Ulm | Vollzeit |
Digital Business & Data Science | HAW Europa in Berlin | Vollzeit |
Digital Business & Data Science | HAW Europa in Hamburg | Vollzeit |
Mathematical Data Science | Uni Göttingen | Teilzeit, Vollzeit |
Medical Engineerung and Data Science | TH Aschaffenburg | ollzeit |
Wirtschaftsinformatik – Data Science | Duale HS Baden-Württemberg | dual, Vollzeit |
Quelle: Hochschulkompass der Hochschulrektorenkonferenz
Daneben können sich Ingenieure auf mittels sogenannten Massive Open Online Courses bei Udacity, der Decar-Academy oder der Plattform Unit-Me weiterbilden. „Mittlerweile arbeiten viele deutsche Unternehmen, insbesondere im Automotive-Bereich, bereits mit solchen Plattformen“, erklärt Becker. Den Aufwand, um intern einen Experten mittels Schulungen auszubilden, beziffert er mit etwa 600 Stunden.
„Auf diesen Plattformen gibt es auch kostenlose Inhalte. Diese bieten eine gute Möglichkeit, um zu testen, ob das Berufsumfeld prinzipiell zu einem passen könnte“, rät Becker.
Doch nicht immer muss es ein geradliniger Weg sein. Wer sich zunächst für ein klassisches Ingenieurstudium entscheidet, kann dennoch den Datenpfad verfolgen. Wie das gelingt zeigt der beispielhafte Studien- und Karriereweg von Niels Röschmann.
Niels Röschmann, 26 Jahre alt, arbeitet heute als Ingenieur für Digitalisierung bei der EnBW Energie Baden-Württemberg AG in Hamburg. Sein Karriereweg dorthin verlief aber alles andere als geradlinig. Nach einem freiwilligen ökologischen Jahr begann er Meteorologie an der Universität Hamburg zu studieren. Doch dieser Studiengang konnte ihn gar nicht begeistern. Er wechselte an die Hochschule für Angewandte Wissenschaften Hamburg und absolvierte einen Bachelor im Bereich erneuerbare Energien. “In diesem Studiengang hatte ich nur ganz wenig Informatik, hauptsächlich ging es natürlich um Elektrotechnik und Energie”, so Röschmann.
Warum der 26-Jährige heute nicht als klassischer Elektroingenieur arbeitet, sondern mit Daten jongliert, ergab sich durch praktische Erfahrungen. Röschmann begann ein Praktikum bei seinem heutigen Arbeitgeber EnBW im Bereich Offshore Windenergie. Wie Elektroingenieure im Alltag agieren, konnte er also direkt beobachten. Schnell merkte er, dass die Arbeit im Datenmanagement ihn mehr reizt.
“Wie man das Thema Nachhaltigkeit mit Datenanalysen vorantreiben kann, fand ich besonders spannend”, erklärt der damalige Werkstudent.
Nun stellte sich die Frage: Wie entwickel ich mich in diese Berufssparte? Die Universitäten wirkten an dieser Stelle eher demotivierend. Bei den Bewerbungen um einen Master-Platz machte der junge Ingenieuranwärter die Erfahrung, dass ihm nicht genügend Fachwissen zugeschrieben wurde. “Also versuchte ich es an der FH Wedel und habe dort tatsächlich einen Platz im Master Studiengang IT Engineering bekommen”, berichtet Röschmann.
Auf die Frage hin, warum er das Berufsbild Data Scientist spannender findet, als ein Job als Elektroingenieur, gibt er an, dass seiner Meinung nach die Technik bereits so ausgereift ist, dass nicht mehr allzu viele Herausforderungen auf einen warten.
“Die Auswertung von Daten aus den Offshore-Windparks liefert mir aber jeden Tag neue Aufgaben. Prozesse lassen sich digitalisieren oder ich analysiere, wie der Windpark noch effizienter laufen kann. Das begeistert mich.”
Wie viel verdient ein Data Scientist?
Das Einstiegsgehalt eines Data Scientist beträgt zwischen 44.000 Euro und 68.000 Euro brutto im Jahr. Damit verdient ein Junior Data Scientist im Schnitt ein Jahresgehalt von 56.000 Euro. Der Verdienst beträgt damit rund 4.666 Euro im Monat. Zu dem Ergebnis kommt sowohl Stepstone als auch Alphajump.
Berufserfahrene Data Scientists können ein deutlich höheres Jahresgehalt erzielen. Abhängig ist das vor allem von der Ausbildung, dem Standort, der Branche und den Inhalten. Kennt sich der Data Scientist nicht nur mit Big Data, sondern auch mit dem zu analysierenden Produkt aus, hat er gleich eine bessere Verhandlungsposition.
Weitere E-Learning-Kurse für Ingenieure
Jobs für Data Scientists gibt es in unserer Jobbörse
Ein Beitrag von: