Data Analyst vs Data Scientist: Was ist der Unterschied?

Was ist der Unterschied zwischen einem Data Scientist und einem Data Analyst? Diese Frage wird aufgrund der teils überlappenden Aufgabengebiete im Zuge von Datenanalyse oft gestellt. Während es keine ganz klare Trennlinie gibt, gibt es dennoch einige Indikatoren, woran man den Datenanalysten vom Datenwissenschaftler unterscheiden kann.

Infografik Data Analyst vs. Data Scientist

Data Analyst vs Data Scientist: Was ist der Unterschied?
Data Analyst vs Data Scientist: Was ist der Unterschied?

Data Analyst vs. Data Scientist: Eine Liste an Unterschieden

KategorieData Analyst / DatenanalystData Scientist / Datenwissenschaftler
AnalysemethodenVor allem deskriptive Auswertungen und grundlegende StatistikStatistik, Machine Learning, Cognitive Computing
Genutzte InfrastrukturVor allem strukturierte Daten aus Data Warehouses und Ad-Hoc ExporteStrukturierte und unstrukturierte Daten aus Data Lakes, Data Warehouses und eigener Akquisition (z.B. Crawling)
AnalysetypenAd-Hoc Analysen aus dem Business, StrukturiertOptimierung von Prozessen, Erhöhung des Absatzes, innovative Geschäftsmodelle, Experimentell 
AnalyserichtungVor allem in die VergangenheitVergangenheit und Zukunft
SchemaSchema on writeSchema on read
DatengrößeKlein bis mittelBig Data
ToolsExcel, Tableau, PowerBI, SQL, Google AnalyticsPython, R, hadoop, Spark, AWS, Google Cloud, Azure
Data Analyst vs. Data Scientist: Die Unterschiede

Während Unterschiede zwischen Datenanalysten und Datenwissenschaftlern nicht eindeutig zu definieren sind, gibt es zahlreiche Ansatzpunkte zur Unterscheidung des Aufgaben- und Verantwortungsgebiets.  

Der Data Analyst ist vom Profil her ein von der Domäne beauftragter Auswerter von vorhandenen, strukturierten Daten. Dies konzentriert sich vor allem auf Ad-Hoc Analysen aus vorbereiteten Datensätzen oder einem Data Warehouse. Eine sehr häufige Aufgabe ist die Extraktion, deskriptive Analyse und Visualisierung von KPIs. Die enge Zusammenarbeit mit den Business Stakeholdern definiert auch die Position innerhalb der Datenanlyseprozesse. Daher sind Datenanalysen auch oft als Business Analysts innerhalb einer Business Unit verortet, statt in einer zentralen Data Science Einheit. 

Neben diesem Fokus auf inhaltliche Nähe zur Domäne gibt es auch ein klares technisches Profil des Data Analysts. Alle Tools, die mit strukturierten Daten, Data Warehouses, deskriptiver Auswertung oder Visualisierung zu tun haben, gehören zum Repertoir der Datenanalysten. Als Beispiele seien hier das klassische Excel, Tableau, PowerBI, SQL oder Google Analytics genannt. All diese Anwendungen zentrieren sich um Daten von kleiner oder mittlerer Größe, was keine fortgeschrittenen Anforderungen an die Infrastruktur stellt.

Auf der Gegenseite steht der Data Scientist als Innovator mit Machine Learning-Keule. Im Gegensatz zum Data Analyst kommt die Domäne selten mit klar formulierten Anforderungen auf den Datenwissenschaftler zu, sondern eher mit Problemen oder Innovationsansätzen. Der Lösungsweg wird über ein breites Repertoire von statistischen Methoden erarbeitet, die sich auf sowohl strukturierte und auch unstrukturierte Daten stützen. Hierbei ist es nicht immer notwendig, dass diese Daten bereits im Unternehmen vorhanden und sauber strukturiert erfasst sind. Der Data Scientist holt sich die Daten, die er braucht, um seine Auswertungen möglichst optimal zu stützen.

Dieses Bild steht auch im Gegensatz zu den Datenanalysten. Data Scientists sind zwar noch oft verteilt angesiedelt, haben jedoch eine viel größere Notwendigkeit für fachlichen Austausch und somit auch eher die Tendenz zu Fachdiskussionen und -ansammlungen innerhalb eines Unternehmens. Dies überträgt sich auch auf die Bandbreite an Tools, mit denen die Wissenschaftler ihre Arbeit erledigen. Von Programmiersprachen über Data Mining Tools zu Cloud Services muss ein fähiger Data Scientist vieles können oder zumindest flexibel genug sein, sich schnell einzuarbeiten. 

Auch seine Anforderung an die Akquise-, Speicher- und Analyseinfrastruktur ist entsprechend höher. Neben unstrukturierten Daten wollen auch Daten mit hohem Volumen oder großer Geschwindigkeit – also Big Data – erfasst und analysiert werden. Dies sprengt meist klassische Data Warehousing-Systeme und fordert neue Herangehensweisen wie einen Data Lake.

Weitere Beiträge zum Thema Data Driven Company direkt per E-Mail bekommen:

Zusammenfassung

Zusammengefasst liegt der Unterschied zwischen dem Data Analyst und dem Data Scientist in der Varianz der Aufgaben. Der Datenanalyst beschäftigt sich vor allem mit statischen Prozessen, die direkte Einblicke in Daten gewährt und durch die Domänenexperten angefordert werden. Data Scientists auf der anderen Seite haben das Vergnügen, aber auch die Verantwortung in weniger strukturierten Aufgaben zu agieren. Vom Anwendungsfall über die Datengrundlage bis zu den Auswertungsmethoden: Data Science bewegt sich in unklaren Gefilden, was auch großes Potential verspricht.