Citizen Data Scientist: Was er macht und was er kann

Definition CDS: Was ist ein Citizen Data Scientist? 

Der Citizen Data Scientist (CDS), zu Deutsch etwa “bürgerlicher Data Scientist”, ist mit Status Quo noch eher eine Idee denn eine fixe Rolle in Unternehmen. Die Idee ist, dass das Ziel einer Data Driven Company sein muss, dass die Mehrheit der Angestellten im Bereich Analytics, Datenverwaltung und ähnliches mit fortgeschrittenen Analysemethoden wie Machine Learning umgehen können. 

Dies bedeutet, dass sie eine Lücke zwischen den Data Science Experten und dem “herkömmlichen” Data Analyst füllen. Der Citizen Data Scientist besitzt somit Expertise im Bereich künstlicher Intelligenz, aber muss generell nicht im Stande sein, KI (z.B. neuronale Netze) selbst zu programmieren. Eine der Ideen ist, dass der CDS vor allem auch durch den Einsatz von Tools, die mit KI ausgestattet sind oder diese abbilden, ihre Arbeit erledigen.

Der Begriff “Citizen Data Scientist” wurde dabei vom Marktforschungsinstitut Gartner geprägt und bezeichnet sogenannte “Power User” im Bereich Data Analytics, die eingesetzt werden, um die Lücke an verfügbaren Data Scientists zu schließen. Das interessante bei dieser Definition ist die nähe der Person zum Fachthema “Daten” einerseits, zur Business-Domäne andererseits. 

Was sind die Aufgaben eines Citizen Data Scientists

Da der Citizen Data Scientist die Lücke zwischen Domäne und Data Scientist füllt, gilt es genau diese beiden Wissensbereiche in ihrer täglichen Arbeit einzusetzen. So haben CDS sehr spezifische Anforderungen von ihren Businesskollegen – oder durch sich selbst definiert – welche im Fokus ihrer Datenanalysen stehen. Diese Datenanalysen nehmen ein Bandbreite an eingesetzten Methoden an: Von deskriptiven Analysen (z.B. Reports) über Advanced Analytics (z.B. Machine Learning) bis zur Visualisierung (z.B. Dashboards):

  • Verstehen von Business-Needs und Anforderungen aus der Domäne
  • Definition von passenden Daten, Anfordern der Extrakte oder ggf. direkte Anbindung der Datenquellen.
  • Datenanalyse, Feature Engineering, Exploration der Daten
  • Anwendung von Machine Learning Methoden, Ergebnisanalyse
  • Ausspielen der Ergebnisse zurück in die Domäne mittels Deployment oder Visualisierung

Neben diesen fachlichen Aufgaben werden einem Citizen Data Scientist sicherlich auch Aufgaben übertragen, die sich mit dem fachlichen Austausch und Wissenstransfer beschäftigen. Sei es nun das fördern einer Datenkultur, die Promotion von Use Cases oder Trainings – die Doppelrolle macht es möglich, sowohl die Domäne zu verstehen als auch Lösungen durch fachliche Exzellenz zu erarbeiten.

Weitere Beiträge zum Thema Data Driven Company direkt per E-Mail bekommen:

Citizen Data Scientists vs. Data Translators, Data Scientists, Data Ambassadors

Nun ist die Rolle des Citizen Data Scientists eine relativ neue Position in den meisten Unternehmen, falls sie überhaupt existiert. Doch was ist der Unterschied zu anderen Rollen im Bereich Data Science? Hier eine kurze Übersicht, um den CDS besser einordnen zu können:

  • Citizen Data Scientist vs. Data Translator: Ein Data Translator hat eine beratende Funktion inne, indem er die Möglichkeiten und Vorzüge von KI und ML anderen Einheiten im Unternehmen präsentiert und gleichzeitig die Anforderungen des Business strukturiert an die Facheinheiten übermittelt. Somit ist er auch ein Bindeglied, allerdings auf theoretischer und kommunikativer Ebene, während der CDS sehr praktisch arbeitet.
  • Citizen Data Scientist vs. Data Scientist: Der Data Scientist ist der Fachexperte, der sich auch mit den Details der Machine Learning Algorithmen auseinander setzt oder sie selbst implementiert. Der CDS hingegen ist der informierte, fähige Anwender von solchen Algorithmen.
  • Citizen Data Scientist vs. Data Ambassador: Der Data Ambassador ist der “First Level Support” für Datenthemen im Unternehmen. Von daher hat er auch grundlegende Kenntnisse in Datenanalyse und Machine Learning, wendet fortgeschrittene Algorithmen allerdings nicht selbst an. Der DA ist eher dafür verantwortlich, Anwendungsfälle in der Domäne zu identifizieren, zu bewerten und dann an die Fachexperten zu übermitteln.

Wie wird man Citizen Data Scientist

Gemäß Gartner wird Citizen Data Science von Personen ausgeübt, die bereits intensiven Kontakt mit Analytics haben, jedoch quasi in die nächste Ebene einsteigen. Folglich ist es eine logische Weiterentwicklung des Toolsets von Data Analysts um Methoden des Machine Learning und der künstlichen Intelligenz.

Daher macht es eigentlich nur Sinn, seine Entwicklung zum Citizen Data Scientists zu planen, so man sich bereits in einer Daten analysierenden Rolle befindet. Dann gilt es eben, sich entsprechende weiterführende Kenntnisse im Bereich Data Science, Machine Learning und künstliche Intelligenz anzueignen. Dies kann durch Fortbildungskurse, Online-Kurse oder einfach mittels Learning-by-doing geschehen. 

Hat man dieses Grundwissen akquiriert, gilt es das Wissen auch konkret anzuwenden. Die Identifikation von Use Cases, die Erarbeitung von Datenquellen, die deskriptive Analyse und das Trainieren von Machine Learning Modellen sind somit alle im Aufgabenbereich des zukünftigen Citizen Data Scientists. Ist man mit diesen Herangehensweisen dann praktisch vertraut, kann man auch im Unternehmen vorschlagen, offiziell die Rolle einzunehmen, um dieses fortgeschrittene Wissen auch nach außen zu transportieren.

Die Rolle von Citizen Data Science in der Data Driven Company

In vielen Unternehmen herrscht eine Knappheit an Data Scientists. Doch der Data Analyst – oder auch Business Analyst – ist schon länger etabliert. Von daher kann es in vielen Organisationen Sinn machen, diese Rolle eben mit gewissem rudimentären Handwerk zu erweitern, damit nicht nur die Spezialisten die Aufgaben erfüllen können, sondern optimalerweise durch eine Art Self-Service mit Wissensvermittelung befähigt werden, fortgeschrittene Analysen und Modellierung selbstständig durchzuführen.

Die Gefahr bei diesen Gedanken ist selbstverständlich, dass die Qualität der Modellierung und der Analysen nicht dem der Experten entspricht. Doch dies kann man versuchen zu steuern, indem man bestimmte Quality Gates, also Qualitätskontrollen einführt oder eine Art Experten-Mentor mit etabliert. 

Im Großen und Ganzen muss sich eine Data Driven Company proaktiv in die Richtung bewegen, nicht nur die Datenkultur im Gesamtunternehmen zu fördern, sondern eben auch die Expertise. Daher kann ein Citizen Data Scientist sicherlich einen Mehrwert generieren, indem er zumindest rudimentäre Aufgaben von den Experten übernimmt und somit die Strahlkraft von Data Science und Machine Learning noch weiter im Unternehmen verbreitet.

Weitere Beiträge zum Thema Data Driven Company direkt per E-Mail bekommen: