Dieser Beitrag hat eine Top-10 Platzierung in unserem Essaywettbewerb 2021 erzielt. Die Jury bewertete anhand einer Vielzahl an Kriterien wie Relevanz, Fachlichkeit, Horizont und Kreativität, in denen dieser Essay besonders überzeugt hat.
1923 regierte das Öl über ganze Nationen – 2030 werden Daten diesen Platz einnehmen, denn wer die Daten kontrolliert und versteht, kann ganze Nationen bewegen! Doch das Problem mit dem Kontrollieren und Verstehen der Daten wächst stetig, da die von uns erzeugte Datenmenge exponentiell wächst, während es das Verständnis für Daten nur langsam tut. Es benötigt Expert/-innen, die hinter die Matrix schauen und Leuten Einblicke gewähren, die ihnen sonst verwehrt blieben. Denn bereits heute ist es so, dass wir, dass jede Person auf der ganzen Welt, sekündlich ca. 1,7 Megabyte an Daten generiert, was bedeutet, dass die Gesamtmenge, die wir beispielsweise bis 2025 erzeugt haben werden, auf 175 Zetabyte angewachsen sein wird. Dies entspricht in etwa dem zehnfachen der Datenmenge, welche wir noch vor zehn Jahren hatten und bedeutet auch, dass wenn wir unsere Daten alle speichern wollen würden, es beispielsweise ca. 5,75 Billionen Ipads bräuchte, um dies zu ermöglichen. Bildlich dargestellt bedeutet das, dass man mit diesen Ipads eine 310 Meter hohe Mauer entlang des Äquators bauen könnte, welche durch ihre Länge von 39.100 km bereit wäre ca. 97 % unserer Erdkugel voneinander zu trennen. Diese unvorstellbare Zahl wird noch unbegreiflicher durch den schockierenden Fakt, wie viele dieser Daten von uns ungenutzt sind. Denn von dieser Gesamtmenge an Daten, welche uns zur Verfügung stehen, liegen ca. 80 – 90 % in unstrukturierter Form vor, wovon lediglich 0,5 % analysiert und verarbeitet werden. Dies bedeutet im Umkehrschluss, dass wir maximal 20,5 % unserer Gesamtdaten strukturieren und nutzbar machen. Von diesem kleinen Teil der Daten, den wir letztendlich tatsächlich nutzen, ist wiederum ein großer Teil unsauber oder fehlerhaft, was dazu führt, dass wir mit unsauberen, inkonsistenten oder fehlerhaften Daten arbeiten, unsere Prognosen auf solchen Daten manifestieren und Algorithmen mit ihnen anlernen. Dies führt nicht nur zu Problemen bei der Verwendbarkeit der Daten und zu einem abnormen Wissensverlust, sondern verursacht für Unternehmen auch immense Kosten, welche laut Schätzungen der International Business Machines Corporation alleine in den USA 2002 „noch“ bei $600 Milliarden und 2016 bereits bei $3.1 Billionen jährlich lag. Führt man diesen Trend fort, so werden Unternehmen 2030 einen Verlust von ca. $6.2 Billionen jährlich erleiden, sofern nichts gegen diese Inkonsistenz der Daten und den daraus resultierenden Fehlverarbeitungen unternommen wird. Doch genau hieraus resultiert die Frage, ob es bis 2030 denn überhaupt möglich sein wird, diesen Rückstand aufzuholen und nach und nach immer mehr Daten zu nutzen, um diese auszuwerten und für Prognosen verwendbar zu machen.
Um diese Frage beantworten zu können, ist es im Vorfeld wichtig zu wissen, wer diese Daten erzeugt und was für Daten das überhaupt sind, um einschätzen zu können, ob wir nicht gerade einen unnutzbaren Haufen an Datenmüll produzieren, oder ob die Daten, welche sekündlich erzeugt werden, wirklich pures Gold sind.
Momentan sieht es hierbei noch so aus, dass ca. 55 % unserer Daten von Privatpersonen erzeugt werden, wovon lediglich Unternehmen profitieren, welche mit unseren Daten Geld machen. Unternehmen, die in der Lage sind, diese Daten zu strukturieren, um unser Verhalten zu analysieren und somit unseren Konsumdrang in die von ihnen gewünschte Richtung lenken zu können. Die aufgrund von maßgeschneiderter Werbung durch Analysen unseres Surfverhaltens das Gefühl in uns erzeugen, dass wir doch noch das neue Paar Schuhe brauchen. Die uns aktuelle Trends präsentieren, welche schon Jahre im Voraus entwickelt wurden, um den kommenden Bedarf zu decken und die aufgrund von Websitetracking und unseren Vorlieben in den Sozialen Medien ein digitales Profil von uns erstellen, welches unser Verhalten so gut abbildet, dass wir Dinge kaufen, Dinge die wir eigentlich nicht brauchen, nur, weil uns Kapazitätslimitierungen suggeriert werden, die uns dazu bringen 200 % mehr für das neue Paar Schuhe zu zahlen.
Lässt sich hieraus also schlussfolgern, dass Daten uns doch nicht aus der Matrix führen, sondern eher noch tiefer herein, da uns der Ausweg verwehrt bleibt und nur einige wenige das Angebot bekommen überhaupt die rote Pille zu schlucken? Die Wahrheit wird in 2030 wahrscheinlich irgendwo dazwischen liegen, denn die Unternehmen, welche unsere Daten jetzt analysieren und dafür benutzen digitale Profile von uns zu erstellen, werden dies mit hoher Wahrscheinlichkeit auch 2030 noch tun, nur mit einem noch höheren Erfolg. Einem höheren Erfolg, der dazu führt uns in eine hyperrealistischen Bubble zu schließen und uns so noch gezielter Angebote zu unterbreiten. Jedoch wird sich der Anteil der Daten, welcher von privaten Personen erzeugt wird, relativ gesehen reduzieren und zukünftig nur noch ca. 20 % einnehmen. Dies bedeutet im Umkehrschluss, dass ca. 80 % von Unternehmen, Instituten sowie Forschungs- und Bildungseinrichtungen erzeugt werden, die bereits bei der Erzeugung darauf achten können, die Daten in eine strukturierte Form zu bringen, sollte ihnen der Mehrwert der Datenverarbeitung bewusst sein. Durch die momentane Verteilung der erzeugten Datenmengen ist es für einen Großteil der Bevölkerung bisher nicht relevant, in welcher Form die Daten vorliegen, da Privatpersonen eher weniger versuchen Daten zu verarbeiten, um Algorithmen zu entwickeln oder Vorhersagen zu treffen.
Doch durch diese Umverteilung der Datenerzeugung ergeben sich große Chancen in Hinblick auf die Datenverarbeitung, denn 2030 wird es Unternehmen sehr wohl bewusst sein, welche Möglichkeiten ihnen entgehen, wenn sie ihre Daten so achtlos wie jetzt behandeln und dieses ungenutzte Potential weiterhin nicht ausschöpfen. Und dieses Potential ist kein Privileg der großen Hightech Konzerne, welche mit nahezu unbegrenzten Mitteln diese Daten abgreifen könnten, sondern liegt in der Verantwortung aller, da sich bereits jetzt Anbieter/-innen an den Markt drängen, die es auch kleinen und mittelgroßen Unternehmen ermöglichen, auch mit wenigen Programmierkenntnissen ihre Daten effektiv zu nutzen. So können bspw. durch low-code Anwendungen Algorithmen entworfen werden, welche Anomalien erkennen, Vorhersagen treffen oder Daten in optisch ansprechenden und interaktiven Grafiken darstellen, um die geschäftlichen Zahlen in Verständlicher und einfacher Form darzustellen. Um daraufhin, aus den aufbereiteten Daten schnell Schlussfolgerungen zu ziehen und zukünftige Entscheidungen datenbasiert treffen zu können.
Doch nicht nur der wirtschaftliche Erfolg von Unternehmen wird 2030 maßgeblich von Daten abhängen, weshalb Unternehmen bis dahin dieses Potential erkannt haben werden und alles daran setzen werden Expert/innen zu engagieren, die diese Daten extrahieren, interpretieren und verständlich darstellen. Auch viele Bereiche, bei denen es bisher oftmals noch viele Prozessschritte oder menschliche Arbeit benötigt, werden zu einem großen Teil von Daten bestimmt sein.
Ein sehr großer Bereich, welcher hiervon beispielsweise betroffen sein wird, ist der Gesundheitssektor, welcher momentan noch von den Ärzt/-innen dominiert wird, die aufgrund subjektiver Entscheidungen und natürlicher menschlicher Fehler teilweise Fehldiagnosen geben, die durch eine bessere Informationsbasis verhindert hätten werden können. Zukünftig können, durch eine starke Entwicklung von Künstlichen Intelligenzen, aufgrund von Datenbasen, welche in großen Mengen vorliegen und eine einwandfreie Datenqualität aufweisen, Krankheiten frühzeitig und mit einer sehr hohen Genauigkeit entdeckt werden, was zur Folge hat, dass eine objektiv richtige Behandlung frühzeitig eingeleitet werden kann und subjektive Fehldiagosen verhindert werden können. Momentan ist die „False-Positive“ und die „False-Negative“ Rate, also eine Fehleinschätzung der Künstlichen Intelligenz in einigen Fällen wegen zu wenigen oder unsauberen Daten noch zu groß, weshalb der Einsatz dieser noch nicht weitläufig genug anerkannt ist. Doch dieses Problem wird sich bis 2030 drastisch reduzieren, sodass Künstliche Intelligenzen in Zukunft besser als entsprechende Ärzt/-innen
bspw. Blut- oder Hautkrebs diagnostizieren können, oder aufgrund einer sehr großen Datenbasis durch Parameterbenennungen individuelle Therapie- und Behandlungsmethoden für die Patient/-innen aufzeigen, welche durch die Ärzt/-innen entsprechend durchgeführt werden können.
Bei der Gesamtthematik werden jedoch Künstliche Intelligenzen nie die Menschen ersetzen, sondern diese lediglich unterstützen und ihnen Möglichkeiten aufzeigen, welche vorher nur sehr zeitintensiv möglich gewesen wären. So können sich Ärzt/-innen durch Künstliche Intelligenzen bei ihren Aufgaben unterstützen lassen, um wieder mehr Zeit für die Patient/-innen zu haben, um passende Parameter abzufragen, welche durch die Unterstützung der Künstlichen Intelligenzen in einer passenden Behandlung münden, welche von den entsprechenden Fachärzt/-innen durchgeführt werden. Doch nicht nur Ärzt/-innen können hiervon profitieren, auch das Pflegepersonal kann stark entlastet werden, z. B. durch Medikamentenprognosen von entsprechenden Algorithmen.
Somit wird 2030 nicht nur der wirtschaftliche Erfolg von künstlichen Intelligenzen maßgeblich beeinflusst, sondern auch das Leben jeder einzelnen Person, sowohl im positiven Sinne, z. B. durch individuellere und persönlichere medizinische Behandlungen, als auch im negativen Sinne, durch das Preisgeben all unserer Daten, um einen „digitalen Avatar“ von uns zu erschaffen, der Unternehmen die Möglichkeit gibt, uns Güter anzubieten, die unsere innersten Bedürfnisse befriedigen.
Aus diesem Grund braucht es zukünftig mehr Expert/-innen, zumeist Data Scientists, Data Engineers oder Data Analysts genannt, welche ihre ethische Verantwortung in Bezug auf die Datenverarbeitung nicht vernachlässigen und sich stets von ihrem moralischen Kompass leiten lassen, wenn es um die Verwendung von Daten geht. Denn genau diese Leute haben das Potential, durch verabreichen der roten Pille, Personen und Unternehmen Einblicke in eine Welt zu gewähren, welche ihnen bisher weitestgehend verwehrt blieb.

Timothy Ken Dombrowski ist Masterstudent im Bereich Data Engineering und arbeitet Teilzeit als Projektmanager im „Bereich Datenbanken“. Seit längerer Zeit beschäftigt er sich mit dem Thema Data Science und wie Daten uns bisher und in Zukunft beeinflussen. Falls dich das Thema ebenso interessiert, oder du dich einfach gerne austauschen möchtest, freut er sich über einen Austausch.