2030 – Ein datenbasierter Blick in die Zukunft (Essay)

Dieser Beitrag hat eine Top-10 Platzierung in unserem Essaywettbewerb 2021 erzielt. Die Jury bewertete anhand einer Vielzahl an Kriterien wie Relevanz, Fachlichkeit, Horizont und Kreativität, in denen dieser Essay besonders überzeugt hat.

1923 regierte das Öl über ganze Nationen – 2030 werden Daten diesen Platz einnehmen, denn  wer die Daten kontrolliert und versteht, kann ganze Nationen bewegen! Doch das Problem mit dem  Kontrollieren und Verstehen der Daten wächst stetig, da die von uns erzeugte Datenmenge exponentiell wächst, während es das Verständnis für Daten nur langsam tut. Es benötigt Expert/-innen, die hinter die  Matrix schauen und Leuten Einblicke gewähren, die ihnen sonst verwehrt blieben. Denn bereits heute  ist es so, dass wir, dass jede Person auf der ganzen Welt, sekündlich ca. 1,7 Megabyte an Daten  generiert, was bedeutet, dass die Gesamtmenge, die wir beispielsweise bis 2025 erzeugt haben werden, auf 175 Zetabyte angewachsen sein wird. Dies entspricht in etwa dem zehnfachen der Datenmenge,  welche wir noch vor zehn Jahren hatten und bedeutet auch, dass wenn wir unsere Daten alle speichern  wollen würden, es beispielsweise ca. 5,75 Billionen Ipads bräuchte, um dies zu ermöglichen. Bildlich  dargestellt bedeutet das, dass man mit diesen Ipads eine 310 Meter hohe Mauer entlang des Äquators  bauen könnte, welche durch ihre Länge von 39.100 km bereit wäre ca. 97 % unserer Erdkugel  voneinander zu trennen. Diese unvorstellbare Zahl wird noch unbegreiflicher durch den schockierenden  Fakt, wie viele dieser Daten von uns ungenutzt sind. Denn von dieser Gesamtmenge an Daten, welche  uns zur Verfügung stehen, liegen ca. 80 – 90 % in unstrukturierter Form vor, wovon lediglich 0,5 %  analysiert und verarbeitet werden. Dies bedeutet im Umkehrschluss, dass wir maximal 20,5 % unserer  Gesamtdaten strukturieren und nutzbar machen. Von diesem kleinen Teil der Daten, den wir  letztendlich tatsächlich nutzen, ist wiederum ein großer Teil unsauber oder fehlerhaft, was dazu führt,  dass wir mit unsauberen, inkonsistenten oder fehlerhaften Daten arbeiten, unsere Prognosen auf solchen  Daten manifestieren und Algorithmen mit ihnen anlernen. Dies führt nicht nur zu Problemen bei der  Verwendbarkeit der Daten und zu einem abnormen Wissensverlust, sondern verursacht für  Unternehmen auch immense Kosten, welche laut Schätzungen der International Business Machines  Corporation alleine in den USA 2002 „noch“ bei $600 Milliarden und 2016 bereits bei $3.1 Billionen  jährlich lag. Führt man diesen Trend fort, so werden Unternehmen 2030 einen Verlust von ca. $6.2  Billionen jährlich erleiden, sofern nichts gegen diese Inkonsistenz der Daten und den daraus  resultierenden Fehlverarbeitungen unternommen wird. Doch genau hieraus resultiert die Frage, ob es  bis 2030 denn überhaupt möglich sein wird, diesen Rückstand aufzuholen und nach und nach immer  mehr Daten zu nutzen, um diese auszuwerten und für Prognosen verwendbar zu machen.  

Um diese Frage beantworten zu können, ist es im Vorfeld wichtig zu wissen, wer diese Daten  erzeugt und was für Daten das überhaupt sind, um einschätzen zu können, ob wir nicht gerade einen  unnutzbaren Haufen an Datenmüll produzieren, oder ob die Daten, welche sekündlich erzeugt werden,  wirklich pures Gold sind.  

Momentan sieht es hierbei noch so aus, dass ca. 55 % unserer Daten von Privatpersonen erzeugt  werden, wovon lediglich Unternehmen profitieren, welche mit unseren Daten Geld machen.  Unternehmen, die in der Lage sind, diese Daten zu strukturieren, um unser Verhalten zu analysieren und  somit unseren Konsumdrang in die von ihnen gewünschte Richtung lenken zu können. Die aufgrund  von maßgeschneiderter Werbung durch Analysen unseres Surfverhaltens das Gefühl in uns erzeugen,  dass wir doch noch das neue Paar Schuhe brauchen. Die uns aktuelle Trends präsentieren, welche schon  Jahre im Voraus entwickelt wurden, um den kommenden Bedarf zu decken und die aufgrund von  Websitetracking und unseren Vorlieben in den Sozialen Medien ein digitales Profil von uns erstellen,  welches unser Verhalten so gut abbildet, dass wir Dinge kaufen, Dinge die wir eigentlich nicht brauchen,  nur, weil uns Kapazitätslimitierungen suggeriert werden, die uns dazu bringen 200 % mehr für das neue  Paar Schuhe zu zahlen. 

Lässt sich hieraus also schlussfolgern, dass Daten uns doch nicht aus der Matrix führen, sondern  eher noch tiefer herein, da uns der Ausweg verwehrt bleibt und nur einige wenige das Angebot  bekommen überhaupt die rote Pille zu schlucken? Die Wahrheit wird in 2030 wahrscheinlich irgendwo  dazwischen liegen, denn die Unternehmen, welche unsere Daten jetzt analysieren und dafür benutzen  digitale Profile von uns zu erstellen, werden dies mit hoher Wahrscheinlichkeit auch 2030 noch tun, nur  mit einem noch höheren Erfolg. Einem höheren Erfolg, der dazu führt uns in eine hyperrealistischen Bubble zu schließen und uns so noch gezielter Angebote zu unterbreiten. Jedoch wird sich der Anteil  der Daten, welcher von privaten Personen erzeugt wird, relativ gesehen reduzieren und zukünftig nur noch ca. 20 % einnehmen. Dies bedeutet im Umkehrschluss, dass ca. 80 % von Unternehmen,  Instituten sowie Forschungs- und Bildungseinrichtungen erzeugt werden, die bereits bei der Erzeugung  darauf achten können, die Daten in eine strukturierte Form zu bringen, sollte ihnen der Mehrwert der  Datenverarbeitung bewusst sein. Durch die momentane Verteilung der erzeugten Datenmengen ist es  für einen Großteil der Bevölkerung bisher nicht relevant, in welcher Form die Daten vorliegen, da  Privatpersonen eher weniger versuchen Daten zu verarbeiten, um Algorithmen zu entwickeln oder  Vorhersagen zu treffen.  

Doch durch diese Umverteilung der Datenerzeugung ergeben sich große Chancen in Hinblick  auf die Datenverarbeitung, denn 2030 wird es Unternehmen sehr wohl bewusst sein, welche  Möglichkeiten ihnen entgehen, wenn sie ihre Daten so achtlos wie jetzt behandeln und dieses ungenutzte  Potential weiterhin nicht ausschöpfen. Und dieses Potential ist kein Privileg der großen Hightech  Konzerne, welche mit nahezu unbegrenzten Mitteln diese Daten abgreifen könnten, sondern liegt in der  Verantwortung aller, da sich bereits jetzt Anbieter/-innen an den Markt drängen, die es auch kleinen und  mittelgroßen Unternehmen ermöglichen, auch mit wenigen Programmierkenntnissen ihre Daten effektiv  zu nutzen. So können bspw. durch low-code Anwendungen Algorithmen entworfen werden, welche  Anomalien erkennen, Vorhersagen treffen oder Daten in optisch ansprechenden und interaktiven  Grafiken darstellen, um die geschäftlichen Zahlen in Verständlicher und einfacher Form darzustellen.  Um daraufhin, aus den aufbereiteten Daten schnell Schlussfolgerungen zu ziehen und zukünftige  Entscheidungen datenbasiert treffen zu können.  

Doch nicht nur der wirtschaftliche Erfolg von Unternehmen wird 2030 maßgeblich von Daten  abhängen, weshalb Unternehmen bis dahin dieses Potential erkannt haben werden und alles daran setzen werden Expert/innen zu engagieren, die diese Daten extrahieren, interpretieren und verständlich  darstellen. Auch viele Bereiche, bei denen es bisher oftmals noch viele Prozessschritte oder menschliche  Arbeit benötigt, werden zu einem großen Teil von Daten bestimmt sein. 

Ein sehr großer Bereich, welcher hiervon beispielsweise betroffen sein wird, ist der  Gesundheitssektor, welcher momentan noch von den Ärzt/-innen dominiert wird, die aufgrund  subjektiver Entscheidungen und natürlicher menschlicher Fehler teilweise Fehldiagnosen geben, die  durch eine bessere Informationsbasis verhindert hätten werden können. Zukünftig können, durch eine  starke Entwicklung von Künstlichen Intelligenzen, aufgrund von Datenbasen, welche in großen Mengen  vorliegen und eine einwandfreie Datenqualität aufweisen, Krankheiten frühzeitig und mit einer sehr  hohen Genauigkeit entdeckt werden, was zur Folge hat, dass eine objektiv richtige Behandlung frühzeitig eingeleitet werden kann und subjektive Fehldiagosen verhindert werden können. Momentan  ist die „False-Positive“ und die „False-Negative“ Rate, also eine Fehleinschätzung der Künstlichen Intelligenz in einigen Fällen wegen zu wenigen oder unsauberen Daten noch zu groß, weshalb der  Einsatz dieser noch nicht weitläufig genug anerkannt ist. Doch dieses Problem wird sich bis 2030  drastisch reduzieren, sodass Künstliche Intelligenzen in Zukunft besser als entsprechende Ärzt/-innen 

bspw. Blut- oder Hautkrebs diagnostizieren können, oder aufgrund einer sehr großen Datenbasis durch  Parameterbenennungen individuelle Therapie- und Behandlungsmethoden für die Patient/-innen aufzeigen, welche durch die Ärzt/-innen entsprechend durchgeführt werden können.  

Bei der Gesamtthematik werden jedoch Künstliche Intelligenzen nie die Menschen ersetzen,  sondern diese lediglich unterstützen und ihnen Möglichkeiten aufzeigen, welche vorher nur sehr zeitintensiv möglich gewesen wären. So können sich Ärzt/-innen durch Künstliche Intelligenzen bei  ihren Aufgaben unterstützen lassen, um wieder mehr Zeit für die Patient/-innen zu haben, um passende  Parameter abzufragen, welche durch die Unterstützung der Künstlichen Intelligenzen in einer passenden  Behandlung münden, welche von den entsprechenden Fachärzt/-innen durchgeführt werden. Doch nicht  nur Ärzt/-innen können hiervon profitieren, auch das Pflegepersonal kann stark entlastet werden, z. B.  durch Medikamentenprognosen von entsprechenden Algorithmen.  

Somit wird 2030 nicht nur der wirtschaftliche Erfolg von künstlichen Intelligenzen maßgeblich  beeinflusst, sondern auch das Leben jeder einzelnen Person, sowohl im positiven Sinne, z. B. durch  individuellere und persönlichere medizinische Behandlungen, als auch im negativen Sinne, durch das  Preisgeben all unserer Daten, um einen „digitalen Avatar“ von uns zu erschaffen, der Unternehmen die  Möglichkeit gibt, uns Güter anzubieten, die unsere innersten Bedürfnisse befriedigen.  

Aus diesem Grund braucht es zukünftig mehr Expert/-innen, zumeist Data Scientists, Data  Engineers oder Data Analysts genannt, welche ihre ethische Verantwortung in Bezug auf die  Datenverarbeitung nicht vernachlässigen und sich stets von ihrem moralischen Kompass leiten lassen,  wenn es um die Verwendung von Daten geht. Denn genau diese Leute haben das Potential, durch  verabreichen der roten Pille, Personen und Unternehmen Einblicke in eine Welt zu gewähren, welche  ihnen bisher weitestgehend verwehrt blieb. 

Timothy Ken Dombrowski ist Masterstudent im Bereich Data Engineering und arbeitet Teilzeit als Projektmanager im „Bereich Datenbanken“. Seit längerer Zeit beschäftigt er sich mit dem Thema Data Science und wie Daten uns bisher und in Zukunft beeinflussen. Falls dich das Thema ebenso interessiert, oder du dich einfach gerne austauschen möchtest, freut er sich über einen Austausch