Big Data

Was ist Smart Data? Definition und Erklärung des Begriffs

Als Smart Data, auf Deutsch “kluge Daten”, werden Datensätze bezeichnet, die für einen direkten und effizienten Einsatz aufbereitet wurden. Folglich sind Smart Data nicht Rohdaten, sondern Daten die bereits konsolidiert, auf Datenqualität geprüft und im Optimalfall mit aussagekräftigen Analysen verarbeitet wurden.  Smart Data als Konzept zeigt das Problem in der …

Read more

Was sind unstrukturierte Daten: Definition und Beispiele

Definition und Beispiele für unstrukturierte Daten Als unstrukturierte Daten bezeichnet man Daten, die nicht in einem klassischen tabellarischen Format vorliegen oder in einer Datenbank gespeichert sind. Beispiele sind Bilder, Sound-Files, Videos, aber auch Text-Daten wie Artikel.  Im Unterschied zu strukturierten Daten benötigen unstrukturierte Daten eine andere Verarbeitungsart als herkömmlich verbreitet. …

Read more

Was ist Advanced Analytics? Definition und Beispiele

Oft herrscht Unklarheit wie die Begriffe Advanced Analytics, Analytics, Business Intelligence, Data Science und Machine Learning definiert und differenziert werden können. Daher stellen wir Advanced Analytics in diesem Artikel anhand seiner Kategorien Diagnostic Analytics, Predictive Analytics und Prescriptive Analytics vor und zeigen Beispiele, wie Advanced Analytics eingesetzt werden kann, um …

Read more

Was sind Deep Fakes und wie funktionieren sie?

Deepfakes sind künstlich erzeugte Inhalte (z.B. Videos), die sich von realem Material kaum unterscheiden lassen. Ihre Erstellung basiert auf künstlicher Intelligenz, genauer neuronalen Netzen, und kann aus existierendem Material neue Versionen mit anderen Personen, Sprachen oder Inhalten erstellen. Die Gefahr von Deepfakes ist dabei nicht gering: Sowohl für Privatpersonen als …

Read more

Feature Engineering: Erklärung, Methoden und Beispiele

Als Feature Engineering bezeichnet man die Vorbereitung von Daten für die Verarbeitung in Machine Learning Algorithmen. Dabei ist Feature Engineering mitunter der wichtigste Teil im gesamten Machine Learning Prozess: Nur anhand hochqualitativer Features mit großem Informationsgehalt kann ein Modell mit hohem Erfolg trainiert werden. In diesem Artikel möchten wir Feature …

Read more

Was ist eine Data Pipeline? Erklärung und Beispiele

Die Methodik Daten von einem System in ein anderes zu überführen nennt man “Data Pipeline”. Data Pipelines bilden die Basis für datenbasiertes Arbeiten und rücken somit immer mehr ins Zentrum einer Data Driven Company, um Daten schnell und in hoher Qualität zur Verfügung zu stellen. Doch gibt es eine hohe …

Read more

„Data Mining“ einfach erklärt

Was ist Data Mining? Als Data Mining bezeichnet man die ungerichtete Untersuchung von vorliegenden Daten auf neue Muster, oft durch Methoden aus dem Bereich von Machine Learning. Das Ziel ist es, Erkenntnisse zu extrahieren, mit denen ein verbessertes Verständnis der Vorgänge eines Unternehmens oder einer Organisation möglich ist.  Als Methoden …

Read more