„Data Mining“ einfach erklärt

Was ist Data Mining? Als Data Mining bezeichnet man die ungerichtete Untersuchung von vorliegenden Daten auf neue Muster, oft durch Methoden aus dem Bereich von Machine Learning. Das Ziel ist es, Erkenntnisse zu extrahieren, mit denen ein verbessertes Verständnis der Vorgänge eines Unternehmens oder einer Organisation möglich ist. 

Als Methoden für Data Mining werden Herangehensweisen aus der Statistik, künstlichen Intelligenz, maschinellen Lernen und anderer Algorithmen der Big Data Analytics eingesetzt. Der standardisierte Prozess zur Extraktion von Wissen nennt sich cross-industry standard process for data mining (crisp dm) und folgt den Schritten Business Understanding, Data Understanding, Data Preparation, Modeling, Evaluation, Deployment.

Kurz gesagt geht der Prozess vom Anwendungsfall aus, um entsprechende Daten zu akquirieren und zu verstehen. Diese Daten werden dann mittels Säuberung und Feature Engineering vorbereitet und von einem Data Scientist in einem (Machine Learning) Modell verarbeitet. Die Ergebnisse werden dann evaluiert und bei positiven Resultaten im Unternehmen operationalisiert. Dieses Vorgehen entspricht sehr oft auch gerichteten Analysen aus dem Bereich Advanced Analytics.

Ausführliche Informationen zum Thema Data Mining findet ihr in unserem Artikel “Data Mining: Definition, Methoden und Tools”.