Bitte auf den Obermenüpunkt klicken!

Datenanalyse und -auswertung

Was wird unter einer Datenanalyse bzw. -Auswertung verstanden?

Das Ziel der Datenanalyse bzw. Datenauswertung besteht darin, wichtige Informationen aus den Rohdaten der Prozesse zu gewinnen. Hierfür werden verschiedene Methoden (z. B. statistische Verfahren) angewendet. Die gewonnenen Erkenntnisse werden in der Regel durch Metriken und Visualisierungen veranschaulicht. Dabei können die folgenden Fragestellungen verfolgt werden:

  • „Was ist passiert?“ (deskriptive Analyse),
  • „Warum ist es passiert?“ (diagnostische Analyse),
  • „Was könnte passieren?“ (prädiktive Analyse),
  • „Wie soll gehandelt werden?“ (präskriptiven Analyse).

Datenbereinigung

Vor der eigentlichen Auswertung ist es wichtig, die Daten zu verstehen und sicherzustellen, dass sie korrekt und vollständig sind. Methoden zur Ausreißer- oder Anomaliedetektion können verwendet werden, um mögliche Fehler in den Daten zu identifizieren, die sonst Ergebnisse und Schlussfolgerungen verfälschen können.

Methoden (Auswahl):

  • Deskriptive Statistik: Die deskriptive Statistik verwendet Kennzahlen wie Mittelwert, Median, Modus und Standardabweichung, um die Daten zu beschreiben und die Streuung der Daten zu ermitteln.
  • Explorative Datenanalyse (EDA): Die EDA umfasst die Anwendung statistischer Methoden, um Muster, Trends und 
  • Zusammenhänge in den Daten zu identifizieren. 
  • Künstliche Intelligenz (KI): KI ist ein Teilgebiet der Informatik, der darauf abzielt, Maschinen angemessen und vorausschauend und lernfähig in ihrer Umgebung agieren zu lassen.
  • Maschinelles Lernen (ML): ML ist ein Teilbereich der Künstlichen Intelligenz, der Algorithmen benutzt, mit denen Computer aus (veränderlichen) Daten lernen können, ohne explizit programmiert zu werden. Im Ergebnis entstehen Modelle welche Klassifikationen durchführen, Vorhersagen treffen oder in einer künstlichen Umgebung interaktiv agieren und Entscheidungen treffen können. 

Für die Datenauswertung stehen je nach Komplexität verschiedene Werkzeuge zur Verfügung. Diese reichen von Excel, über Skriptsprachen wie R und Python für die Analyse größerer Datenmengen bis hin zu Datenbankanwendungen, die zur Auswertung von Big Data eingesetzt werden können.