Die Datenauswertung wird in drei Kategorien eingeteilt: der auf deterministischen Ansätzen beruhenden Modellierung von Prozessen, der Anwendung von statistischen Verfahren zur Ermittlung von Trends bzw. Mustern aus großen Datenmengen sowie schließlich der (rein datengetriebenen) künstlichen Intelligenz.
Die Modellierung der realen Welt ist Gegenstand der elektronischen Datenverarbeitung seit ihren Anfängen in den 40er Jahren des 20. Jahrhunderts. Die Möglichkeiten der Miniaturisierung von Sensoren, der schnellen Datenübertragung, der Speicherung und Administration umfangreicher Datenmengen sowie der ultraschnellen Weiterverarbeitung gestatten es, die sich wandelnde Realität in sehr komplexen Modellen in Echtzeit abzubilden. Wo Kausalzusammenhänge nicht beschreibbar sind, lassen sie sich in vielen Fällen mit befriedigendem Ergebnis durch Wahrscheinlichkeitsaussagen ersetzen.
Beispiele:
Die schnelle maschinelle Auswertung umfangreicher Datenmengen aus unterschiedlichsten Quellen gestattet es, Muster zu erkennen, die durch menschliche Sinne nicht zu erfassen sind. Zueinander passende Auffälligkeiten werden als Korrelationen bezeichnet. Wesentlich ist, dass die Korrelation nicht mit der ursächlichen Kausalität verwechselt werden darf: Besteht ein kausaler Ursache-Wirkungs-Zusammenhang, dann äußert der sich auch in entsprechenden Korrelationen. Das ist umgekehrt nicht zwangsläufig so.
Beispiel:
Für die Korrelationsanalyse stehen inzwischen Datenverarbeitungsprogramme zur Verfügung, die mit mehr oder weniger spezialisiertem Vorwissen genutzt werden können (z.B. SIREN, Python/R/Matlab).
Der Begriff „Künstliche Intelligenz (KI)“ wurde Mitte des letzten Jahrhunderts erstmals für die Idee verwendet, mit Hilfe von Computersystemen Vorgänge des menschlichen Denkens und Entscheidungsprozesse zu automatisieren und zu mechanisieren. In den 70er Jahren des letzten Jahrhunderts wurden dann erstmals computerbasierte Expertensysteme entwickelt. In den 1990er Jahren begannen die ersten Versuche Algorithmen mit maschinellen Lernsystemen darauf zu trainieren, Muster in großen Datenmenge zu finden und zu nutzen. Diese Methode wurde weiterentwickelt und ausgebaut, so dass es heute eine Reihe verschiedener methodischer Ansätze gibt, um Algorithmen zu trainieren (z.B. überwachtes oder nicht überwachtes Lernen, Deep Learning), die unter dem Oberbegriff maschinelles Lernen zusammengefasst werden.
KI-Anwendungen und KI-basierte Systeme werden i.d.R. verwendet, um unbekannte Muster zu extrahieren, Prognosen und Klassifikationen durchzuführen. Bei allen bisher entwickelten KI-Anwendungen und KI-basierten Systemen handelt es sich um sogenannte „schwache KI“, die rein datengetrieben (statistisch) erstellt werden und jeweils nur für einen bestimmten abgegrenzten Einsatzzweck oder der Lösung eines konkreten Anwendungsproblems entwickelt wurden. Ein wichtiges Merkmal ist dabei, dass es sich um Black-Box-Modelle handelt, d.h. die eigentlichen Entscheidungsmechanismen der KI sind unbekannt.
Beispiele:
Die vollständigen Texte zu den vorgestellten Techniken der Datenauswertung und –analyse finden Sie im Dokument „Schlüsseltechniken der Digitalisierung für die Wasserwirtschaft“, dass im Mitgliederbereich als PDF Download zur Verfügung steht.