Predictive Analytics – Definition und Beispiele
Die Zukunft mithilfe von mathematischen Methoden präzise voraussagen – diese kühne Ambition scheint mit Predictive Analytics in greifbare Nähe gerückt zu sein. Bei dieser Methode der Datenanalyse handelt es sich um einen Teilbereich der Big-Data-Analyse. Predictive Analytics zielen hierbei auf die Vorhersage („prediction“) von zukünftigen Trends in Disziplinen wie Wissenschaft, Marketing, dem Finanzsektor oder dem Versicherungswesen.
Das wichtigste Element von Predictive oder auch Prediction Analytics ist der sogenannte Prädiktor. Dieser Begriff steht beispielsweise für eine Person oder Einheit, die gemessen wird, um ein mögliches zukünftiges Verhalten vorherzusagen. Ein konkretes Beispiel wäre etwa eine Versicherung, die potenzielle Faktoren für die Risikoberechnung eines Fahrzeughalters vorwegnimmt, indem sie relevante Faktoren wie etwa Fahrerfahrung, Alter und gesundheitliche Verfassung der betreffenden Person in die Kalkulation miteinbezieht. Aus der Summe dieser Faktoren lässt sich durch Predictive Analytics die mögliche Unfallgefährdung und folglich die Höhe des Versicherungsbeitrags kalkulieren.
Data-Mining – die Grundlage verschiedener analytischer Erhebungen
In der Tat wird der Begriff Predictive Analytics oftmals synonym mit Data-Mining verwendet. Häufig ist es der Fall, dass die Methoden von Data-Mining eine wesentliche Rolle im Findungsprozess von Predictive-Analytics-Ansätzen spielen. Predictive Analytics präzisiert jedoch die Funktionsweise von Data-Mining und bezieht weitere Techniken mit ein. So spielen u. a. auch Elemente der Spieltheorie und automatisiertes maschinelles Lernen eine wichtige Rolle. Des Weiteren werden bei der Anwendung von Prediction Analytics spezielle Analyseverfahren eingesetzt, die auf komplexen Algorithmen basieren, um etwa aus einer scheinbar zusammenhanglosen Textwüste von Social-Media-Beiträgen oder Blog-Artikeln ein erkennbares Muster zu gewinnen.
Data-Mining („Daten schürfen“) versucht mithilfe von mathematischen und stochastischen Verfahren und Algorithmen inhärente Muster in großen Datenmengen zu ermitteln. Aus den auf diese Weise gewonnenen Erkenntnissen lassen sich im Idealfall Trends und potenzielle Entwicklungen ablesen und antizipieren.
Um die Funktionsweise von Predictive Analytics genauer zu verstehen, ist ein Überblick über gebräuchliche Begriffe der Big-Data-Analyse bzw. des Data-Minings hilfreich:
- Regressionsanalyse: Wechselwirkungen zwischen diversen abhängigen und unabhängigen Variablen werden identifiziert. Beispielsweise hängt der Absatz vom Produktpreis und der Bonität der Kunden ab.
- Clustering: Durch die Segmentierung von Daten können etwa potenzielle Kunden nach Einkommen oder ähnlichen Faktoren sortiert werden.
- Assoziations-Analyse: Ziel ist das Aufzeigen von Strukturen mit jenen Variablen, die zu identischen Ergebnissen führen. Daraufhin lassen sich Schlüsse über mögliches Kundenverhalten ziehen und im Idealfall zukünftige Käufe prognostizieren. Wenn ein Kunde z. B. an Schuhen interessiert ist, könnte er auch ein Schuhregal kaufen wollen.
Die Differenzierung von Predictive Analytics
Das Erkennen von Mustern in Datenbeständen erinnert ein wenig an die Interpretationsleistung des menschlichen Gehirns, wenngleich Big-Data-Analysen dessen Fähigkeiten hinsichtlich ihrer Komplexität bei weitem übersteigen. Tatsächlich gibt es eine Parallele zwischen den angewandten Strukturen von Data-Mining und den neuronalen Vernetzungen des menschlichen Gehirns, da auch das artifizielle Netzwerk fähig ist, nach einigen Abläufen gewisse Muster zu identifizieren und zu speichern. Folglich lässt sich feststellen, dass Data-Mining strukturell verwandt ist mit AI (künstlicher Intelligenz oder maschinellem Lernen). Hierbei lernen Computerprogramme quasi selbständig anhand von eingespeisten Grundlagen und erwerben neue Informationen nach den beigebrachten und weiterentwickelten Mustern.
An dieser Stelle besteht ein wichtiger Unterschied zwischen Data-Mining und Prediction Analytics. Das konventionelle Data-Mining hat meistens zum Ziel, strukturelle Muster in vorliegenden Informationen und Clustern aufzuzeigen. Der Fokus auf eine quasi autodidaktische Neuentwicklung von Berechnungen, die progressiv über den Datenbestand hinausführen, ist jedoch eine Eigenschaft des maschinellen Lernens – und dies spielt eine entscheidende Rolle für die Predictive-Analytics-Definition. Die bereits bestehenden Algorithmen sollen selbständig aus dem Datenfundus kombinieren und neue Schlüsse ziehen, um eigenständig mittels Vorhersagen beispielsweise Kundenverhalten zu prognostizieren. Man bezeichnet das „Kondensat“ dieser Erhebungen als Smart Customer Data.
Anwendungsbereiche von Predictive Analytics
In den verschiedensten Branchen hat sich die Einbeziehung von Predictive Analytics bereits bewährt. Neben wissenschaftlichen High-Tech-Unternehmen nutzt beispielsweise das Gesundheitswesen die Methode zur Voraussage von Krankheitsverläufen. Ein prominenter Anwendungsbereich ist auch die Energiebranche, wo das intelligente Stromnetz der Zukunft als „Smart Grid“ tituliert wird. Hierbei kann der Stromverbrauch anhand von gespeicherten Verhaltensmustern der Kunden (Smart Customer Data) vorausgesagt werden, um die benötigte Einspeisung von Wind- und Wasserkraftenergie exakt zu regulieren.
Als weiteres Beispiel lässt sich die sogenannte Predictive Maintenance heranziehen. Hierbei werden die aktuellen Daten einer laufenden Maschine eingespeist, um deren zukünftige Beanspruchung und den daraus resultierenden Verschleiß vorauszusagen. Schwachstellen innerhalb der Produktionskette können so schnell identifiziert und ausgebessert werden, um beispielsweise einen Gesamtausfall der Produktion zu verhindern.
Am besten lässt sich Predictive Analytics dann nutzen, wenn verschiedenste, möglichst umfangreiche und gereinigte Datenpakete zur Verfügung stehen. Alle Datenpakete werden daraufhin in die Analyse integriert, deren Ergebnis desto präziser ausfällt, je mehr Daten aus den verschiedensten Bereichen verfügbar sind. Die meisten Unternehmen machen sich Synergie-Effekte zunutze, indem sie ihre bereits vorhandene Business-Intelligence-Struktur um die Funktionen von Predictive Analytics erweitern. Zu den beliebtesten Tools zur Anwendung von Predictive Analytics gehören:
- Alpine Data Labs
- Alteryx
- Angoss KnowledgeSTUDIO
- BIRT Analytics
- IBM SPSS Statistics and IBM SPSS Modeler
- KXEN Modeler
- Mathematica
- MATLAB
Als nächster Schritt in der Datenanalyse lässt sich Prescriptive Analytics definieren. Diese Methode setzt da an, wo Predictive Analytics an seine Grenzen stößt: Man versucht Vorgaben zum Handeln abzulesen, um den weiteren Verlauf eines Trends gezielt zu lenken. Angestrebte Szenarien sind so u. U. leichter zu realisieren und ein bisheriger Verlauf in eine andere Richtung zu navigieren. Dieses Vorgehen wird ermöglicht durch analytische Strukturen auf der Basis von komplexen Modellen und stochastischen MC-Simulationen. Wie bei Predictive Analytics gilt auch hier: Je mehr bekannte und verlässliche Variablen man in diese Modelle implementiert, desto treffsicherer sind die Ergebnisse.
Es gibt unzählige Beispiele für die Anwendung und das Funktionieren von Predictive Analytics. Die Methode steht und fällt mit der Menge und Qualität der eingepflegten Daten. Dennoch werden die angewendeten Algorithmen immer feinmaschiger, wodurch sich auch die Vorhersagen immer präziser gestalten lassen. Von dieser Entwicklung profitieren auch die Prescriptive Analytics als nächster Schritt in der Datenanalyse.