Mustererkennung – Machine Learning
Die Erkennung von Mustern (Regeln) in großen Datenmengen ist mit klassischen Datenhaltungssystemen entweder gar nicht oder nur mit sehr langen Berechnungszeiten (mehrere Stunden bis Tage) möglich gewesen und erforderte gleichzeitig eine hohe Tool- und Methodenkompetenz. Mustererkennung gehört in die Kategorie machine learning, hierbei wird zwischen supported und un-supported machine learning unterschieden. Synop Analyzer unterstützt in allen Verfahren beide Absätze. Welcher Ansatz der richtige ist, hängt von der Fragestellung ab.
Big Data erfordert Mustererkennung
Viele Big Data Analytics Anwendungen sind nur mit Mustererkennung möglich. Synop Analyzer bietet mit der Assoziationsanalyse und der Sequenzmuster-Erkennung zwei Machine-Learning Verfahren an, welche auf großen Datenmengen Ergebnisse innerhalb von Sekunden oder Minuten liefern. Das Ergebnis, eine Sammlung von Regeln, kann auf zukünftige Datensätze angesetzt werden, um herauszufinden, ob eine oder mehrere Regeln in diesen Datensätzen vorkommen. Die Regeln können in operative Softwareprogramme integriert werden, um z.B. Frühwarnkonzepte oder prädiktive Wartungslösungen zu realisieren. Synop Analyzer kann somit zeitlich geordnete (Sequenzen) oder nicht-zeitlich geordnete Muster (Assoziationen) analysieren.
Viele Einsatzmöglichkeiten für die Mustererkennung
- Warenkorbanalysen
- Verkaufs-oder Verhaltensmuster
- verborgene Fehlerursachen in der Produktion
- verborgene Fehlerursachen in der Diagnose
- gehäufte Garantiefälle
- Betrugs- oder Manipulationsverhalten
- prädiktive Wartung
- problematische Prozessketten
- Frühwarnung von kritischen Zuständen
- Customer-Journey-Verhalten
Assoziationsmuster-Analyse
Eine Assoziationsmuster-Analyse (machine learning) sucht in einer Trainingsdatenmenge nach Assoziationsmustern, also nach Kombinationen von Einzel-Tatsachen oder Ereignissen, die signifikant oft oder signifikant selten gemeinsam in den Daten vorkommen. Das Ergebnis der Analyse ist eine Sammlung von Assoziationsmustern (Regeln). Das Modell kann später auf neue Daten angewendet (‘gescored’) werden, um herauszufinden, auf welche Datensätze in den neuen Daten welche der Regeln des Modells zutreffen.
Sequenzmusteranalyse
Eine Sequenzmusteranalyse (machine learning Methode) sucht in einer Trainingsdatenmenge nach Sequenzmustern, also nach zeitgeordneten Abfolgen von Einzel-Tatsachen oder Ereignissen, die signifikant oft oder signifikant selten nacheinander in den Daten vorkommen. Das Ergebnis der Analyse ist eine Sammlung von Sequenzmustern die als signifikant häufig oder signifikant selten vorkommend identifiziert wurden. Das Modell kann später auf neue Daten angewendet (‘gescored’) werden, um herauszufinden, auf welche Datensätze in den neuen Daten welche der Sequenzregeln des Modells zutreffen.