Mustererkennung

Die Erkennung von Mustern (Regeln) in großen Datenmengen ist mit klassischen Datenhaltungssystemen entweder gar nicht oder nur mit sehr langen Berechnungszeiten (mehrere Stunden bis Tage) möglich gewesen und erforderte gleichzeitig eine hohe Tool- und Methodenkompetenz.

Big Data erfordert Mustererkennung

Viele Big Data Analytics Anwendungen sind nur mit Mustererkennung möglich. Synop Analyzer bietet mit der Assoziationsanalyse und der Sequenzmuster-Erkennung zwei Verfahren an, welche auf großen Datenmengen Ergebnisse innerhalb von Sekunden oder Minuten liefern. Das Ergebnis, eine Sammlung von Regeln, kann auf zukünftige Datensätze angesetzt werden, um herauszufinden, ob eine oder mehrere Regeln in diesen Datensätzen vorkommen. Die Regeln können in operative Softwareprogramme integriert werden, um z.B. Frühwarnkonzepte oder prädiktive Wartungslösungen zu realisieren. Synop Analyzer kann somit zeitlich geordnete (Sequenzen) oder nicht-zeitlich geordnete Muster (Assoziationen) analysieren.

Viele Einsatzmöglichkeiten für die Mustererkennung

  • Warenkorbanalysen
  • Verkaufs-oder Verhaltensmuster
  • verborgene Fehlerursachen in der Produktion
  • verborgene Fehlerursachen in der Diagnose
  • gehäufte Garantiefälle
  • Betrugs- oder Manipulationsverhalten
  • prädiktive Wartung
  • problematische Prozessketten
  • Frühwarnung von kritischen Zuständen
  • Customer-Journey-Verhalten

Assoziationsmuster-Analyse

Eine Assoziationsmuster-Analyse sucht in einer Trainingsdatenmenge nach Assoziationsmustern, also nach Kombinationen von Einzel-Tatsachen oder Ereignissen, die signifikant oft oder signifikant selten gemeinsam in den Daten vorkommen. Das Ergebnis der Analyse ist eine Sammlung von Assoziationsmustern (Regeln). Das Modell kann später auf neue Daten angewendet (‘gescored’) werden, um herauszufinden, auf welche Datensätze in den neuen Daten welche der Regeln des Modells zutreffen.

Sequenzmusteranalyse

Eine Sequenzmusteranalyse sucht in einer Trainingsdatenmenge nach Sequenzmustern, also nach zeitgeordneten Abfolgen von Einzel-Tatsachen oder Ereignissen, die signifikant oft oder signifikant selten nacheinander in den Daten vorkommen. Das Ergebnis der Analyse ist eine Sammlung von Sequenzmustern die als signifikant häufig oder signifikant selten vorkommend identifiziert wurden. Das Modell kann später auf neue Daten angewendet (‘gescored’) werden, um herauszufinden, auf welche Datensätze in den neuen Daten welche der Sequenzregeln des Modells zutreffen.