Neuartige Visualisierung in Predictive Analytics

Neuartige Visualisierung in Predictive Analytics - Dummies

Eine Visualisierung kann eine Simulation (eine bildliche Darstellung eines Was-wäre-wenn-Szenarios) in Predictive Analytics darstellen. Sie können eine Visualisierung einer Vorhersage mit einer Simulation verfolgen, die sich überlappt und die Vorhersage unterstützt. Was geschieht zum Beispiel, wenn das Unternehmen die Produktion von Produkt D aufhört? Was passiert, wenn eine Naturkatastrophe das Home Office trifft? Was passiert, wenn Ihre Kunden das Interesse an einem bestimmten Produkt verlieren? Sie können die Visualisierung verwenden, um das zukünftige Verhalten eines Unternehmens, eines Marktes, eines Wettersystems zu simulieren - Sie nennen es.

Ein Dashboard ist eine weitere Visualisierungsart, mit der Sie ein umfassendes Vorhersageanalysemodell anzeigen können. Über das Dashboard können Sie mithilfe einer Steuerschaltfläche jeden Schritt in der Vorhersageanalysepipeline ändern. Dies kann die Auswahl der Daten, die Datenvorverarbeitung, die Auswahl eines Vorhersagemodells und die Auswahl der richtigen Evaluierungsversionen umfassen.

Sie können jederzeit einen beliebigen Teil der Pipeline mithilfe der Steuerschaltfläche im Dashboard ändern. Ein Dashboard ist eine interaktive Art der Visualisierung, bei der Sie die Kontrolle haben und die Diagramme, Tabellen oder Maps dynamisch basierend auf den Eingaben ändern können, die Sie in die Analysen einschließen, die diese Diagramme und Diagramme generieren.

Mindestens eine prädiktive Analysetechnik ist rein vom natürlichen Phänomen der Vogelbeflockung inspiriert. Das Vogelbeflockungsmodell identifiziert nicht nur Gruppierungen in Daten, sondern zeigt sie auch dynamisch an. Die gleiche Technik kann verwendet werden, um verborgene Muster in Ihren Daten abzubilden.

Das Modell stellt Datenobjekte als Vögel dar, die in einem virtuellen Raum fliegen, gemäß Beflockungsregeln , die steuern, wie sich ein wandelnder Vogelschwarm in der Natur bewegt.

Das Darstellen mehrerer Datenobjekte als Vögel zeigt, dass ähnliche Datenobjekte zu Subflocken (Gruppierungen) zusammenfließen. Die Ähnlichkeit zwischen Objekten in der realen Welt ist es, die die Bewegungen der entsprechenden Vögel im virtuellen Raum antreibt. Stellen Sie sich beispielsweise vor, dass Sie die von mehreren Internetbenutzern gesammelten Online-Daten analysieren möchten (auch bekannt als Netizens ).

Mit Vogelbeflockung das Online-Verhalten von Internetnutzern analysieren.

Jede Information (die aus solchen Quellen wie Benutzerinformationen von sozialen Netzwerken und Online-Transaktionen von Kunden gewonnen wird) wird als ein entsprechender Vogel im virtuellen Raum dargestellt.

Zwei Scharen von Internetnutzern.

Wenn das Modell feststellt, dass zwei oder mehr Nutzer per E-Mail oder Chat miteinander interagieren, auf demselben Online-Foto erscheinen, das gleiche Produkt kaufen oder dieselben Interessen teilen, zeigt das Modell diese beiden Internetnutzer als Vögel, die sich zusammenscharen. , nach natürlichen Beflockungsregeln.

Die Interaktion (dh wie nahe die repräsentativen Vögel zueinander kommen) wird als eine mathematische Funktion ausgedrückt, die von der Häufigkeit der sozialen Interaktion oder der Intensität abhängt, mit der die Nutzer die gleichen Produkte kaufen oder dieselben Interessen teilen. .. Diese neueste mathematische Funktion hängt ausschließlich von der Art der Analyse ab, die Sie anwenden.

Das obige Bild zeigt die Interaktion auf Facebook zwischen Netizens X und Y im Cyberspace als virtuellen Vogelraum, in dem sowohl X als auch Y als Vögel dargestellt werden. Da Netizens X und Y miteinander interagieren, zeigt die nächste Beflockungs-Iteration ihre beiden Vögel näher beieinander.

Ein als "Herde nach Führer" bekannter Algorithmus, der von Prof. Anasse Bari und Prof. Bellaachia erfunden wurde (siehe die folgenden Referenzen), wurde von einer kürzlichen Entdeckung inspiriert, die die Führungsdynamik von Tauben aufdeckte. Dieser Algorithmus kann Benutzereingaben für Datenpunkte filtern, die es ermöglichen, Führungskräfte zu erkennen, Anhänger zu finden und Beflockungsverhalten im virtuellen Raum einzuleiten, das genau nachvollzieht, was passiert, wenn sich Herden auf natürliche Weise bilden - mit Ausnahme der Herden. Datenherden . Diese Technik erkennt nicht nur Muster in Daten, sondern liefert auch eine klare bildliche Darstellung der Ergebnisse, die durch Anwendung von Vorhersageanalysemodellen erhalten werden. Die Regeln, die natürliches Beflockungsverhalten in der Natur orchestrieren, wurden erweitert, um neue Beflockungsregeln zu schaffen, die der Datenanalyse entsprechen:

Datenherde-Homogenität:

  • Mitglieder der Herde zeigen Ähnlichkeit in Daten. Data Flock Leadership:
  • Das Modell nimmt Informationsführer vorweg. Die Darstellung eines großen Datensatzes als Vogelschwarm ist eine Möglichkeit, Big Data in einem Dashboard einfach zu visualisieren.

Dieses Visualisierungsmodell kann verwendet werden, um Datenelemente zu erkennen, die Ausreißer, Anführer oder Follower sind. Eine politische Anwendung könnte darin bestehen, Community-Ausreißer, Gemeindeleiter oder Anhänger der Gemeinschaft zu visualisieren. Auf dem biomedizinischen Gebiet kann das Modell verwendet werden, um Ausreißergenome und -führer unter genetischen Proben einer bestimmten Krankheit zu visualisieren (z. B. solche, die eine bestimmte Mutation am beständigsten zeigen).

Eine Vogelschau-Visualisierung kann auch verwendet werden, um zukünftige Muster unbekannter Phänomene im Cyberspace vorherzusagen - zivile Unruhen, eine aufstrebende soziale Bewegung, die Linie eines zukünftigen Kunden.

Die Beflockungsvisualisierung ist besonders nützlich, wenn Sie eine große Menge von gestreamten Daten mit hoher Geschwindigkeit empfangen: Sie können die Bildung von Beflockung im virtuellen Raum sehen, der die Vögel enthält, die Ihre Datenobjekte darstellen. Die Ergebnisse der Datenanalyse werden (buchstäblich) spontan im virtuellen Raum widergespiegelt. Die Wirklichkeit wird einer fiktiven, aber beobachtbaren und analytisch bedeutungsvollen, rein von der Natur inspirierten Darstellung gegeben. Solche Visualisierungen können auch als Simulationen oder Was-wäre-wenn-Szenarien funktionieren.

Eine Visualisierung basierend auf dem Beflockungsverhalten beginnt mit der Indizierung jedes Netizens zu einem virtuellen Vogel. Anfangs sind alle Vögel untätig.Sobald die Daten eintreffen, beginnt jeder Vogel im virtuellen Raum entsprechend den Analyseergebnissen und den Beflockungsregeln zu strömen.

Verfolgen der Netzwerkbesucher.

Unten wird die sich entwickelnde Herde gebildet, während die Analytik präsentiert wird.

Was die Herde tut.

Nach der Analyse von Daten über einen großen Zeitraum, der bei t + k endet, können die Ergebnisse dieser Anwendung von Vorhersageanalyseergebnissen wie folgt dargestellt werden: Der Herde-nach-Führer-Algorithmus differenziert die Mitglieder der Herde in drei Klassen : ein Führer, Anhänger und Ausreißer.

Flock-by-Leader unterteilt die Herde.

Der Flock-by-Leader-Algorithmus wurde von Dr. Bari und Dr. Bellaachia erfunden und wird detailliert in diesen Quellen erklärt:

"Flock von Leader: Ein neuartiger maschineller Lern-biologisch inspirierter Clustering-Algorithmus", IEEE Internationale Konferenz der Schwarmintelligenz, 2012.

  • Dies erscheint auch als Buchkapitel in

Fortschritte in der Schwarmintelligenz, Ausgabe 2012 - (Springer-Verlag). "SFLOSCAN: Ein biologisch inspirierter Data-Mining-Rahmen für die Identifizierung von Gemeinschaften in dynamischen sozialen Netzwerken", IEEE Internationale Konferenz für Computational Intelligence, 2011 (SSCI 2011), 2011.