Mittelung verschiedener Prädiktoren für maschinelles Lernen

Mittelung verschiedener Prädiktoren für maschinelles Lernen - Dummies

Sowohl Mittelwert- als auch Abstimmungssysteme können auch gut funktionieren, wenn Sie eine Mischung verschiedener maschineller Lernmethoden verwenden. Algorithmen. Dies ist der -Mittelwert-Ansatz und wird häufig verwendet, wenn Sie die Schätzvarianz nicht reduzieren können.

Wenn Sie versuchen, aus Daten zu lernen, müssen Sie verschiedene Lösungen ausprobieren und so Ihre Daten mit verschiedenen maschinellen Lernlösungen modellieren. Es ist empfehlenswert, zu überprüfen, ob Sie einige von ihnen erfolgreich in Ensembles integrieren können, indem Sie Vorhersage-Mittelwerte verwenden oder die vorhergesagten Klassen zählen. Das Prinzip ist das gleiche wie bei nicht-korrelierten Vorhersagen, wenn gemischte Modelle weniger Varianz-beeinflusste Vorhersagen erzeugen. Um eine effektive Mittelung zu erreichen, müssen Sie

  1. Teilen Sie Ihre Daten in Trainings- und Testsätze auf.
  2. Verwenden Sie die Trainingsdaten mit verschiedenen maschinellen Lernalgorithmen.
  3. Zeichnen Sie Vorhersagen von jedem Algorithmus auf und bewerten Sie die Durchführbarkeit des Ergebnisses unter Verwendung des Testsatzes.
  4. Korreliere alle verfügbaren Vorhersagen miteinander.
  5. Wählen Sie die Vorhersagen aus, die am wenigsten korrelieren, und mitteln Sie deren Ergebnis. Oder, wenn Sie klassifizieren, wählen Sie eine Gruppe von am wenigsten korrelierten Vorhersagen und wählen Sie für jedes Beispiel als neue Klassenvorhersage die Klasse aus, die die Mehrheit von ihnen vorhergesagt hat.
  6. Testen Sie die neu gemittelte oder Mehrheits-Vorhersage mit den Testdaten. Wenn Sie erfolgreich sind, erstellen Sie Ihr endgültiges Modell, indem Sie die Ergebnisse des Modellteils des erfolgreichen Ensembles mitteln.

Um zu verstehen, welche Modelle am wenigsten korrelieren, nehmen Sie die Vorhersagen nacheinander, korrelieren Sie jedes mit den anderen und mitteln Sie die Korrelationen, um eine gemittelte Korrelation zu erhalten. Verwenden Sie die gemittelte Korrelation, um die ausgewählten Vorhersagen zu ordnen, die für die Mittelwertbildung am besten geeignet sind.