KI/Maschinelles Lernen Übersicht über ML

 

  1. Überwachtes Lernen (Supervised Learning, SL)

    Supervised-Learning-Algorithmen modellieren Beziehungen und Abhängigkeiten von gegebenen Input- und Output/Label-Daten.

    Ziel ist es, dass Supervised-Learning-Algorithmen Output/Label-Daten für neue Input-Daten auf Basis des jeweiligen Modells vorhersagen.

    Dabei wird das Modell mit Eingangsdaten (Input) und den richtigen Lösungen (Output/Labels) trainiert (Trainingsdaten), sodass es gewisse Muster erkennt.

    B. Zuordnung Spam/Nicht Spam

    Die Beziehung zweier Datenreihen (Input und Output/Label bzw. X und Y) wird modelliert, damit Algorithmus eigenständig Output-Ergebnisse (Y) für neue, unbekannte Input-Datensätze (X) erstellt.

-> Vorhersagemodell mit klassifizierten Daten (Daten mit Beziehung)
-> Probleme: Regression, Classification

-> Auswahl üblicher Algorithmen: Nearest Neighbor, Naive Bayers, Decision Trees, Linear Regression, Support Vector Machines (SVM), Neural networks, Logistic regressiion

 

  1. Unüberwachtes Lernen (Unsupervised Learning)

    Computer wird mit unklassifizierten Daten (also nur Daten, ohne Beziehung, unlabeled data) trainiert. Dabei modelliert der Computer gegebene Input-Daten ohne gegebene Output-/Label-Daten.

    Ziel ist es, dass Supervised-Learning-Algorithmen eigenständig Muster (pattern detection) und in der Wirklichkeit Zusammenhänge (descriptive modeling) erkennt, ohne eine Lösung zu haben.

    Ein unklassifizierter Datensatz wird mathematisch klassifiziert.

    -> Beschreibendes Modell
    -> Probleme: Clustering, Dimensionality reduction, Associal rule learning
    -> Übliche Algorithmen: k-means clustering, association rules, Apriori algorithm

 

  1. Teil-überwachtes Lernen (Semi-supervised Learning)


Computer wird mit Datensatz gefüttert, in dem nur wenige Daten klassifiziert sind. Semi-supervised learning Algorithmen stehen also zwischen supervised learning und unsupervised learning.

Semi-supervised learning ermöglicht höhere Genauigkeit für andere Modelle.

-> Problems: Classification and regression

 

  1. Nicht überwachtes Lernen (Reinforcement-Learning)

    Agent versucht, durch Interaktion mit der Umwelt Aktionen zu machen, die die Belohnung (reward) erhöhen und die Bestrafung (risk) zu verringern. Dabei lernt der Algorithmus durch die Interaktion mit der Umwelt durchgehend dazu.
    Durch die Interaktionen mit der Umwelt lernt der Agent alle möglichen Zustände, die sich aus der Interaktion ergeben können.

    Ziel ist es, dass der Agent selbstständig das beste Verhalten für einen Fall entwickelt, um die beste eigene Performance zu erreichen.

    Ein Feedback (reward feedback) wird benötigt, damit Agent aus seinem Verhalten lernt (reinforcement signal)

    Wenn wiederholt der Agent das beste Verhalten aussuchen soll, handelt es sich um einen Markov Decision Process

    Grober Ablauf:
    Input-Signal durch Agent festgehalten
    2. Decision Making Function lässt den Agenten eine Action durchführen
    3. Nach der Action erhält Agent entweder Belohnung (reward) oder Bestrafung (reinforcement) aus Umwelt
    4. Zustand-Action-Reward-Beziehung gespeichert

    -> Agent ermittelt durch Interaktion mit Umgebung bestes Verhalten für spezifische Situation
    -> Übliche Algorithmen: Q-Learning, Temporal Difference (TD), Deep Adversarial Networks

    -> Anwendung z.B.: Spiele mit Ziel, beste Handlungsstrategie zu entwickeln

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.

Verwandte Beiträge

Beginne damit, deinen Suchbegriff oben einzugeben und drücke Enter für die Suche. Drücke ESC, um abzubrechen.

Zurück nach oben