Maschinelles Lernen(ML):





Maschinelles Lernen:

Machine Learning ist ein möglicher Weg, künstliche Intelligenz zu realisieren. In den letzten 30 Jahren hat sich Machine Learning zu einem multidisziplinären Fach entwickelt, das viele Disziplinen wie Wahrscheinlichkeitstheorie, Statistik, Approximationstheorie usw. umfasst.
Im Bereich der künstlichen Intelligenz wollen die Menschen intelligente Maschinen entwickeln. Durch die Programmierung kann die Maschine einige grundlegende Arbeiten ausführen, z. B. den kürzesten Weg von A nach B finden. In den meisten Fällen wissen wir jedoch nicht, wie man Programme für künstliche Intelligenz schreibt, beispielsweise für das Abfangen von Spam, autonomes Fahren und selbst-anpassende Programme. Man hat die Erkenntnis gewonnen, dass der einfachste Weg für die Umsetzung künstliche Intelligenz ein lernender Algorithmus ist. Infolgedessen hat sich Machine Learning zu einer neuen Fähigkeit von Computern entwickelt und ist eng mit der Industrie und den Naturwissenschaften verbunden.
Wenn Sie die Dienste von Netflix, YouTube oder Amazon nutzen, werden Ihnen basierend auf Ihren Interessen Produkte und Medien präsentiert. Dies erfolgt mithilfe von Lernalgorithmen. Diese Anwendungen haben mehrere Millionen Benutzer und es ist offensichtlich unmöglich, Tausende verschiedener Programme für große Benutzeranzahlen zu schreiben. Die einzige Lösung besteht darin, eine selbstlernende Software zu entwickeln, die Ihre Vorlieben identifiziert und entsprechend diesen Empfehlungen macht.

Definition und Kategorien:


1.Überwachtes Lernen

Jeder Algorithmus beim Machine Learning benötigt eine Menge Daten, die als "Trainingsdaten" bezeichnet werden, die um ihn zu trainieren. Die Datentypen sind jedoch nicht dieselben.
Die Grundidee des Überwachten Lernens besteht darin, dass es für alle Daten im Trainingsset eine entsprechende richtige Antwort gibt (Andrew Ng.). Die Trainingsbeispiele mit der richtiger Antwort werden beschriftet. Die Aufgabe des Algorithmus ist es, die Beziehung zwischen Input und Output zu finden. Anhand von dieser Beziehung wird der gelernte Algorithmus auf neue Daten angewendet und kann entsprechend Antworten vorhersagen. Der Lernalgorithmus kann auch seine Ausgabe mit der richtigen Ausgabe vergleichen und Fehler finden, um das Modell entsprechend zu modifizieren.



2.Unüberwachtes Lernen

Im Gegensatz dazu werden unüberwachte Lernalgorithmen verwendet, wenn die zum Trainieren verwendeten Datensets weder klassifiziert noch beschriftet werden. Es gibt keine entsprechende „richtige“ Antwort für die Daten. Ein solcher Algorithmus ermittelt nicht die richtige Ausgabe, kann jedoch die Daten durchsuchen und Schlussfolgerungen aus dem Datenset ableiten, um die verborgene Struktur in den unbeschrifteten Daten zu beschreiben. Das bedeutet, dass dieser Algorithmus nur für Klassifikationsprobleme verwendet wird.
Unüberwachtes Lernen ermöglicht es uns, Probleme mit weniger oder keiner Ahnung anzugehen, wie die Ergebnisse aussehen sollten. Wir können Strukturen aus Daten ableiten, bei denen wir die Wirkung der Variablen nicht unbedingt kennen. Wir können diese Struktur ableiten, indem wir die Daten basierend auf Beziehungen zwischen den Variablen in den Daten gruppieren.

Für Klassifikationsprobleme gibt es zwei typische Algorithmen: Clustering-Algorithmus und Cocktailparty-Algorithmus. Die Rolle des Clustering-Algorithmus ist zu bestimmen, dass ein angegebener Datensatz mehrere verschiedene Cluster enthalten. Das bekannteste Beispiel ist Google News. Google News sammelt täglich Tausende von Nachrichten im Web und gruppiert sie dann in mehrere Themen. Nachrichten über die gleichen Ereignisse werden zusammen angezeigt.

3.Bestärkendes Lernen

Bestärkende Lernalgorithmen sind eine Lernmethode, die mit ihrer Umgebung interagiert, indem sie Aktionen erzeugen und Fehler oder Belohnungen entdecken. Die meisten BL-Untersuchungen werden im mathematischen Rahmen von Markov-Entscheidungsprozessen (MDPs) durchgeführt. MDPs beinhalten einen Entscheidungsträger, der mit seiner Umgebung interagiert, um die kumulative Belohnung, die er im Laufe der Zeit erhält, zu maximieren. Der Agent erkennt Aspekte des Umgebungszustands und wählt Aktionen aus. Der Agent kann eine Wertfunktion schätzen und sie verwenden, um im Laufe der Zeit immer bessere Richtlinien für die Entscheidungsfindung zu erstellen.Versuchs- und Fehlersuche und verzögerte Belohnung sind die wichtigsten Merkmale des bestärkenden Lernens. Mit dieser Methode können Maschinen und Software-Agenten das ideale Verhalten in einem bestimmten Kontext automatisch ermitteln, um die Leistung zu maximieren. Der Agent benötigt ein einfaches Belohnungsfeedback, um herauszufinden, welche Aktion die beste ist. Dies wird als Verstärkungssignal bezeichnet. In den interessantesten und herausforderndsten Fällen können Aktionen nicht nur die unmittelbare Belohnung, sondern auch die nächste Situation und damit alle nachfolgenden Belohnungen betreffen (Richard S. Sutton and Andrew G. Barto 2017).