Was versteht man unter Machine Learning?

Machine Learning, Deep-Learning, Neuronale Netzwerke. Künstliche Intelligenz und ihre rasanten Fortschritte rücken in letzter Zeit immer mehr in den Fokus. Nicht zuletzt durch den weltweiten Erfolg des Chatbots ChatGPT. Was steckt hinter diesen Technologien und wie funktionieren sie?

von Machine Learning © Bild: iStockphoto.com

Inhaltsverzeichnis

Was versteht man unter Machine Learning?

Machine Learning oder Maschinelles Lernen ist ein Teilgebiet der Künstlichen Intelligenz (KI). Es beruht auf einer Technologie, mit der Systeme trainiert werden können, Zusammenhänge in Daten zu erkennen. Machine Learning beschreibt KI-Modelle, die aus Erfahrung lernen und das Erlernte dann einsetzen können, um bessere Ergebnisse zu erzielen.

Machine-Learning-Modelle werden, wie auf "sap.com" beschrieben, mit riesigen Mengen an Daten gefüttert und "lernen" Muster und Gemeinsamkeiten zu identifizieren. Nach dieser Lernphase sind sie fähig, auch neue Daten richtig einzuordnen. Ein Beispiel: Gibt man einem Machine-Learning-Modell Tausende Bilder von Autos und LKWs und sagt ihm bei jedem Bild, ob es ein Auto oder ein LKW ist, dann wird die Maschine lernen, welche Merkmale ausschlaggebend für Autos bzw. LKWs sind. Zeigt man dem Computer dann ein neues Bild, das nicht im Trainingsdatensatz enthalten war, wird er ohne Hilfe erkennen können, ob es sich um ein Auto oder einen LKW handelt. Der Computer hat also den Unterschied "gelernt".

Wie funktioniert Machine Learning?

Damit ein Computer solche Dinge lernen kann, ist ein Algorithmus notwendig. Ein Algorithmus ist eine mathematische Schritt-für-Schritt-Anleitung, wie bestimmte Berechnungen und Interpretationen durchgeführt werden sollen. Der Algorithmus gibt der Maschine eine Struktur vor, nach der sie die Datenmengen analysieren soll. Die Maschine befolgt die Regeln des Algorithmus und macht abertausende Übungen. Durch diesen iterativen Prozess wird die Maschine immer besser beim Bearbeiten der Problemstellung.

Weil die Datenmengen enorm sind und viele verschiedene Aspekte beinhalten, braucht die Maschine tatsächlich viel Zeit und viele Wiederholungen, um ihre Vorhersagen zu verbessern. In diesem Sinne ist der Begriff "Lernen" gut gewählt, denn auch Menschen lernen durch Üben, Probieren und Verbessern. Zeigt man der Maschine nur hundert Bilder von Katzen und Hunden und erklärt, welches Bild welches Tier darstellt, so kann es leicht sein, dass die Maschine auch einen Fuchs oder einen Puma als Hund bzw. Katze einstufen würde. Nach einer Millionen Bildern aber ist die Vorhersage viel genauer.

Welche Arten von Machine-Learning-Algorithmen gibt es?

Es gibt eine Reihe von unterschiedlichen Arten, wie ein Programm trainiert werden kann. Der größte Unterschied liegt dabei darin, ob das Lernen überwacht wird oder nicht.

Überwachtes Lernen

Beim überwachten Lernen wird dem Algorithmus laut "oracle.com" die richtige Antwort bereits vorgegeben. Er wird mit Bildern trainiert, die bereits mit einem Label versehen sind ("Hund", "Katze"). Es gibt also einen Input, der mit einem gewünschten Output verbunden ist. Die Maschine lernt im Laufe der Zeit, welche Merkmale wichtig sind, damit ein Bild als Katze oder als Hund gilt.

Nicht überwachtes Lernen

Beim nicht überwachten Lernen gibt es keinen fertigen Antwortschlüssel. Der Maschine wird eine Fülle an Daten zugespielt und sie weiß nicht, welcher Output zu einem bestimmten Input gehört. Das Programm sucht also in der Fülle an Daten nach Mustern und Ähnlichkeiten und beginnt, verschiedene Datenpakete in Gruppen aufzuteilen. Die Programmierer:innen müssen dann kontrollieren, wie das Modell funktioniert hat, und können Änderungen vornehmen.

Anwendungsgebiete von Machine Learning

Die Anwendungsgebiete von Machine Learning sind vielfältig. Von Social-Media-Algorithmen über personalisierte Werbung bis hin zu automatisierten Diagnosetechniken bei der Krebserkennung. Von smarten Chatbots wie ChatGPT über Gesichtserkennung bis hin zu Aktienmarktanalysen.

Meistens wird Machine Learning von großen Unternehmen eingesetzt, die ihre Dienstleistungen optimieren wollen. YouTube, Netflix oder TikTok verwenden Machine Learning, um den Kund:innen bessere Videovorschläge zu geben. PayPal verwendet Machine Learning, um Transaktionen zu überwachen und Betrug zu minimieren. Google verwendet unterschiedliche Machine-Learning-Technologien in verschiedenen Bereichen, von Bilderkennung bis hin zu Verkehrsanalysen.

Was ist das Ziel von Machine Learning?

Machine Learning ist eine weitere Evolutionsstufe von KI-Systemen. Das Ziel ist es, den menschlichen Denk- und Lernprozess zu simulieren. Auch wenn dieses Ziel noch nicht erreicht ist, sind moderne Machine-Learning-Programme viel "intelligenter" als frühere Technologien. Jedes Machine-Learning-Modell ist auf einen bestimmten Bereich spezialisiert bzw. auf bestimmte Aufgaben trainiert. Deshalb sind auch die Ziele je nach Anwendungsgebiet unterschiedlich.

Es gibt allerdings auch Bestrebungen, eine Allgemeine Künstliche Intelligenz (Artificial General Intelligence) zu entwickeln, die ähnlich wie die menschliche kognitive Fähigkeit in unterschiedlichsten Kontexten Probleme lösen kann. Die Vorstellung einer solchen allgemeinen KI ist faszinierend und erschreckend zugleich. Die Entwicklung von KI-Systemen ist in den letzten zehn Jahren so rasant vorangeschritten, dass es schwierig ist abzuschätzen, wie "smart" diese Programme in 20 oder 30 Jahren sein werden.

Wie viel kostet die Anwendung?

Die Kosten von Machine Learning hängen stark von der Größe des Modells ab und variieren mit der Datenmenge, dem menschlichen Arbeitsaufwand und der für die Verarbeitung notwendigen Rechenleistung. Der größte Kostenfaktor ist die Arbeitskraft, die in Form von Datenexperten und -expertinnen sowie Technikern und Technikerinnen zur Entwicklung eines Machine-Learning-Modells notwendig ist. Je mehr Menschen sich um das Training, die Überwachung und Adaptierung der Algorithmen kümmern, desto stärker wird ein Machine-Learning-Modell werden. Ein anderer relevanter Kostenfaktor ist die Hardware, die in Form von Datenspeicher und Rechenleistung ausschlaggebend für den Erfolg eines Machine-Learning-Programms ist.

Amazon Web Services bietet eine Plattform zur Erstellung von Machine-Learning-Modellen an und nutzt hierfür eine Kostentabelle, die einerseits die Dauer der Trainingsläufe sowie anderseits die Anzahl an Berechnungen berücksichtigt.

Welche Gefahren birgt Machine Learning?

Eines der größten Probleme bei Machine Learning ist der sogenannte "bias", die Verzerrung aufgrund von Trainingsdaten. Ein Machine-Learning-Modell ist immer nur so gut wie die Daten, mit denen es trainiert wurde. Finden sich also im Trainingsdatensatz Vorurteile oder Tendenzen, so färben diese auch auf das Programm ab. Besonders problematisch wird es, wenn die Datensätze rassistische oder sexistische Vorurteile beinhalten, die von der Maschine unreflektiert internalisiert werden. Es gibt einige Beispiele, bei denen Algorithmen zur Gesichtserkennung Gesichter mit dunklerer Hautfarbe weniger gut erkennen, weil sie mit überwiegend weißen Menschen trainiert worden sind. Auch Schönheits-KIs, die Fotos verbessern sollen, zeigen oft Anzeichen einer sexistischen Tendenz: Weibliche Gesichter werden stärker bearbeitet und "verbessert" als männliche, an denen oft weniger verändert wird. In Österreich sorgte der Algorithmus des AMS für Kritik, weil er Frauen, Mütter, Senioren und Seniorinnen sowie Menschen mit Behinderungen deutlich schlechter bewertete und weniger fördern wollte.

Was versteht man unter Deep-Learning?

Deep-Learning oder Tiefes Lernen ist ein Teilgebiet von Machine Learning. Mit Hilfe sogenannter Künstlicher Neuronaler Netzwerke (Artificial Neural Networks) imitiert das Modell die Funktionsweise des menschlichen Gehirns. Deep-Learning eignet sich vor allem bei sehr großen Datenmengen (Big Data) und hochkomplizierten Aufgaben.

Die Idee für Deep-Learning existiert laut "ibm.com" schon seit der Mitte des 20. Jahrhunderts. Die notwendige Rechenleistung ist aufgrund der komplexen Architektur der Algorithmen allerdings enorm. Erst in den 2010er Jahren hat der Fortschritt im Bereich der Computertechnologie, KI und Big Data für einen regelrechten Hype um Deep-Learning gesorgt. Heute ist es eine der wichtigsten KI-Technologien und spielt vor allem bei Bild- und Sprachverarbeitungsprogrammen eine zentrale Rolle.

Was sind künstliche neuronale Netzwerke?

Deep-Learning beruht auf künstlichen neuronalen Netzwerken. Das Modell simuliert einzelne Neuronen, die mit anderen Neuronen in Verbindung stehen und Informationen austauschen. Zwischen dem Input und dem Output liegen mehrere versteckte neuronale Schichten (hidden layers), durch die Daten hindurchfließen, analysiert und verarbeitet werden, um so einen genaueren Output zu generieren. Soll das Programm etwa eine Rose erkennen, so stellt es vielleicht in einer ersten Schicht fest, dass ein bestimmtes Bild eine Blume darstellt. Dann wird diese Information an eine zweite Schicht weitergeleitet, in der das Modell feststellt, dass es eine rote Blume ist. Diese Information wird dann in einer dritten Schicht weiter konkretisiert und am Ende steht die korrekte Ausgabe einer Rose. Das ist natürlich sehr vereinfacht dargestellt, aber ungefähr so funktionieren die verschiedenen Ebenen.

Ab drei versteckten neuronalen Schichten spricht man von Deep-Learning. Was genau zwischen den Schichten vorgeht, ist aber meistens nicht klar. Welche Verzweigungen und Schritte zwischen dem Input und dem Output genommen werden, kann im Nachhinein nicht mehr nachverfolgt werden. Das Programm optimiert seine Vorhersagen jedenfalls immer weiter, um immer bessere Ergebnisse zu liefern.