[KI-Lexikon] Darum ist das Trainieren von KI-Modellen essentiell

geschätzter Leseaufwand: 2 Minuten

Eine KI-Anwendung wie ChatGPT oder andere bekannte KI-Applikationen leben vor allem von zwei wesentlichen Zutaten: Dem Programmieralgorithmus selbst und den Daten, mit denen das zugehörige KI-Modell anschließend gefüttert wird. Um den Algorithmus kümmern sich Software-Entwickler, die der KI-Lösung das gewünschte Gerüst verpassen. Denn nur wenn ein Rädchen ins andere greift, kann die KI-Software genau die Ergebnisse liefern, die man von ihr erwartet. Und das erfordert eine Menge an Planung, Programmierung, Testreihen und vieles mehr.

Doch ohne die passenden Daten ist solch eine Software vor allem eins: unbrauchbar. Denn ohne die richtigen Bilder und andere Trainingsdaten kann solch eine Anwendung einen Baum nicht von einem Strauch unterscheiden. Und das ist es ja schließlich, was eine KI-Lösung liefern soll: Die möglichst richtigen Antworten auf explizite oder implizite Fragen. Das ist der Moment, in dem die Disziplin „Trainieren von KI-Modellen“ ins Spiel kommt. Doch wie sieht dabei eine bestmögliche Herangehensweise aus?

Überwachtes und unüberwachtes Trainieren, das ist hier die Frage

Nun, hierfür muss man erst einmal verstehen, dass es zwei wesentliche Unterschiede gibt, was das Trainieren von KI-Modellen betrifft. So gibt es nämlich überwachtes und unüberwachtes Trainieren von KI-Anwendungen. Beim überwachten Ansatz füttert man das Modell mit Eingabe- und Ausgabedaten, welche die geplanten und gewünschten Ergebnissen repräsentieren. Dabei teilt man dem Modell genau mit, welche Eingabedaten zu welchen Ausgabedaten führen.

So soll die KI-Lösung beispielsweise unterscheiden können zwischen fehlerlosen und fehlerbehafteten Bauteilen wie einer Glühbirne. Eine Kontrollinstanz überprüft dann beim Ausführen der KI-Software, ob die Trainingsergebnisse den Erwartungen entsprechen. Tun sie das nicht, ist entweder der Progammcode fehlerbehaftet – ode aber die Trainingsdaten, sprich die vorhandenen Bilder, waren nicht von der erforderlichen Qualität.

Beim unüberwachten Trainieren von KI-Daten wiederum sind die Trainingsdaten nicht gekennzeichnet. Das Modell erhält also lediglich Eingabedaten, aber keine Ausgaben. Ein geeigneter Algorithmus trainiert sich dann quasi selbst und lernt die Trainingsdaten anhand ähnlicher Eigenschaften in Gruppen einzuteilen. Dies wird auch als Clustering bezeichnet.

KI-Modelle erfordern rechenstarke Systeme – im Datacenter oder in der Cloud

Das Trainieren von KI-Modellen kann sehr komplex und rechenintensiv sein. Hierfür kommen leistungsfähige Systeme zum Einsatz, die oft im eigenen Rechenzentrum stehen. Da dies aber meist sehr teuer ist (weil KI-Trainingsessions kostenintensive Hardwarekomponenten erfordern), gehen viele KI-Entwickler mehr und mehr dazu über, ihre KI-Modelle in der Cloud zu trainieren. Hierfür bieten Google, Microsoft und Co. spezialisierte Instanzen zum Mieten an, die genau das beherrschen: Das Trainieren von KI-Modellen.

Weitere KI-Lexikon-Begriffe

„D“ wie Deep Learning

„G“ wie Generative AI

„G“ wie GPU

„I“ wie Inferencing

„L“ wie Large Language Model

„L“ wie Long Short-Term Memory (LSTM)

„M“ wie Machine Learning

„N“ wie Natural Language Processing

„N“ wie NPU (Neural Processing Unit)

„N“ wie Neuronale Netze

„O“ wie OpenVINO

„T“ wie TensorFlow

 

Weitere Beiträge rund um das Thema Trainieren von KI-Modellen

Technovation Girls Germany: KI-Modelle trainieren

Clickworker: So werden KI-Systeme trainiert

Mindsquare: In 5 Schritten zum KI-Modell

MoinAI: So werden Chatbots trainiert

Schreibe einen Kommentar