Prozesse hinter dem Training von Künstlicher Intelligenz
Die Experten von link|that | YouCon EDV Dienstleistungs GmbH aus Wien erläutern die Prozesse hinter dem Training von Künstlicher Intelligenz, denn ChatGPT macht klar, wie gefährlich der unreflektierte Umgang mit KI ist und welche Qualitätsansprüche wir an KI stellen sollten.
Kein Tag vergeht ohne Schlagzeilen von und über ChatGPT: Vor einigen Tagen wurde bekannt, dass der Textgenerator von OpenAI bei seiner Entwicklung zu kenianischen Billigarbeitern gegriffen hat. Für weniger als 2 US-Dollar pro Stunde wurden Mitarbeiter der ostafrikanischen Firma Sama beauftragt, um die Künstliche Intelligenz zu trainieren, so ein Bericht von “Time”.
Reflektierter Umgang mit KI-Inhalten
Künstliche Intelligenz ist von menschlichem Input abhängig. Sie muss manuell mit Daten gefüttert werden, um zu lernen. Doch wie steht es um die Qualität bei der Entwicklung von KI, wenn dieses Training an Billiglohnkräfte abgegeben wird?
„Das Wissen der KI wird vor allem aufgrund der zur Verfügung gestellten Labels generiert. Die Personen, die die Daten und in weiterer Folge die Labels aufbereiten, sind demnach die Lehrerinnen und Lehrer dieser.“, so Ernst Nusterer, CEO der Wiener KI-Firma link|that. Der Prozess wird, wie im Fall von OpenAI, oft ausgelagert und für einen definierten Stundensatz bei Labeling-Firmen erledigt. „Die Entscheidungen einer KI sehen wir leichtsinnig gerne als objektiv an. Das ist sie aber keineswegs, und dieser Irrtum ist brandgefährlich.“
Labeling und Qualitätsansprüche: Eine neue Herausforderung
Bei link|that in Wien werden seit über 5 Jahren KI Lösungen hausintern erarbeit. Dabei ist das Labeling und die hohen Ansprüche des Trainings zentrales Thema. Hier ist ein eigenes Team damit beauftragt, zu entscheiden was der KI beigebracht wird. Oberste Priorität hat die Qualität der verwendeten Daten, so Tina Waldner vom Labeling-Team: „Unklare Daten, von denen wir auch nur vermuten, dass sie beim Training ein Problem darstellen könnten, werden erst gar nicht in den Datenpool aufgenommen. Ganz nach dem Motto: Lieber weniger, aber dafür gute Daten.“
Nicht nur die Qualität des Trainingsmaterials ist entscheidend. Für das Labeling ist vor allem auch Konzentration beim Team gefragt: „Wir achten auf genaues und präzises Arbeiten, ebenso wichtig ist die interne Absprache. Wir müssen immer am selben Stand sein, um gleich arbeiten zu können. Ein sehr wichtiger Punkt ist der ständige Austausch mit dem Entwicklerteam.“, so Waldner weiter.
Bei der schnell fortschreitenden Entwicklung von KI-Software muss künftig auch der Prozess im Hintergrund und dessen Qualität transparenter gemacht werden. Hier spielt der Mensch eine tragende Rolle. Denn letztendlich entscheidet das Training, wie gut eine Software ist, welchen Mehrwert sie bietet, und ob wir den Ergebnissen wirklich vertrauen können.
Kommentare