Beitrag vom 02.05.2025

Der Schlüssel zum erfolgreichen Einsatz von KI ist ihre Evaluierung


Teaser

Martin Potthast ist Inhaber des hessian.AI-Lehrstuhls für Deep Semantic Learning an der Universität Kassel. Seine Forschung konzentriert sich auf Sprachtechnologien, Suchmaschinen und die Analyse und Synthese von Informationen. Martin Potthast trägt zu den Forschungsbereichen Information Retrieval, Natural Language Processing und künstliche Intelligenz bei.

Er studierte Informatik an der Universität Paderborn (2001-2006) und promovierte im Dezember 2011 erfolgreich an der Bauhaus-Universität Weimar, wo er anschließend als Postdoktorand am Digital Bauhaus Lab arbeitete. Im Oktober 2017 wurde er an der Universität Leipzig zum Juniorprofessor und im Oktober 2023 in Vollendung seines Tenure Tracks zum ordentlichen Professor ernannt. Herr Potthast ist Gründungsmitglied und Vorstandsmitglied des ScaDS.AI Center for Scalable Data Analytics and Artificial Intelligence. Im April 2024 wurde er zum hessian.AI-Professor für Deep Semantic Learning an die Universität Kassel berufen.

Das Interview führte Gabriele Hennemuth.

 

Sie haben im April die über hessian.AI finanzierte Professur „Deep Semantic Learning“ angetreten. An welchen Forschungsfragen werden Sie arbeiten?


Meine Arbeitsgruppe betreibt Grundlagen- und angewandte Forschung mit dem Ziel, intelligente Informationssysteme zu entwickeln. Wir arbeiten an der Schnittstelle der Verarbeitung natürlicher Sprache und dem Information Retrieval und konzentrieren uns auf die gesellschaftlichen Herausforderungen in Bezug auf Qualität und Vertrauenswürdigkeit von online erhältlichen Informationen.

Ein aktueller Forschungsschwerpunkt ist die durch Sprachmodelle wie GPT-4 ausgelöste Renaissance der Websuche und Suchmaschi-nentechnologie im Allgemeinen. Systeme, die Suchende mit relevanten Informationen versorgen, erhalten durch Sprachmodelle eine neuartige Schnittstelle, die eine zielgerichtete Interaktion und Diskussion ermöglicht, statt Suchanfragen in Form von Schlüsselwörtern zu formulieren, für die die sprichwörtlichen "10 blauen Links" zurückgegeben werden. Chatgetriebene Suchmaschinen sollen Recherchearbeit übernehmen und eine übersichtliche Zusammenfassung synthetisieren, die im Idealfall die Suchanfrage bereits beantwortet. Dennoch sollen Referenzen auf Quellen mitgeliefert werden, in denen man Aussagen im generierten Text nachvollziehen kann. Grundsätzliche Fragen, die wir in diesem Zusammenhang aufwerfen, betreffen die Qualität der generierten Antworten, die Effizienz, mit der man sie generieren kann, und unter welchen Umständen diese neue Gattung den herkömmlichen Suchmaschinen überlegen oder unterlegen ist.

Weitere Forschungen drehen sich u.a. um die folgenden Fragen: Können Sprachmodelle unter Einschränkungen der Datenverfügbarkeit trainiert werden? Können von Maschinen generierte Texte von den von Menschen geschriebenen unterschieden werden? Kann vorhergesagt werden, ob ein Text emotionale Reaktionen bei seinen Leserinnen und Lesern
hervorruft, um ihn gegebenenfalls mit Triggerwarnungen zu versehen? Werden Sprachmodelle in Zukunft zur Einstreuung von Werbung in Texten verwendet und wie lässt sich das erkennen? Wie kann die Bilderzeugung für kreative Aufgaben mit Hilfe von Text-zu-Bild-Modellen besser unterstützt werden?

Was sind aus Ihrer Sicht die wichtigsten Herausforderungen beim Einsatz von KI?

Der Schlüssel zum erfolgreichen Einsatz von KI ist ihre Evaluierung. Ohne eine klare Idee davon, welche Aufgabe von einer KI gelöst werden soll, und wie man ihren Erfolg dabei misst, ist die Entwicklung und Verbesserung nützlicher KIs nicht denkbar. Dabei lohnt es sich, spezifisch zu werden und die zu lösende Aufgabe eng abzustecken. Das erleichtert auch die Erhebung und die manuelle Auszeichnung von Daten, die geeignet sind, eine trainierte KI auf die Probe zu stellen.

Der Einsatz generativer KI-Verfahren wie Sprachmodelle ist gegenwärtig von großem Interesse, und das Potential dieser jungen Technologie ist unbestreitbar groß. Der häufige Wunsch nach einer One-Size-Fits-All-Lösung ist gerade hier jedoch eher irreführend, denn der Teufel steckt im Detail. Die Entwicklung spezialisierter KI-Verfahren und ihre verlässliche Kombination mit herkömmlichen Ansätzen sind eine weitere Herausforderung.

Weiterhin denke ich, dass die dem Training einer KI zugrundeliegenden Daten und ihre Qualität von entscheidender Bedeutung für die Qualität der durch KI erzeugten Resultate sind. Neben der Evaluierung und Spezialisierung der entwickelten Lösungen sollte großer Wert auf die Bereinigung der Daten gelegt werden.

Zuletzt ist die vielleicht größte und langwierigste Herausforderung beim Einsatz von KI, Verständnis für die Fähigkeiten und die Grenzen einer KI-basierten Lösung bei Endbenutzerinnen und Endbenutzern zu wecken.

Wo sehen Sie Potential für Start-ups?

KIs werden unseren Alltag im Beruf wie im Privaten beeinflussen. Ich sehe Potential sowohl im Unterhaltungssektor, in der Bewäl-tigung alltäglicher Aufgaben zu Hause und unterwegs, aber auch im professionellen Umfeld. Technologisch wird es in Zukunft darauf ankommen, die oben genannten Herausforderungen zu bewältigen und Fortschritte bei der Effizienz von Sprachmodellen im Speziellen und generativer KI im Allgemeinen zu machen, und sie gleichzeitig mit weniger spezialisierten Trainingsdaten auf bestimmte Anwendungsfälle zuzuschneiden.

 

Der Science Park unterstützt das bundesweite Modellprojekt AI Startup Rising von hessian.AI mit seiner Fachexpertise und bietet verschiedene Formate, wie z.B. die Masterclasses, Open Innovation Challenge an.

Mehr Infos unter: hessian.ai