Körber-Preis für deutsche KI-Forscherin

Cordelia Schmid erhält den mit einer Million Euro dotierten Körber-Preis für die Europäische Wissenschaft

Die deutsche Informatikerin Cordelia Schmid ist Pionierin der computergestützten Bildverarbeitung. Schmid entwickelte bahnbrechende neue Verfahren, die Computern das inhaltliche Verstehen von Bildern ermöglichen. Dank ihrer Algorithmen kann Künstliche Intelligenz (KI) in Datenbanken mit Millionen Bildern in Sekundenbruchteilen Motive und Objekte auffinden. Aktuell forscht die Preisträgerin an Systemen, die Videos semantisch interpretieren und sogar künftige Handlungen vorhersagen können. Zu ihren Zielen zählt die Entwicklung von Robotern, die auf Sprachkommandos reagieren und unter anderem als intelligente Assistenten in Krankenhäusern oder in der Altenpflege eingesetzt werden können.

Künstliche Intelligenz (KI) hat sich in den letzten zehn Jahren geradezu explosiv entwickelt. Im November 2022 präsentierte die US-Firma OpenAI ihren Chat-Bot ChatGPT, der Fragen versteht und elaborierte Antworten liefert. Spätestens seitdem beherrscht das Thema KI die Medien. Der Tenor schwankt zwischen überschießender Hoffnung und Warnungen vor Missbrauch. Sicher ist, dass KI das Zusammenleben der Menschen und künftige wirtschaftliche Entwicklungen entscheidend prägen wird.

Cordelia Schmid ist eine der wichtigsten Wegbereiter:innen der KI-Forschung. Bereits in ihrer 1996 erschienenen Doktorarbeit entwickelte sie grundlegend neue Verfahren der Bilderkennung, die dem Computer-Sehen zu enormen Durchbrüchen verhalfen. Auch in den Folgejahren gelang es ihr, leistungsstarke neue „Computer Vision“-Algorithmen zu entwickeln, die sich als Standard etablierten. Heute forscht Cordelia Schmid unter anderem an KI-Systemen, die anhand von Bild- und Ton-Informationen die Inhalte von Videos verstehen und kommende Aktionen vorhersagen können. Die Technologie ist ein wichtiger Zwischenschritt zur Entwicklung künftiger Assistenz-Roboter für Krankenhäuser und Altenheime.

Schmid schloss ihr Informatikstudium am Karlsruher Institut für Technologie 1992 ab. 1996 promovierte sie am Institut National Polytechnique Grenoble. Nach einer Tätigkeit als Postdoc am britischen Oxford Robotics Institute forschte sie ab 1997 am französischen National Institute for Research in Digital Science and Technology (Inria), wo sie sich 2001 habilitierte. Seit 2004 ist sie Forschungsdirektorin dieses Instituts. Nebenher war Schmid von 2004 bis 2012 Mitherausgeberin und von 2013 bis 2018 Chefredakteurin der Fachzeitschrift „International Journal of Computer Vision“. Außerdem ist Schmid seit 2018 in Teilzeit für Google Research tätig.

KI-Forschung begann bereits in den 1950er Jahren in USA. Ein Team um den Informatiker Frank Rosenblatt konstruierte 1957 ein Netz aus künstlichen Neuronen, das bereits einfache logische Operationen ausführen konnte. Es war der Urtyp der Künstlichen Neuronalen Netze (KNN), auf denen fast alle heutigen KI-Anwendungen basieren. Erste größere Erfolge erreichten KNN in den 1980er Jahren. Die Netze konnten beispielsweise darauf trainiert werden, Bilder von Äpfeln und Birnen zu unterscheiden.

Als Cordelia Schmid 1996 ihre herausragende Doktorarbeit schrieb, steckte die Bildklassifizierung mittels Computern allerdings noch in ihren Anfängen: „Die damals gebräuchlichen Systeme konnten nur einfache geometrische Formen wie Kreise, Dreiecke oder Quadrate erkennen, und dies auch nur bei gleichförmigem Hintergrund“, erklärt Schmid. Sie verbesserte die Erkennung erheblich, indem sie die Systeme markante Bildpunkte finden ließ. Diese „lokalen Bilddeskriptoren“ repräsentieren die räumlichen Dimensionen der gezeigten Objekte. Damit waren die Systeme in der Lage, Objekte auch dann wiederzuerkennen, wenn diese aus einer anderen Perspektive oder teilweise verdeckt gezeigt werden. Schmid schuf so die Grundlagen dafür, dass wir heute durch Suchmaschinen aus Millionen Bildern im Internet in Sekundenschnelle die gewünschten finden.

Nach der Jahrtausendwende machte die automatische Bilderkennung große Fortschritte und brachte viele neuartige Ansätze hervor. In dieser Zeit konzipierte Cordelia Schmid „Benchmark“-Tests, mit denen aus der Vielzahl der neuen Methoden die effektivsten ermittelt werden konnten.

Cordelia Schmid forscht aktuell an Vision-Language-Modellen, unter anderem an dem System „VideoBert“. VideoBert kann unüberwacht Video-Anleitungen – etwa Kochvideos – aus dem Internet analysieren. Das KI-System hat unter anderem die Aufgabe, sich selbst beizubringen, kommende Aktionen in den Videos vorherzusagen. VideoBert arbeitet „multimodal“, das heißt, es untersucht gleichzeitig die Bildsequenzen und die dazu gesprochenen Texte. Bei VideoBert bedient sich Schmid des Prinzips der Maskierung: Es werden Wörter oder Videosequenzen ausgelassen, die VideoBert anschließend erraten muss. Unüberwachtes Lernen hat den Vorteil, dass viele Tausende kostenlos im Internet zur Verfügung stehende Kochvideos für das Training verwendet werden können.

Nach dem Selbst-Training konnte VideoBert, wenn es in unbekannten Videos eine Schüssel mit Mehl und Kakao „sah“, vorhersagen, dass aus diesen Zutaten später ein Schokoladenkuchen gebacken wird, und passende Bilder des zu erwartenden Endprodukts generieren. „Kommende Versionen von VideoBert werden sogar in der Lage sein, aus gesehenen neuen Kochvideos Rezepte in Schriftform zu erstellen“, ergänzt Schmid. Auf der Grundlage dieses multimodalen Bild- und Sprachverstehens plant die Preisträgerin künftig auch die Entwicklung intelligenter Hilfsroboter für Krankenhäuser und Altenheime.

Mit den Mitteln der Körber-Stiftung will Cordelia Schmid unter anderem eine Art sehfähigen Konkurrenten für den Chatbot ChatGPT konzipieren. ChatGPT ist ein „tiefes“ KNN mit besonders vielen Schichten. Es beherrscht die Verarbeitung natürlicher Sprache und kann dank Training mit Abermillionen Daten aus dem Internet passende Antworten liefern. Schmid findet die Performance von ChatGPT „beeindruckend“, moniert aber, dass das „Modell nicht selbsterklärend ist, ein limitiertes Kontextfenster hat und nicht aus Erfahrung lernen kann“. Schmid will einen „wirklich intelligenten“ Bot entwickeln, der auch visuelle Informationen und 3D-Umgebungsdaten verarbeitet und sich später eigenständig in unbekannter Umgebung zurechtfinden kann.

Cordelia Schmid ist optimistisch: „Verantwortungsvoll entwickelt, hat KI das Potenzial, unsere Gesellschaft zu revolutionieren – so wie einst Dampfkraft und Elektrizität. KI kann helfen, einige der dringendsten Probleme der Welt zu lösen, von der Nachhaltigkeit bis zur Gesundheit. Ich persönlich bin begeistert von den Forschungsmöglichkeiten, die sich dadurch eröffnen.“

Der Körber-Preis für die Europäische Wissenschaft 2023 wird Cordelia Schmid am 8. September 2023 im Großen Festsaal des Hamburger Rathauses überreicht. Der mit einer Million Euro dotierte Körber-Preis zählt zu den weltweit höchstdotierten Forschungspreisen. Fünf Prozent der Preissumme sind für die Wissenschaftskommunikation zu verwenden. Die Körber-Stiftung zeichnet mit dem Körber-Preis seit 1985 jedes Jahr einen wichtigen Durchbruch in den Physical oder den Life Sciences in Europa aus. Prämiert werden exzellente und innovative Forschungsansätze mit hohem Anwendungspotenzial. Nach Verleihung des Körber-Preises erhielten bislang acht Preisträgerinnen und Preisträger den Nobelpreis.

Pressekontakt:
Körber-Stiftung
Inke Maria Horstmann
Pressereferentin
Telefon +49 40 80 81 92-207
horstmann@koerber-stiftung.de

Pressemeldung zum Download

  • alle Fotos: Marcus Gloger/Körber-Stiftung

Fotos zum Download (ZIP-Datei, 25 MB)