Wichtige Neuerungen von Alexa
David Wulf: Hallo Philipp. Was sind aus deiner Sicht die wichtigsten neuen Funktionen, welche Alexa in 2023 bekommen hat?
Philipp Berger: Da fallen mir ein paar spannende Funktionen ein, wie beispielsweise Adaptives Zuhören. Wenn Kund:innen diese Funktion einstellen, bleibt Alexa nach dem Aktivierungswort länger aktiv, so dass bestimmte Nutzergruppen, die Schwierigkeiten bei der Artikulation haben, mehr Zeit erhalten mit Alexa zu interagieren. Ein weiteres Highlight für mich ist die Funktion Untertitel für Anrufe: Mit dieser Funktion können Kund:innen auf Echo Show-Geräten Untertitel für Alexa-Sprach- und Videoanrufe und Drop Ins nahezu in Echtzeit sehen. Sie können außerdem die Sprache ändern, sodass damit Alexa-Anrufe sogar übersetzt werden können. Außerdem freue ich mich als Smart Home-Liebhaber über das neue Design der Alexa-App und unsere Erweiterung für die Unterstützung des Matter-Standards.
Alexa im Zusammenspiel mit künstlicher Intelligenz
David Wulf: Mit ChatGPT gibt es seit November letzten Jahres eine sehr bekannte KI-Anwendung. Wie siehst du Ähnlichkeiten als auch Unterschiede oder gar Konkurrenz zwischen Alexa und ChatGPT?
Philipp Berger: Amazon nutzt maschinelles Lernen und KI seit mehr als 25 Jahren. Bei Alexa haben wir haben ein umfangreiches Sprachmodell namens Alexa Teacher Model (Alexa TM) entwickelt, das in den maschinellen Lernsystemen hinter Alexa umfassend genutzt wird. Dazu gehören die Erzeugung synthetischer Daten für das Modelltraining, die Nutzung von Trainingsdaten in einer Sprache zur Verbesserung der Leistung in allen Sprachen und die Entwicklung benutzerfreundlicher Tools für Alexa-Entwickler:innen.
Ein großer Unterschied besteht darin, dass Alexa kein webbasierter Text-Chatbot ist, sondern eine persönliche KI, die täglich von Millionen Menschen in Deutschland in den Bereichen Musik, Smart Home, Information und Shopping genutzt wird. Kund:innen können dabei auf verschiedene Gerätetypen, wie beispielsweise unsere Echo-Produktfamilie, zurückgreifen und Aktionen durch Sprache, Berührung oder Gesten auslösen. Die Fähigkeit von Alexa, auf der Grundlage von Live-Ereignissen, wie beispielsweise dem Spielstand eines Fußballsspiels, sachliche und aktuelle Antworten zu geben, ist zudem eine außergewöhnliche KI-Leistung - und erfordert modernste Technologie. ChatGPT hingegen wird mit Daten bis zu einem bestimmten Zeitpunkt trainiert und hat kein Wissen über Ereignisse danach. Ein weiterer Punkt in diesem Zusammenhang ist unser Bestreben im Bereich „Ambient Intelligence“, also der Technologie, die im Hintergrund arbeitet, um das Leben der Kund:innen sinnvoll zu vereinfachen und zu verbessern.
David Wulf: Hat ChatGPT die Art und Weise wie Nutzer mit Alexa umgehen oder was sie von ihr erwarten verändert und wenn ja, inwiefern?
Philipp Berger: Es ist unwahrscheinlich, dass unsere Kund:innen Alexa bitten, einen Codeschnipsel oder einen Text zu schreiben, aber sie erwarten von Alexa, dass es die gewünschte Musik abspielt, die benötigten Produkte kauft, Smart-Home-Geräte steuert und sachliche, aktuelle Informationen liefert. Dies sind Dinge, die die einzigartigen Fähigkeiten einer universellen KI beinhalten, und Bereiche, in denen LLMs (noch) nicht den gleichen Nutzen bieten können. Ich denke, dass die weitere Entwicklung von LLMs ein wichtiger Schritt ist, um KI für alle nützlicher zu machen, und wir arbeiten daran, dass diese Technologie eine zunehmende Rolle in unseren Produkten und Dienstleistungen spielt.
Künstliche Intelligenz und ihre Auswirkungen
David Wulf: Warum dauert es bis Anfang nächsten Jahres, bis wir generative KI-Funktionen bei Alexa sehen, zumindest in den USA? Wann können wir in Deutschland damit rechnen?
Philipp Berger: Sogenannte Large Language Models (LLMs) haben im Allgemeinen einige schwerwiegende Einschränkungen, wie z. B. Halluzinationen, daher müssen wir weiter in Forschung, Technik und Design investieren, um sie für alle nützlich und sicher zu machen. Wir freuen uns auf den bevorstehenden Start in den USA, können zum jetzigen Zeitpunkt jedoch keine Aussage zum Start in Deutschland machen.
David Wulf: Welche Neuerungen plant Amazon in Bezug auf generative KI-Funktionen für Alexa?
Philipp Berger: Während unseres Events im September 2023 haben wir einen Ausblick gegeben, wie wir auf Basis von generativer KI das Alexa-Erlebnis für unsere Kund:innen optimieren und beispielsweise die Konversationsfähigkeiten erweitern werden.
David Wulf: Welche Auswirkungen haben diese neuen KI-Funktionen auf den Datenschutz? Wie adressiert Amazon diese?
Philipp Berger: Der Datenschutz ist die Grundlage dafür, wie wir jedes Gerät, jede Funktion und jedes Erlebnis entwickeln und bereitstellen, und wir arbeiten jeden Tag daran, die Daten unserer Kund:innen zu schützen, Transparenz zu schaffen und ihnen die Kontrolle zu geben. Das Vertrauen unserer Kund:innen haben wir uns hart erarbeitet und arbeiten jeden Tag daran, es zu erhalten. Wir werden weiterhin daran arbeiten, unseren Kund:innen noch mehr Kontrolle und Transparenz über ihr Erlebnis zu geben und die Sicherheit unserer Geräte weiter zu verbessern.
David Wulf: Kommt für Amazon eine werbefinanzierte Alexa-Variante in Frage?
Philipp Berger: Werbung ist heute in einigen Alexa-Erlebnissen enthalten, hauptsächlich um den Zugang zu kostenlosen Premium-Inhalten zu ermöglichen – wie werbegestützte Musik- und Radio-Streams - oder um Kund:innen zu helfen, neue Inhalte oder Produkte zu entdecken. Wir legen die Messlatte für das Alexa-Erlebnis hoch und werden Erfahrungen wie diese auf der Grundlage des Feedbacks von Kund:innen weiterentwickeln.
Ausblick und Highlights
David Wulf: Abgesehen von neuen KI-Funktionen, was sind konkrete Themen, die ihr euch für Alexa in 2024 noch vorgenommen habt?
Philipp Berger: Wir bitten an dieser Stelle um Verständnis, dass wir unsere Roadmap für 2024 nicht teilen können. Du kannst aber sicher sein, dass wir innovativ für unsere Kund:innen bleiben und weiter daran arbeiten, das Alexa-Erlebnis zu optimieren.
David Wulf: Was war für dein persönliches Highlight in diesem Jahr in Zusammenhang mit Alexa?
Philipp Berger: Mein ganz persönliches Highlight ist die Zusammenarbeit im Rahmen von „Alexa für Alle“, in dem wir gemeinsam mit Partnern wie dem Deutschen Blinden- und Sehbehindertenverband (DBSV), dem Deutschen Roten Kreuz, der Deutschen Alzheimer Gesellschaft e.V. und der IFB-Stiftung daran arbeiten, Sprachtechnologie weiterzuentwickeln und konkrete Lösungen auf den Weg zu bringen, um bestimmte Nutzergruppen bei der selbstständigen Bewältigung ihres Alltags zu unterstützen. Das Feedback dieser Organisationen ist überwältigend und zeigt, wie digitale und somit soziale Teilhabe für diese Nutzer:innen durch Sprachtechnologie verbessert oder überhaupt erst ermöglicht werden kann.
David Wulf: Vielen Dank für das ausführliche Gespräch!
Die mit * gekennzeichneten Links sind sogenannte Affiliate Links. Kommt über einen solchen Link ein Einkauf zustande, werden wir mit einer Provision beteiligt. Für Sie entstehen dabei keine Mehrkosten.
Wir haben Kooperationen mit verschiedenen Partnern. Unter anderem verdienen wir als Amazon-Partner an qualifizierten Verkäufen.