Ist der Hype um die neuen KI Sprachassistenten auf dem Smartphone berechtigt?

Ist der Hype um die neuen KI Sprachassistenten auf dem Smartphone berechtigt?
KI Sprachassistenten GPT4o und Project Astra

Die Einführung von KI-Sprachassistenten wie GPT4o und Project Astra, die Bild und Text verstehen und in Echtzeit mit Nutzern kommunizieren können, hat in der Smartphone-Welt für viel Aufsehen gesorgt. Doch ist der Hype berechtigt?

Das neue Modell von OpenAI GPT4o wurde einigen Entwicklern bereits zum Testen freigeschaltet und ist als Sprachassistent zum Beispiel über die ChatGPT App für iOS und Android verfügbar. In der App eingebettet kann es über die Kamera die Umgebung wahrnehmen und über Sprache mit Nutzer:innen kommunizieren, was beeindruckende Nutzungsszenarien ermöglicht.

Project Astra von Google wird noch etwas länger auf sich warten lassen. Da Project Astra direkt in Android eingebettet ist, wird es den entscheidenden Vorteil haben, den Kontext unterschiedlicher Apps zu kennen und vielfältigere Aufgaben auf Android übernehmen zu können wie Kalendereinträge, Erinnerungen oder Interaktionen mit Apps zu managen.

GPT4o erscheint dagegen stärker als Frage-Antwort Spielchen, um zu lernen, Fragen zu stellen oder Gespräche zu führen. Es sei denn OpenAI schlägt sich wie angekündigt auf die Seite von Apple. In dem Fall hätte GPT über Siri Zugriff auf den Screen des Nutzers und könnte noch viel gezielter Informationen unterschiedlicher Apps zusammenführen und über Siri Aufgaben in Apps erledigen.

Bei all dem Hype gibt es aber ein paar Punkte, die uns als App-Entwickler etwas skeptisch machen 🤔:

  • Skalierbarkeit: Die Anzahl möglicher Anfragen an OpenAI wird schon jetzt stark begrenzt. Wie soll das System bezahlbar bleiben, wenn plötzlich Millionen von iPhone Usern über Siri anfragen?
  • Datenschutz und Sicherheit: Wie viele Konversationen können iOS und Android lokal auf dem Gerät belassen und wie können die persönlichen Daten auf den Screens geschützt werden? Ein Thema, das bei den ebenfalls neu vorgestellten Copilot+ PCs von Microsoft immerhin in den Vordergrund gerückt wurde.
  • Schnittstellen und App-Integration: Wie stark können App-Entwickler selbst bestimmen, welche Informationen sie den Assistenten bereitstellen möchten? 🔒 Gibt es überhaupt noch eine Motivation Apps zu öffnen, wenn die Informationen schon über den Assistenten ausgeplaudert werden?

KI-Sprachassistenten auf dem Smartphone haben das Potenzial, die Interaktion mit unseren Geräten grundlegend zu verändern. In Bezug auf die oben angebrachten Bedenken wird es aber erst in ein paar Monaten, frühestens bei der WWDC von Apple am 10. Juni antworten geben.