MEINUNG: Als ich durch die Hallen des MWC 2023 wanderte, hatte ich die Gelegenheit, das AR-Headset-Referenzdesign von Qualcomm in die Hand zu nehmen. Während sich die Hardware noch in der Entwicklung befindet und hauptsächlich auf Hersteller und Entwickler ausgerichtet ist, führte die Demo etwas ein, an das ich vorher nie gedacht hatte: die Nutzung der offenen KI-Plattform ChatGPT.

Qualcomm wird eigentlich keine AR-Headsets für Verbraucher produzieren, aber das Unternehmen hat in den letzten Jahren einige AR-Headset-Referenzdesigns veröffentlicht, die im Wesentlichen als Blaupause für andere Unternehmen dienen, um ihre eigenen AR-Headsets zu entwickeln.

Sie werden langsam kompakter und weniger wie die sperrige Microsoft HoloLens, aber sie funktionieren im Wesentlichen auf die gleiche Weise und erweitern die reale Welt mit virtuellen Elementen.

Hersteller beginnen bereits, diese Technologie zu nutzen – die Nreal Air ist ein gutes Beispiel für eine frühe AR-Brille –, aber es ist noch ein langer Weg, bis wir in einer vollständig erweiterten Zukunft mit schlanken AR-Brillen stehen. Das von mir verwendete Headset benötigt zum Beispiel noch eine kabelgebundene Verbindung zu einem Smartphone, um alle Daten des Headsets zu verarbeiten.

Das hat sich mit dem neuesten AR-Viewer-Konzept von Qualcomm geändert, das auf dem Snapdragon XR2-Chipsatz basiert, der Wi-Fi 7 für superschnelle Konnektivität verwendet – Qualcomm behauptet weniger als 10 ms Latenz – aber aufgrund der schieren Menge an drahtlosen Geräten auf der Messe war dies nicht der Fall möglich, es zu demonstrieren.

Trotzdem konnte ich etwas Zeit mit dem etwas älteren Referenz-Headset Snapdragon XR1 gewinnen, und mir wurde ein neuer Echtzeit-Übersetzungs- und Transkriptionsdienst präsentiert, der vollständig von ChatGPT unterstützt wird.

ChatGPT ist derzeit das heiße Thema in der Technik, da die offene KI-Plattform scheinbar alles kann, von der Generierung von Codezeilen zur Beschleunigung der App-Entwicklung bis hin zur Unterstützung von Kindern bei den Hausaufgaben. Es gibt sogar eine Geschichte über ChatGPT Bestehen von Step 1 der Medical Licensing Prüfung in den USAwas zeigt, wie beeindruckend die Hardware ist.

Vor diesem Hintergrund scheint ChatGPT der ideale Kandidat für Echtzeit-Transkription und -Übersetzung mit Schwerpunkt auf der Modellierung natürlicher Sprache zu sein.

Bildnachweis (vertrauenswürdige Bewertungen)

Das Headset verwendete ein dediziertes Mikrofon, um Audio aus dem (sehr lauten) Demobereich aufzunehmen, und transkribierte nahezu perfekt, was auf der Brille gesagt wurde, und es ist intelligent genug, um mehrere Sprecher zu erkennen und die Transkription zwischen ihnen aufzuteilen, wobei Sprecher 0, Sprecher 1 und so weiter.

Es gibt immer noch eine leichte Verzögerung, während die API ihre Arbeit erledigt, aber innerhalb von ein oder zwei Sekunden sah ich, was effektiv Live-Untertitel meiner Dreier-Konversation waren.

Das mag auf den ersten Blick ein bisschen effekthascherisch klingen, aber es könnte nicht nur für die Übersetzung ein echter Wendepunkt sein – stellen Sie sich vor, Sie könnten mit jemandem in einer anderen Sprache sprechen, indem Sie nur eine Brille verwenden – sondern, was wohl noch wichtiger ist, eine echte ein Segen für Schwerhörige. Die Fähigkeit, effektiv in Echtzeit zu transkribieren, könnte für Schwerhörige befreiend sein, insbesondere wenn sie sich mit jemandem unterhalten, der die Gebärdensprache nicht fließend beherrscht.

Natürlich ist es noch ein weiter Weg, bis wir alle AR-Headsets mit ChatGPT-fähigen Transkriptions- und Übersetzungsdiensten tragen, aber es ist eine verlockende Vorschau auf das, was wir wirklich erwarten sollten, was wir in den nächsten Jahren auf den Markt bringen werden.