OpenAI führt erweiterten Sprachmodus ein: FAQ und mehr

Twitter
LinkedIn
E-Mail
WhatsApp

OpenAI hat kürzlich eine spannende neue Funktion in der ChatGPT-App vorgestellt: den erweiterten Sprachmodus. Diese innovative Funktion, die derzeit in einer limitierten Alpha-Version für ausgewählte Nutzer verfügbar ist, ermöglicht natürlichere und interaktivere Gespräche in Echtzeit. In diesem Blogpost erfährst du alles Wichtige über den erweiterten Sprachmodus und findest Antworten auf häufig gestellte Fragen.

Was ist der erweiterte Sprachmodus?

Der erweiterte Sprachmodus in der ChatGPT-App von OpenAI bringt eine neue Dimension in die Sprachinteraktion. Die App erkennt Emotionen und nonverbale Hinweise, um ein flüssigeres und intuitiveres Gesprächserlebnis zu bieten. Diese Funktion ist aktuell nur in den iOS- und Android-Versionen der App verfügbar.

Systemanforderungen:

Android: App-Version 1.2024.206 oder später

iOS: App-Version 1.2024.206 oder später und iOS 16.4 oder später

Häufig gestellte Fragen (FAQ)

Wie weiß ich, ob ich Zugang zum erweiterten Sprachmodus habe?

Nutzer, die zur Alpha-Version eingeladen werden, erhalten eine E-Mail mit Anweisungen zur Nutzung des erweiterten Sprachmodus. Außerdem erscheint beim Öffnen der App ein Tooltip unten rechts, das zur Nutzung des erweiterten Sprachmodus einlädt.

Wie starte ich ein Gespräch?

Um ein Gespräch mit dem erweiterten Sprachmodus zu beginnen, wähle das Sprachsymbol unten rechts auf dem Bildschirm. Sobald das Gespräch beginnt, gelangt man zu einem Bildschirm, auf dem das Mikrofon stummgeschaltet oder aktiviert und das Gespräch beendet werden kann. Ein Wechsel zum Standard-Sprachmodus ist jederzeit möglich, indem oben auf dem Bildschirm „Erweitert“ ausgewählt wird.

Welche Nutzungslimits gelten für den erweiterten Sprachmodus?

Die Nutzung von Audioeingaben und -ausgaben im erweiterten Sprachmodus ist täglich begrenzt und die genauen Limits können sich ändern. Die App informiert die Nutzer, wenn noch 3 Minuten Audiozeit übrig sind. Nach Erreichen des Limits endet das Gespräch und es wird auf den Standard-Sprachmodus umgeschaltet.

Kann der erweiterte Sprachmodus auf Erinnerungen oder benutzerdefinierte Anweisungen zugreifen?

Der erweiterte Sprachmodus kann derzeit weder Erinnerungen erstellen noch auf vorherige Erinnerungen zugreifen und hat auch keinen Zugriff auf benutzerdefinierte Anweisungen.

Kann ein früheres Gespräch im erweiterten Sprachmodus fortgesetzt werden?

Gespräche im erweiterten Sprachmodus können in diesem Modus, per Text oder im Standard-Sprachmodus fortgesetzt werden. Da der erweiterte Sprachmodus noch keine Funktionen wie Erinnerungen und benutzerdefinierte Anweisungen unterstützt, können Gespräche im Text- oder Standard-Sprachmodus nicht im erweiterten Sprachmodus fortgesetzt werden.

Tipps zur Vermeidung von Unterbrechungen im erweiterten Sprachmodus?

Zur Vermeidung von Unterbrechungen wird die Nutzung von Kopfhörern empfohlen. Auf dem iPhone kann die Aktivierung des Mikrofons im Sprachisolationsmodus helfen. Dazu öffnet man das Kontrollzentrum, wählt den Mikromodus und schaltet auf Sprachisolierung um. Bei weiterhin bestehenden Problemen wird empfohlen, die App neu zu starten, die Lautstärke des Assistenten zu erhöhen oder in eine ruhigere Umgebung zu wechseln. Der erweiterte Sprachmodus ist noch nicht für die Nutzung mit In-Car-Bluetooth oder Freisprechanlagen optimiert.

Kann der erweiterte Sprachmodus mit GPTs genutzt werden?

Der erweiterte Sprachmodus ist derzeit noch nicht mit GPTs nutzbar.

Kann mit dem erweiterten Sprachmodus musikalische Inhalte erzeugt werden?

Um die Rechte der Urheber zu respektieren, hat OpenAI mehrere Maßnahmen ergriffen, einschließlich neuer Filter, die verhindern, dass der erweiterte Sprachmodus mit musikalischen Inhalten wie Gesang reagiert.

Werden Video- und Bildschirmfreigabe im Alpha-Programm verfügbar sein?

Video- und Bildschirmfreigabe sind derzeit noch nicht Teil des erweiterten Sprachmodus-Alpha, werden jedoch zu einem späteren Zeitpunkt verfügbar sein.

Wann wird der erweiterte Sprachmodus allgemein verfügbar sein?

OpenAI plant, allen Plus-Nutzern im Herbst Zugang zu gewähren. Die genauen Zeitpläne hängen davon ab, ob die hohen Sicherheits- und Zuverlässigkeitsstandards erfüllt werden. OpenAI arbeitet auch daran, die neuen Video- und Bildschirmfreigabe-Funktionen separat einzuführen und wird die Nutzer über den Zeitplan auf dem Laufenden halten.

Verliert man den Zugang zum erweiterten Sprachmodus, wenn man zu einem kostenlosen Konto wechselt?

Ja, der erweiterte Sprachmodus ist nur für eine begrenzte Anzahl von Nutzern mit Plus-Konten verfügbar.

Warum stimmen die Sprachtranskriptionen manchmal nicht mit dem Gespräch überein?

Erweiterte Sprachgespräche mit GPT-4o sind multimodal, was bedeutet, dass ein Audioaustausch zwischen dem Nutzer und dem Modell stattfindet. Daher kann es sein, dass die Transkription nicht immer perfekt mit dem ursprünglichen Gespräch übereinstimmt.

Werden Gespräche im erweiterten Sprachmodus zur Modellschulung verwendet?

Während der Alpha-Phase nutzt OpenAI Audiodaten aus Gesprächen im erweiterten Sprachmodus, um ihre Modelle zu trainieren, wenn die Nutzer ihre Audiodaten teilen. Nutzer können die Audio-Schulung deaktivieren, indem sie in den Datenschutzeinstellungen „Stimme für alle verbessern“ deaktivieren. Wenn diese Option nicht verfügbar ist, wurden keine Audiodaten geteilt und sie werden nicht zur Schulung der Modelle genutzt.

Beim Standard-Sprachmodus speichert OpenAI Audiodaten aus Sprachchats, anstatt sie nach der Transkription zu löschen, sofern die Nutzer sich für das Teilen der Audiodaten entschieden haben. OpenAI ergreift Maßnahmen, um die Menge an persönlichen Informationen in den zur Schulung genutzten Audiodaten zu reduzieren. Ein Team kann die Audiodaten überprüfen, die geteilt wurden.

Erfahre mehr darüber, wie Audiodaten geteilt werden können, um Sprachchats im Standard-Sprachmodus zu verbessern.

Fazit

Der erweiterte Sprachmodus von OpenAI bietet eine Vielzahl neuer Möglichkeiten für natürliche und interaktive Gespräche. Obwohl sich die Funktion noch in der Alpha-Phase befindet, zeigt sie bereits jetzt großes Potenzial. Bleib dran für weitere Updates und freue dich auf die vollständige Einführung dieses spannenden Features!

KI-Tools & News direkt in deinem Postfach!

Du möchtest immer informiert bleiben? Melde dich für unseren Newsletter an und bleibe mit 29.000 anderen KI-Enthusiasten up-to-date!
Kostenlos

Die neusten Tools aus meinem Verzeichnis

Mit dem Absenden eines Kommentars stimmst du unserer Datenschutzerklärung und der Speicherung von dir angegebener, personenbezogener Daten zu.

0 0 votes
Article Rating
Abonnieren
Benachrichtige mich bei
0 Comments
Inline Feedbacks
Alle Kommentare anzeigen
0
Was ist deine Meinung dazu? Hier kannst du kommentieren!x

Dein KI-Update Newsletter 🤖

Erfahre als erster von News und Tools aus der Welt der künstlichen Intelligenz

4 gute Gründe für meinen Newsletter

Cookie Consent mit Real Cookie Banner