Apple hat die Tonspur der diesjährigen WWDC-Keynote offenbar an mehreren Stellen bearbeitet, um unbeabsichtigte Siri-Aktivierungen bei Zuschauern zu verhindern. Anscheinend hat das Unternehmen im Video rund um Erwähnungen des Namens „Siri“ bestimmte Frequenzbereiche herausgeschnitten.
- Apple soll die Tonspur der WWDC-Keynote gezielt bearbeitet haben.
- Betroffen waren offenbar Siri-Erwähnungen im Video.
- Entfernt worden sein sollen Frequenzen um 3 kHz bis 6 kHz.
- Die Maßnahme sollte wohl unbeabsichtigte Siri-Aktivierungen verhindern.
- Einige Geräte sollen trotzdem reagiert haben.
Entdeckt wurde der Eingriff von Beobachtern auf X (ehemals Twitter), die Spektrogramme der Keynote teilten. Darauf sollen bei den Siri-Erwähnungen Lücken in den Bereichen um 3 kHz, 4 kHz, 5 kHz und 6 kHz zu sehen sein. Diese Frequenzbereiche können für die Erkennung eines Aktivierungswortes relevant sein.
So soll Siri im Wohnzimmer ruhig bleiben
Hintergrund ist die Funktionsweise von Sprachassistenten: Geräte wie iPhone, iPad, Mac oder HomePod hören lokal auf ein Aktivierungswort. Wird der akustische Fingerabdruck von „Siri“ oder „Hey Siri“ erkannt, startet die Sprachsteuerung.
Ein Aktivierungswort ist ein kurzer Sprachbefehl, auf den ein Gerät dauerhaft lokal achtet. Bei Apple ist das etwa „Siri“ oder „Hey Siri“. Erkennt das Gerät das passende akustische Muster, startet es die Sprachsteuerung.
Wenn Apple bestimmte Frequenzanteile aus dem gesprochenen Wort entfernt, kann das die Erkennung erschweren. Für Zuschauer bleibt das Wort meist weiterhin verständlich, für die automatische Erkennung kann es aber weniger eindeutig sein. Zu 100 Prozent war die Maßnahme dennoch nicht vollständig wirksam, da mehrere Zuschauer von weiterhin ausgelösten Geräten in den sozialen Medien berichteten.
Die Idee ist nicht neu
Ein ähnliches Vorgehen wurde bereits 2017 bei Amazon beschrieben. Damals ging es um Alexa-Werbespots, die so bearbeitet worden sein sollen, dass Echo-Lautsprecher in Haushalten nicht auf TV-Werbung reagieren.
Bei Apples WWDC-Video handelt es sich bislang nicht um eine offiziell bestätigte Erklärung des Unternehmens. Die Beobachtung passt jedoch zu einem bekannten Problem von Sprachassistenten: Sobald Aktivierungswörter in Videos, Podcasts oder TV-Spots fallen, können Geräte in der Nähe unbeabsichtigt reagieren.








