Apple

Apple soll Siri-Rufe in WWDC-Video technisch entschärft haben

Apple hat die Tonspur der WWDC-Keynote offenbar gezielt bearbeitet. Bestimmte Frequenzen sollen entfernt worden sein, damit iPhones, Macs und HomePods beim Namen „Siri“ nicht reagieren.

Von   Uhr

Apple hat die Tonspur der diesjährigen WWDC-Keynote offenbar an mehreren Stellen bearbeitet, um unbeabsichtigte Siri-Aktivierungen bei Zuschauern zu verhindern. Anscheinend hat das Unternehmen im Video rund um Erwähnungen des Namens „Siri“ bestimmte Frequenzbereiche herausgeschnitten.

Quickread: Auf einen Blick
  • Apple soll die Tonspur der WWDC-Keynote gezielt bearbeitet haben.
  • Betroffen waren offenbar Siri-Erwähnungen im Video.
  • Entfernt worden sein sollen Frequenzen um 3 kHz bis 6 kHz.
  • Die Maßnahme sollte wohl unbeabsichtigte Siri-Aktivierungen verhindern.
  • Einige Geräte sollen trotzdem reagiert haben.

Entdeckt wurde der Eingriff von Beobachtern auf X (ehemals Twitter), die Spektrogramme der Keynote teilten. Darauf sollen bei den Siri-Erwähnungen Lücken in den Bereichen um 3 kHz, 4 kHz, 5 kHz und 6 kHz zu sehen sein. Diese Frequenzbereiche können für die Erkennung eines Aktivierungswortes relevant sein.

Von der Redaktion empfohlener Inhalt

An dieser Stelle findest du einen externen Inhalt von Twitter, der den Artikel ergänzt. Du kannst ihn dir mit einem Klick anzeigen lassen und wieder ausblenden.

So soll Siri im Wohnzimmer ruhig bleiben

Hintergrund ist die Funktionsweise von Sprachassistenten: Geräte wie iPhone, iPad, Mac oder HomePod hören lokal auf ein Aktivierungswort. Wird der akustische Fingerabdruck von „Siri“ oder „Hey Siri“ erkannt, startet die Sprachsteuerung.

Aktivierungswort erklärt!

Ein Aktivierungswort ist ein kurzer Sprachbefehl, auf den ein Gerät dauerhaft lokal achtet. Bei Apple ist das etwa „Siri“ oder „Hey Siri“. Erkennt das Gerät das passende akustische Muster, startet es die Sprachsteuerung.

Wenn Apple bestimmte Frequenzanteile aus dem gesprochenen Wort entfernt, kann das die Erkennung erschweren. Für Zuschauer bleibt das Wort meist weiterhin verständlich, für die automatische Erkennung kann es aber weniger eindeutig sein. Zu 100 Prozent war die Maßnahme dennoch nicht vollständig wirksam, da mehrere Zuschauer von weiterhin ausgelösten Geräten in den sozialen Medien berichteten.

Die Idee ist nicht neu

Ein ähnliches Vorgehen wurde bereits 2017 bei Amazon beschrieben. Damals ging es um Alexa-Werbespots, die so bearbeitet worden sein sollen, dass Echo-Lautsprecher in Haushalten nicht auf TV-Werbung reagieren.

Bei Apples WWDC-Video handelt es sich bislang nicht um eine offiziell bestätigte Erklärung des Unternehmens. Die Beobachtung passt jedoch zu einem bekannten Problem von Sprachassistenten: Sobald Aktivierungswörter in Videos, Podcasts oder TV-Spots fallen, können Geräte in der Nähe unbeabsichtigt reagieren.

Unsere Einschätzung

Stefan Keller
Der Fall zeigt, wie sensibel Sprachassistenten auf Audioinhalte reagieren können. Für Apple ist die Bearbeitung der Keynote-Tonspur eine pragmatische Lösung, aber keine perfekte. Dass einzelne Geräte trotzdem angesprungen sein sollen, macht deutlich: Die Erkennung von Aktivierungswörtern bleibt ein technisches Abwägen zwischen Zuverlässigkeit und Fehlalarmen.

Mehr zu diesen Themen: