Ein spannender Anwendungsbereich von KI ist die Spracherkennung. Mittlerweile gibt es mehrere sehr schlanke Apps basierend auf verschiedenen offenen Vorleistungsprotokollen wie zum Beispiel Whisper. Das ist ein automatisches Spracherkennungssystem von OpenAI. Auch andere Angebote sind auf dem Markt. Einige Angebote laufen vollständig offline, also ohne Datenupload. Das macht derartige Tools interessant aus Sicht der Vertraulichkeit und Praktikabilität. Die Produktfamilie ist recht vielfältig und reicht von der bloßen Speech-to-Text-Aufnahme hin zu prompt-basierten Formatierungen oder Zusammenfassungen. Gemeinsam haben sie den Fokus auf das bloße Diktat und die Spracherkennung. Das macht sie als schmale Lösungen für berufliche Einsätze attraktiv. Zum Beispiel kann das Handy als mobiles Diktiergerät verwendet werden, um über einen Button in der App Sprache direkt in Text umzuwandeln. Der umgewandelte Text kann anschließend weiter verwendet werden.
Was aber aktuell für iOS fehlt, ist die Möglichkeit einer direkten Eingabe im Diktat-Button. Die Diktierfunktion sieht keine alternativen Anbieter vor, sondern ausschließlich die Bordlösung. Es ist also nicht möglich, ein alternatives Spracherkennungssystem in iOS zum Diktieren zu verwenden. Das reduziert hier die Möglichkeiten erheblich. Warum dies so ist, ist unklar. Für das MacOS gibt es Möglichkeiten alternativer Diktate allerdings.
Dieser Beitrag beleuchtet diese Beobachtung aus Sicht des Digital Markets Act. Er behandelt allein die Frage, ob Apple für alternative Spracherkennungssysteme sein iOS interoperabel machen muss.
Anwendungsfall für Art. 6 Abs. 7 DMA?
Was ist das beobachtete Problem? Gibt es eine rechtliche Lösung? Was ist der Fall?
Auch für iOS sind Apps verfügbar, die über das Smartphone-Mikro genutzt werden können. Ich selbst nutze unter iOS eine vertrauliche Variante für Notizen und das klappt recht gut. Alternativ kann man die zehnminütigen Sprachnachrichten von WhatsApp-exportieren und transkribieren, da die Meta-Funktion hierzu unbrauchbar ist. Es besteht aber ein Medienbruch, da ich nicht direkt über den systemeigenen Mikro-Button auf das Direktdiktat zugreifen kann.
Zudem besteht hier eine funktionelle Asymmetrie zwischen macOS und iOS: Bei ersterem ist es für einige Lösungen möglich, über die Fn- oder Globus-Taste systemweite Dritt-Diktatlösungen anzusteuern. Für iOS ist ein Mikrofonzugang für Dritt-Tastaturen derzeit laut Apple ausgeschlossen.
Ist diese Praxis von Apple zulässig? Schon auf der ersten Ebene scheint es fraglich, warum das eine Betriebssystem den Zugang eröffnet und das andere aber nicht. Apple ist mit den Betriebssystemen iOS und iPadOS als Gatekeeper designiert und muss damit die Verpflichtungen aus den Art. 5, 6 und 7 DMA einhalten.
Darf Apple also den Zugang zum Mikro für alternative Anbieter von Spracheingabe verweigern? Hierzu stellt sich die Frage, ob Apple damit gegen seine Interoperabilitätsverpflichtungen verstößt. Art. 6 Abs. 7 DMA sieht ein Gebot des Gatekeepers vor, Interoperabilität für diejenigen Hardware- und Software-Funktionen zu ermöglichen, die auch für seine eigenen Dienste oder Hardware zur Verfügung stehen. Noch weiter geht Art. 6 Abs. 7 S. 2 DMA, der auf die bloße Funktion abstellt, die der Torwächter für die Erbringung von Diensten zur Verfügung hat. Das spricht dafür, dass ein solcher Zugang eröffnet werden muss. Denn Apple behält sich den Zugang zum zentralen Übergabepunkt von Sprache zu Text vor.
Wann überhaupt Interoperabilität?
Art. 6 Abs. 7 DMA soll zum einen Drittanbietern einen besseren Zugang zu den Systemen des Torwächters ermöglichen, die insofern eine wesentliche Einrichtung darstellen können. Zum anderen enthält sie ein immanentes Gleichbehandlungsgebot externer Anbieter im Verhältnis zum Torwächter. Der Torwächter muss sein Betriebssystem für die Anfrage also interoperabel machen, damit konkurrierende Anbieter von Diensten konkurrenzfähige Angebote bereitstellen können. Die Konkurrenz von Drittanbietern für Diktat-Apps zu Apples Diktat-Button erscheint hier als Parade-Fall.
Gegenstand der Interoperabilitätsverpflichtung sind die Hardware- und Software-Funktionen, auf die über das Betriebssystem des Torwächters zugegriffen wird. Das spricht die Vermittlerrolle eines Betriebssystems über die verschiedenen Funktionen an. Das systemweite Diktat ist eine Funktion, die über das Betriebssystem und nicht einen anderen Dienst angewählt wird.
Die Funktionen müssen allerdings nur dann interoperabel sein, wenn sie für Angebote des Torwächters zur Verfügung stehen. Das ist bei einer systemweiten Spracheingabe zu Diktatzwecken und der anschließenden Übergabe des Textes an dem ausgewählten Punkt des Betriebssystems aber der Fall.
Die Interoperabilitätsverpflichtung aus Art. 6 Abs. 7 DMA ist kostenlos zu erfüllen. Es darf also insbesondere kein Entgelt für die Nutzung einer etwaigen Schnittstelle verlangt werden. Zusätzlich gelten die Regeln aus Art. 13 DMA, der in der Rechtsprechung bislang noch nicht ausreichend zur Kenntnis genommen wird. Diese umfassen den Effektivitätsgrundsatz der wirksamen Einhaltung, das Umgehungsverbot etwa durch Verhaltenslenkung und Schnittstellengestaltung sowie das Behinderungsverbot.
Ausnahme Integritätsschutz?
Art. 6 Abs. 7 UAbs. 2 DMA enthält die Möglichkeit, dass der Gatekeeper Einwendungen gegen die Interoperabilitätsverpflichtung zum Schutz der Integrität seines Betriebssystems erhebt. Für eine Begründung müsste er drei Anforderungen erfüllen:
- Gefährdung der Integrität des vom Torwächter bereitgestellten Betriebssystems durch die Software-Anwendungen Dritter
- Maßnahmen sind zur Abwendung dieser Gefährdung erforderlich und angemessen
- Maßnahmen sind hinreichend begründet
Auch hier gilt das Umgehungsverbot. Angesichts des Umstands, dass Diktatfunktionen unter MacOS grundsätzlich möglich sind, erscheinen derartige Einwendungen für iOS nicht naheliegend.
Grundsätzlich zulässig dürften allerdings technische Beschränkungen zum Schutz der Nutzer sein. Das können etwa Auswahlfelder mit ausdrücklicher Einwilligung zur Einstellung der alternativen Spracheingabe sein. Allerdings muss Apple dann wiederum Art. 6 Abs. 3 DMA beachten und darf es Endnutzern nicht erschweren, die Standardeinstellungen zu verändern.
Ausnahme Telefondienste?
Eine weitere Ausnahme könnte darin bestehen, dass bei iOS die zentrale Diktatfunktion noch an andere Funktionen gekoppelt ist, wie etwa die VoiceMail oder das Filtern unbekannter Rufnummern. Mit dieser Funktion werden Anrufer zu einer Spracheingabe veranlasst, die etwa den Zweck ihres Anrufs beinhaltet. Erfolgt eine Spracheingabe, so kann diese als Live-Text über den Sperrbildschirm des jeweiligen iPhone sichtbar sein. Der Angerufene erhält dann die Möglichkeit, beim Mitlesen zu entscheiden, ob er den Anruf direkt annehmen will. Mit dieser Funktion hilft Apple belästigende Werbeanrufe abzuhalten.
Bei einer derartigen Funktion könnte es den Einwand geben, dass er auch den Telekommunikationsdienst betrifft und damit die Vertraulichkeit der Kommunikation. Bei einer reinen Offline-Lösung dürfte das aber kein wesentlicher Punkt sein. Zudem ist es Aufgabe des jeweiligen Diensteanbieters, die für die Vertraulichkeit notwendigen Vorkehrungen zu schaffen. Mit der Übergabe des Textes in die iOS-Funktion VoiceMail liegt auch keine Nutzung außerhalb des designierten Gatekeepers vor. Damit entfällt der Einwand, es handele sich mit dem Telekommunikationsdienst um einen nicht regulierten Dienst.
Welche Folgen gibt es?
Die eigentliche Relevanz dieses Themas liegt nicht in einer einzelnen App, sondern in der Architektur des Zugangs. Solange Apple die systemnahe Diktateingabe am entscheidenden Nutzungspunkt für sich reserviert, bleiben Drittanbieter trotz zulässiger Apps und Tastaturen funktional im Nachteil.
Das ist keine Randfrage des Produktdesigns, sondern ein möglicher Testfall für die Reichweite von Art. 6 Abs. 7 DMA. Dass der Markt dies bislang nur punktuell adressiert, spricht eher für die frühe Phase dieser Angebote als gegen die Tragweite des Problems. Mit wachsender Verbreitung lokaler und KI-gestützter Spracheingabe wird der Druck steigen, auch diesen Zugang regulatorisch zu öffnen. Anbieter könnten also motiviert sein, sich an Apple mit einer Anfrage auf Interoperabilität und Herausgabe der erforderlichen Informationen zu wenden.
Wer den DMA nicht nur abstrakt, sondern in seiner Wirkung auf konkrete Betriebssystemfunktionen verstehen will, sollte diese Entwicklung aufmerksam verfolgen. Wir werden dieses Thema weiter beobachten und aufgreifen.