Ein span­nen­der Anwen­dungs­be­reich von KI ist die Sprach­er­ken­nung. Mitt­ler­wei­le gibt es meh­re­re sehr schlan­ke Apps basie­rend auf ver­schie­de­nen offe­nen Vor­leis­tungs­pro­to­kol­len wie zum Bei­spiel Whisper. Das ist ein auto­ma­ti­sches Sprach­er­ken­nungs­sys­tem von Ope­nAI. Auch ande­re Ange­bo­te sind auf dem Markt. Eini­ge Ange­bo­te lau­fen voll­stän­dig off­line, also ohne Daten­u­pload. Das macht der­ar­ti­ge Tools inter­es­sant aus Sicht der Ver­trau­lich­keit und Prak­ti­ka­bi­li­tät. Die Pro­dukt­fa­mi­lie ist recht viel­fäl­tig und reicht von der blo­ßen Speech-to-Text-Auf­nah­me hin zu prompt-basier­ten For­ma­tie­run­gen oder Zusam­men­fas­sun­gen. Gemein­sam haben sie den Fokus auf das blo­ße Dik­tat und die Sprach­er­ken­nung. Das macht sie als schma­le Lösun­gen für beruf­li­che Ein­sät­ze attrak­tiv. Zum Bei­spiel kann das Han­dy als mobi­les Dik­tier­ge­rät ver­wen­det wer­den, um über einen But­ton in der App Spra­che direkt in Text umzu­wan­deln. Der umge­wan­del­te Text kann anschlie­ßend wei­ter ver­wen­det werden.

Was aber aktu­ell für iOS fehlt, ist die Mög­lich­keit einer direk­ten Ein­ga­be im Dik­tat-But­ton. Die Dik­tier­funk­ti­on sieht kei­ne alter­na­ti­ven Anbie­ter vor, son­dern aus­schließ­lich die Bord­lö­sung. Es ist also nicht mög­lich, ein alter­na­ti­ves Sprach­er­ken­nungs­sys­tem in iOS zum Dik­tie­ren zu ver­wen­den. Das redu­ziert hier die Mög­lich­kei­ten erheb­lich. War­um dies so ist, ist unklar. Für das MacOS gibt es Mög­lich­kei­ten alter­na­ti­ver Dik­ta­te allerdings.

Die­ser Bei­trag beleuch­tet die­se Beob­ach­tung aus Sicht des Digi­tal Mar­kets Act. Er behan­delt allein die Fra­ge, ob Apple für alter­na­ti­ve Sprach­er­ken­nungs­sys­te­me sein iOS inter­ope­ra­bel machen muss.

Anwendungsfall für Art. 6 Abs. 7 DMA?

Was ist das beob­ach­te­te Pro­blem? Gibt es eine recht­li­che Lösung? Was ist der Fall? 

Auch für iOS sind Apps ver­füg­bar, die über das Smart­phone-Mikro genutzt wer­den kön­nen. Ich selbst nut­ze unter iOS eine ver­trau­li­che Vari­an­te für Noti­zen und das klappt recht gut. Alter­na­tiv kann man die zehn­mi­nü­ti­gen Sprach­nach­rich­ten von Whats­App-expor­tie­ren und tran­skri­bie­ren, da die Meta-Funk­ti­on hier­zu unbrauch­bar ist. Es besteht aber ein Medi­en­bruch, da ich nicht direkt über den sys­tem­ei­ge­nen Mikro-But­ton auf das Direkt­dik­tat zugrei­fen kann.

Zudem besteht hier eine funk­tio­nel­le Asym­me­trie zwi­schen macOS und iOS: Bei ers­te­rem ist es für eini­ge Lösun­gen mög­lich, über die Fn- oder Glo­bus-Tas­te sys­tem­wei­te Dritt-Dik­t­at­lö­sun­gen anzu­steu­ern. Für iOS ist ein Mikro­fon­zu­gang für Dritt-Tas­ta­tu­ren der­zeit laut Apple aus­ge­schlos­sen.

Ist die­se Pra­xis von Apple zuläs­sig? Schon auf der ers­ten Ebe­ne scheint es frag­lich, war­um das eine Betriebs­sys­tem den Zugang eröff­net und das ande­re aber nicht. Apple ist mit den Betriebs­sys­te­men iOS und iPa­dOS als Gate­kee­per desi­gniert und muss damit die Ver­pflich­tun­gen aus den Art. 5, 6 und 7 DMA einhalten.

Darf Apple also den Zugang zum Mikro für alter­na­ti­ve Anbie­ter von Sprach­ein­ga­be ver­wei­gern? Hier­zu stellt sich die Fra­ge, ob Apple damit gegen sei­ne Inter­ope­ra­bi­li­täts­ver­pflich­tun­gen ver­stößt. Art. 6 Abs. 7 DMA sieht ein Gebot des Gate­kee­pers vor, Inter­ope­ra­bi­li­tät für die­je­ni­gen Hard­ware- und Soft­ware-Funk­tio­nen zu ermög­li­chen, die auch für sei­ne eige­nen Diens­te oder Hard­ware zur Ver­fü­gung ste­hen. Noch wei­ter geht Art. 6 Abs. 7 S. 2 DMA, der auf die blo­ße Funk­ti­on abstellt, die der Tor­wäch­ter für die Erbrin­gung von Diens­ten zur Ver­fü­gung hat. Das spricht dafür, dass ein sol­cher Zugang eröff­net wer­den muss. Denn Apple behält sich den Zugang zum zen­tra­len Über­ga­be­punkt von Spra­che zu Text vor.

Wann überhaupt Interoperabilität?

Art. 6 Abs. 7 DMA soll zum einen Dritt­an­bie­tern einen bes­se­ren Zugang zu den Sys­te­men des Tor­wäch­ters ermög­li­chen, die inso­fern eine wesent­li­che Ein­rich­tung dar­stel­len kön­nen. Zum ande­ren ent­hält sie ein imma­nen­tes Gleich­be­hand­lungs­ge­bot exter­ner Anbie­ter im Ver­hält­nis zum Tor­wäch­ter. Der Tor­wäch­ter muss sein Betriebs­sys­tem für die Anfra­ge also inter­ope­ra­bel machen, damit kon­kur­rie­ren­de Anbie­ter von Diens­ten kon­kur­renz­fä­hi­ge Ange­bo­te bereit­stel­len kön­nen. Die Kon­kur­renz von Dritt­an­bie­tern für Dik­tat-Apps zu App­les Dik­tat-But­ton erscheint hier als Parade-Fall.

Gegen­stand der Inter­ope­ra­bi­li­täts­ver­pflich­tung sind die Hard­ware- und Soft­ware-Funk­tio­nen, auf die über das Betriebs­sys­tem des Tor­wäch­ters zuge­grif­fen wird. Das spricht die Ver­mitt­ler­rol­le eines Betriebs­sys­tems über die ver­schie­de­nen Funk­tio­nen an. Das sys­tem­wei­te Dik­tat ist eine Funk­ti­on, die über das Betriebs­sys­tem und nicht einen ande­ren Dienst ange­wählt wird.

Die Funk­tio­nen müs­sen aller­dings nur dann inter­ope­ra­bel sein, wenn sie für Ange­bo­te des Tor­wäch­ters zur Ver­fü­gung ste­hen. Das ist bei einer sys­tem­wei­ten Sprach­ein­ga­be zu Dik­tat­zwe­cken und der anschlie­ßen­den Über­ga­be des Tex­tes an dem aus­ge­wähl­ten Punkt des Betriebs­sys­tems aber der Fall.

Die Inter­ope­ra­bi­li­täts­ver­pflich­tung aus Art. 6 Abs. 7 DMA ist kos­ten­los zu erfül­len. Es darf also ins­be­son­de­re kein Ent­gelt für die Nut­zung einer etwa­igen Schnitt­stel­le ver­langt wer­den. Zusätz­lich gel­ten die Regeln aus Art. 13 DMA, der in der Recht­spre­chung bis­lang noch nicht aus­rei­chend zur Kennt­nis genom­men wird. Die­se umfas­sen den Effek­ti­vi­täts­grund­satz der wirk­sa­men Ein­hal­tung, das Umge­hungs­ver­bot etwa durch Ver­hal­tens­len­kung und Schnitt­stel­len­ge­stal­tung sowie das Behinderungsverbot.

Ausnahme Integritätsschutz?

Art. 6 Abs. 7 UAbs. 2 DMA ent­hält die Mög­lich­keit, dass der Gate­kee­per Ein­wen­dun­gen gegen die Inter­ope­ra­bi­li­täts­ver­pflich­tung zum Schutz der Inte­gri­tät sei­nes Betriebs­sys­tems erhebt. Für eine Begrün­dung müss­te er drei Anfor­de­run­gen erfüllen:

  1. Gefähr­dung der Inte­gri­tät des vom Tor­wäch­ter bereit­ge­stell­ten Betriebs­sys­tems durch die Soft­ware-Anwen­dun­gen Dritter
  2. Maß­nah­men sind zur Abwen­dung die­ser Gefähr­dung erfor­der­lich und angemessen
  3. Maß­nah­men sind hin­rei­chend begründet

Auch hier gilt das Umge­hungs­ver­bot. Ange­sichts des Umstands, dass Dik­tat­funk­tio­nen unter MacOS grund­sätz­lich mög­lich sind, erschei­nen der­ar­ti­ge Ein­wen­dun­gen für iOS nicht naheliegend.

Grund­sätz­lich zuläs­sig dürf­ten aller­dings tech­ni­sche Beschrän­kun­gen zum Schutz der Nut­zer sein. Das kön­nen etwa Aus­wahl­fel­der mit aus­drück­li­cher Ein­wil­li­gung zur Ein­stel­lung der alter­na­ti­ven Sprach­ein­ga­be sein. Aller­dings muss Apple dann wie­der­um Art. 6 Abs. 3 DMA beach­ten und darf es End­nut­zern nicht erschwe­ren, die Stan­dard­ein­stel­lun­gen zu verändern.

Ausnahme Telefondienste?

Eine wei­te­re Aus­nah­me könn­te dar­in bestehen, dass bei iOS die zen­tra­le Dik­tat­funk­ti­on noch an ande­re Funk­tio­nen gekop­pelt ist, wie etwa die Voice­Mail oder das Fil­tern unbe­kann­ter Ruf­num­mern. Mit die­ser Funk­ti­on wer­den Anru­fer zu einer Sprach­ein­ga­be ver­an­lasst, die etwa den Zweck ihres Anrufs beinhal­tet. Erfolgt eine Sprach­ein­ga­be, so kann die­se als Live-Text über den Sperr­bild­schirm des jewei­li­gen iPho­ne sicht­bar sein. Der Ange­ru­fe­ne erhält dann die Mög­lich­keit, beim Mit­le­sen zu ent­schei­den, ob er den Anruf direkt anneh­men will. Mit die­ser Funk­ti­on hilft Apple beläs­ti­gen­de Wer­be­an­ru­fe abzuhalten.

Bei einer der­ar­ti­gen Funk­ti­on könn­te es den Ein­wand geben, dass er auch den Tele­kom­mu­ni­ka­ti­ons­dienst betrifft und damit die Ver­trau­lich­keit der Kom­mu­ni­ka­ti­on. Bei einer rei­nen Off­line-Lösung dürf­te das aber kein wesent­li­cher Punkt sein. Zudem ist es Auf­ga­be des jewei­li­gen Diens­te­an­bie­ters, die für die Ver­trau­lich­keit not­wen­di­gen Vor­keh­run­gen zu schaf­fen. Mit der Über­ga­be des Tex­tes in die iOS-Funk­ti­on Voice­Mail liegt auch kei­ne Nut­zung außer­halb des desi­gnier­ten Gate­kee­pers vor. Damit ent­fällt der Ein­wand, es han­de­le sich mit dem Tele­kom­mu­ni­ka­ti­ons­dienst um einen nicht regu­lier­ten Dienst.

Welche Folgen gibt es?

Die eigent­li­che Rele­vanz die­ses The­mas liegt nicht in einer ein­zel­nen App, son­dern in der Archi­tek­tur des Zugangs. Solan­ge Apple die sys­tem­na­he Dik­tat­ein­ga­be am ent­schei­den­den Nut­zungs­punkt für sich reser­viert, blei­ben Dritt­an­bie­ter trotz zuläs­si­ger Apps und Tas­ta­tu­ren funk­tio­nal im Nachteil. 

Das ist kei­ne Rand­fra­ge des Pro­dukt­de­signs, son­dern ein mög­li­cher Test­fall für die Reich­wei­te von Art. 6 Abs. 7 DMA. Dass der Markt dies bis­lang nur punk­tu­ell adres­siert, spricht eher für die frü­he Pha­se die­ser Ange­bo­te als gegen die Trag­wei­te des Pro­blems. Mit wach­sen­der Ver­brei­tung loka­ler und KI-gestütz­ter Sprach­ein­ga­be wird der Druck stei­gen, auch die­sen Zugang regu­la­to­risch zu öff­nen. Anbie­ter könn­ten also moti­viert sein, sich an Apple mit einer Anfra­ge auf Inter­ope­ra­bi­li­tät und Her­aus­ga­be der erfor­der­li­chen Infor­ma­tio­nen zu wenden. 

Wer den DMA nicht nur abs­trakt, son­dern in sei­ner Wir­kung auf kon­kre­te Betriebs­sys­tem­funk­tio­nen ver­ste­hen will, soll­te die­se Ent­wick­lung auf­merk­sam ver­fol­gen. Wir wer­den die­ses The­ma wei­ter beob­ach­ten und aufgreifen.

Über den Autor

Porträtbild von Dr. Sebastian Louven

Dr. Sebastian Louven

Ich bin seit 2016 selbstständiger Rechtsanwalt und berate vorwiegend zum Kartellrecht und Telekommunikationsrecht. Seit 2022 bin ich Fachanwalt für internationales Wirtschaftsrecht.

Weitere Artikel

Newsletter

Updates zum Kartell- und Telekommunikationsrecht