DeepMind
6.2 Billion Dead, 2002 Vision, Message to Pres. Trump
the internal paper cv-02407-CAB-AHG
DeepMind (früher Google DeepMind) ist ein Unternehmen, das sich auf die Programmierung einer künstlichen Intelligenz (KI) spezialisiert hat. DeepMind wurde im September 2010 gegründet und 2014 von Google Inc. übernommen
Künstliche Intelligenz, Transparenz, die Verbreitung von Viren direkt auf Knopfdruck, wann und wo sie benötigt werden. Es ist eine Frage der Zeit, bis sich die Bevölkerung diesen Interventionen widersetzt. Es gibt keinen Ausweg und keine Lösung, nur Zerstörung
Gesundheitsdaten
Im Februar 2016 gab die Firma bekannt, dass es in Großbritannien mit der Gesundheitsbehörde National Health Service zusammenarbeitet, um eine iPhone-App mit dem Namen „Streams“ zu entwickeln, allerdings sei es noch zu früh, um sagen zu können, wo KI angewandt werden könnte. Diese soll dabei helfen, Patienten zu überwachen, die an einem „Nierenschaden“ leiden. April 2016 veröffentlichte das Fachmagazin „New Scientist“ Details der Vereinbarung, demnach erhält Google den Zugriff auf die Daten von 1,6 Millionen NHS-Versicherten, die jährlich in den drei Krankenhäusern – Barnet, Chase Farm and the Royal Free – des Royal Free NHS Trust behandelt werden. Die weitreichende Vereinbarung erlaubt einen Datenaustausch weit über das bekannt gegebene hinaus. Enthalten sind die Daten von HIV-positiven Patienten, Drogenabhängigen oder Frauen, die Abtreibungen vornehmen ließen. Eine Opt-out-Möglichkeit (Möglichkeit der Verweigerung) für Patienten gab es nicht. Neben den pathologischen und radiologischen Ergebnissen werden die Daten der Intensivmedizin und der Notfallabteilungen übertragen, sowie die vollständigen Tagesaktivitäten der Kliniken, der Zustand und die Unterbringung der Patienten und die Krankenhausbesuche (wer und wann) werden übermittelt. Darüber hinaus bedeutet der Datenzugang auf die zentralen Aufzeichnungen aller NHS-Krankenhaus-Behandlungen in Großbritannien, dass es auf historische Daten der vergangenen fünf Jahre zurückgreifen kann – zusätzlich zu den neu auflaufenden Daten.
Kritiker fürchten dabei um die Intimsphäre und den Datenschutz. Das Personal von Google soll aber nicht in der Lage sein, bestimmte Patienten zu identifizieren und die Daten sollen nicht mit Google-Konten oder Produkten verbunden werden, erklärte Mustafa Suleyman, Leiter des Bereichs „Angewandte KI“ bei DeepMind.
WaveNet
WaveNet ist ein neuronales Netzwerk, das ursprünglich ab ca. 2014 zum Zweck der verbesserten, natürlicher klingenden Text-to-Speech-Synthese (TTS) entwickelt wurde, sprich, für menschlicher klingende Vorlesesysteme, indem das Programm natürliche menschliche Stimmen analysieren sollte, um so auch natürlicher klingende Sprache beim Vorlesen von Texten erzeugen zu können. Seit März 2018 bietet Google das auf WaveNet basierende Vorleseprogramm Cloud Text-to-Speech im Rahmen von Google Assistant an.
Inzwischen forscht DeepMind aber auch aktiv daran, mit WaveNet existierende individuelle menschliche Stimmen nicht nur zum Vorlesen von Texten möglichst exakt nachzubilden, um es mit ähnlichen Funktionen wie etwa das 2016 von Adobe Inc. vorgestellte Adobe Voco auszustatten. Ein Forschungsbericht vom Juni 2018 mit dem Titel Disentangled Sequential Autoencoder („Entflochtener sequentieller, automatischer Stimmgenerator“) stellt fest, dass es erfolgreich gelungen sei, WaveNet dafür einzusetzen, die Stimme in einer existierenden Tonaufnahme durch jegliche andere reale Stimme zu ersetzen, die denselben Text spricht („content swapping“). Um diese Fähigkeit zu ermöglichen, seien ca. 50 Stunden an Aufnahmen jeweils der Quell- wie Zielstimme nötig, mit denen WaveNet die grundlegenden Eigenschaften der beiden Stimmen erst lernen muss (wobei es selbstständig ein jeweils eigenes, von den Sprachaufnahmen abstrahiertes Modell der zu erlernenden Stimme erstellt), bevor es die Stimmkonvertierung bei jeder beliebigen neuen Tonaufnahme in annehmbarer Qualität durchführen kann. Die Autoren des Forschungsberichts betonen außerdem, dass WaveNet dazu in der Lage sei, statische und dynamische Eigenschaften voneinander zu unterscheiden (zu: „entflechten“), d. h. das Programm trenne automatisch zwischen den bei der Stimmkonvertierung beizubehaltenden Eigenschaften (Textinhalt, Modulation, Geschwindigkeit, Stimmung usw.) und den zu konvertierenden Grundeigenschaften der Quell- wie Zielstimme.
In einem Nachfolgebericht mit dem Titel Unsupervised speech representation learning using WaveNet autoencoders („Selbständiges Sprachmodellernen mit WaveNet„) vom Januar 2019 hieß es, dass DeepMind die Unterscheidung statischer von dynamischen Stimmeigenschaften von WaveNet weiter verbessert habe. In dem weiteren Nachfolgebericht Sample Efficient Adaptive Text-to-Speech („Samplingeffizienz bei adaptiver Text-to-Speech-Synthese“) vom September 2018 (letzte Revision Januar 2019) berichtet DeepMind, das Minimum an benötigten Sprachaufnahmen für das Samplen einer Stimme inzwischen auf wenige Minuten reduziert zu haben.
Im bereits 2014 veröffentlichten Bericht Towards End-to-End Speech Recognition with Recurrent Neural Networks („Zur vollständigen Spracherkennung mittels rückgekoppelter neuronaler Netze“) verwies DeepMind auf erfolgreiche Versuche, WaveNet zur automatischen Verschriftlichung von existierenden Sprachaufnahmen einzusetzen.
Der Forschungsbericht Large-Scale Visual Speech Recognition („Allgemein einsetzbare optische Spracherkennung„) vom Juli 2018 (letzte Revision vom Oktober 2018) geht auf erfolgreiche Versuche ein, WaveNet zum Lippenlesen bei menschlichen Lippenbewegungen auch in völlig stummen Videoaufnahmen einzusetzen, wobei das Programm professionelle menschliche Lippenleser beim Erraten der tatsächlichen Laute bereits deutlich übertreffe. Dieses Feature scheint als eigenständiges WaveNet-Plugin unter dem Titel LipNet entwickelt zu werden.