Sprachassistenten sind dank KI die neuen Orakel von Delphi

Sprachassistenten sind dank KI die neuen Orakel von Delphi

Liebe Leser*innen

Haben Sie schon eine Alexa? Falls ja, sind Sie jemand unter 100 Millionen, die eine Alexa zu Hause haben. Eigentlich heisst sie nicht Alexa, sondern Amazon Echo, also das Echo von Amazon. Da Amazon Echo aber auf  den Befehl „Alexa“ reagiert und Fragen beantwortet oder Befehle ausführt, sagen ihr die Leute lieber Alexa.

Ein früherer Clubfreund hat zwei Alexas zu Hause. Seine Frau heisst auch Alexa. Sie können sich sicher gut vorstellen, dass das zu Verwechslungen führen kann.

Dank künstlicher Intelligenz werden die Alexas oder die Sprachassistenten wie Alexa, Google Home, Cortana von Microsoft oder HomePod von Apple (bzw. die Siri vom iPhone) immer besser und nützlicher. Die Sprachassistenten werden auch als Smart Speaker bezeichnet.

Für die Zeitschrift „topsoft“ durfte ich einen Artikel mit dem Titel dieses Beitrages schreiben. Etwas weiter unten können Sie den gelayouteten Artikel als PDF herunterladen oder hier lesen.

Viel Spass bei der Lektüre.

 

Mit türkisfarbenen Grüssen

Jörg Eugster

Artikel zum Download

Sprachassistenten sind die neuen Orakel von Delphi

Artikel als PDF

Sprachassistenten sind die neuen Orakel von Delphi

Sprachassistenten sind dank KI die neuen Orakel von Delphi

Mit den Sprachassistenten von Amazon, Google, Microsoft und Apple bekommen wir das Orakel von Delphi wieder zurück, und zwar überall und jederzeit. Dank künstlicher Intelligenz können wir den neuen Orakeln jederzeit unsere Fragen stellen.

Delphi war eine Stadt im antiken Griechenland, die vor allem für ihr Orakel, einer Weissagungsstätte, bekannt war. Das Orakel von Delphi gab zunächst nur einmal im Jahr am Geburtstag des Apollon Auskunft, später am siebten Tag der Sommermonate. Im Winter legte es für drei Monate eine Pause ein. Die Kultstätte von Delphi mit dem Orakel war die wichtigste der hellenischen Welt und bestand bis in die Spätantike. Delphi galt lange Zeit sogar als Mittelpunkt der Welt. Das Orakel konnte Dinge voraussagen. Z.B. prophezeite das Orakel von Delphi Laios, dem König von Theben, dass sein Sohn ihn dereinst töten und seine Frau heiraten werde. Sein Sohn hiess Ödipus.

Mit den Sprachassistenten von Amazon, Google, Microsoft und Apple bekommen wir das Orakel von Delphi wieder zurück, und zwar überall und jederzeit. Dank künstlicher Intelligenz können wir den neuen Orakeln jederzeit unsere Fragen stellen. Doch können die Sprachassistenten nicht die Zukunft wie das Orakel von Delphi voraussagen, doch immerhin haben sie Zugriff auf das gesamte Wissen im Internet. 

Mein bevorzugtes Orakel ist der Google Assistant. Früher war Google eine Suchmaschine, mit der wir mit einzelnen Suchbegriffen nach relevanten Informationen suchten. Google versteht seit einiger Zeit Sprache, das heisst, man muss seine Suchbegriffe nicht mehr eintippen, sondern kann sie sprechen. Google ist heute weit mehr als eine Suchmaschine. Dank künstlicher Intelligenz kann man seine Fragen wie damals dem Orakel in einer natürlichen Sprache stellen. Kürzlich wollte ich wissen, wie der CEO von Novartis heisst. Früher hätte man ins Suchfeld von Google “CEO Novartis” eingegeben. Heute sagt man “OK Google. Wie heisst der CEO von Novartis?” Googles Antwort erfolgt auditiv und visuell: “Der CEO von Novartis ist Vasant Narasimhan”. Manchmal erfolgt Googles Antwort wie früher in Form eines relevanten Links. 

Der Sprachassistent von Amazon heisst offiziell Amazon Echo, doch nennen ihn alle Alexa. Alexa kann Programme ausführen. Diese heissen bei Amazon Echo nicht Programm, sondern Skill. In der Kategorie Taxi & Mitfahrgelegenheiten gibt es mehrere Anbieter, unter anderem Uber, wo man seine Fahrt bestellen kann. “Alexa, sage Uber ich möchte eine Fahrt bestellen.“ Dank einem geführten Dialog kann man so mit natürlicher Sprache sein Taxi reservieren. Natürlich kann Alexa dank vielen Skills viel mehr Aufgaben ausführen.

Noch weiter geht der Bot bzw. Assistant von Google, Google Duplex. Dieser übernimmt schon bald selbständig Aufgaben wie einen Termin für den Reifenwechsel beim Automechaniker in der Garage, den Termin beim Coiffeur oder die Tischreservation im Restaurant. Dank KI weiss der Bot zum Beispiel, wann mein bevorzugter Termin und wer mein Friseur ist.

Gesichtserkennung statt Passwort

Die Gesichtserkennung dank KI wird von vielen argwöhnisch betrachtet. Im öffentlichen Raum kann das durchaus heikel sein, z.B. vor Stadien, um Hooligans mit Stadionverbot frühzeitig zu erkennen. Wenn ich meinen Computer starte, muss ich nur kurz die Webcam aktivieren und schon werde ich von Windows erkannt und persönlich begrüsst, ohne dass ich ein Passwort eingeben muss. Dank KI ist das möglich und erst noch viel bequemer. Besitzer eines neueren iPhones sind sich das schon länger gewohnt, dass sie dank der Face Recognition kein Passwort mehr erfassen müssen. 

Können Sie portugiesisch?

Dank Google Translate muss man nicht mehr mühsam Sprachen lernen. Englisch würde ich davon ausnehmen. Diese Weltsprache muss man einfach mehr oder wenig beherrschen. Wenn Sie in einem Land Ferien machen, dann wollen Sie vermutlich für diese kurze Zeit nicht die Sprache erlernen. Ausnahmen davon sind die Höflichkeitsfloskeln wie Guten Morgen, Guten Abend, Danke und Bitte. Diese kann man in jedem Reiseführer nachschlagen. Dank Google Translate geht das noch viel einfacher. Sie sprechen auf Deutsch den gewünschten Satz, wie z.B. “Guten Tag, haben Sie ein Zimmer für zwei Nächte?”. Dieser Satz wird nun von der App erkannt und aus dem Audiofile wird es in einen Text transkribiert und in die Cloud hochgeladen. Dort wird er nun von Google interpretiert, in die Zielsprache übersetzt und ein Audiofile für die Sprachausgabe generiert. In Sekundenschnelle sagt die App auf portugiesisch: “Olá, você tem quarto para duas noites?”. Ein Muttersprachler mag jetzt vielleicht einwerfen, dass diese Übersetzung nicht ganz perfekt sei. Doch ist eine schlechte Übersetzung immer noch besser als gar keine. Und dank KI wird diese immer besser.

Die beste Übersetzung derzeit gibt es bei deepl.com. Ich musste vor einigen Monaten einen 25-seitigen Vertrag von Englisch auf Deutsch übersetzen. Was denken Sie, wie lange brauchte ich, um diesen übersetzen zu lassen? Unglaubliche 45 Sekunden hat das gedauert. Ich musste nur das Wordfile hochladen und nach eben diesen 45 Sekunden kam es übersetzt zurück. Die Qualität war unglaublich gut und verbessert sich dank Big Data und KI immer mehr.

Sprechen Sie bereits mit Ihrem Smartphone, oder tippen Sie noch?

In Vorträgen demonstriere ich immer die KI mit einem Diktat in mein Smartphone. Dank dem Google Assistenten und KI funktioniert das unglaublich gut. Ich spreche dann immer mindestens doppelt so schnell, um zu zeigen, wie gut das geht. Erstaunlicherweise machen das noch recht wenig Leute, obwohl sie diese Funktion kennen. Bei meiner Frage antworten höchstens 10 Prozent, dass sie die Spracheingabe der Texteingabe vorziehen. Versuchen Sie es doch einmal. Für iPhone-User ist es die Siri, die das auch schon ganz gut kann.

“Papa, wie heisst diese Blume?”

Als Vater kennen Sie diesen Satz ganz bestimmt. Sie hören ihn dann, wenn Ihre Kinder am Wegrand eine Blume gesehen haben. Mir ging es früher oft so, dass ich dann keine Antwort auf diese Frage hatte. Damals, als meine Kinder noch klein waren, hatte ich dieses neue Orakel noch nicht dabei. 

Dank der Bildsuchmaschine von Google, Google Lens, kann man sein Smartphone auf die besagte Blume halten und schon zeigt Google die mögliche Bezeichnung an. Google Lens kann aber noch viel mehr. Es kann einen Text scannen und übersetzen, z.B. eine Speisekarte oder ein Plakat. Es kann neben Pflanzen auch Tiere identifizieren. Zudem kann man die Umgebung entdecken, indem man über Sehenswürdigkeiten mehr Informationen abrufen kann, z.B. wann sie erbaut wurden oder wie die Öffnungszeiten sind. Mit Google Lens lassen sich QR- und Barcodes ganz schnell scannen und die passenden Infos dazu abrufen.

“Du, wie heisst dieses Lied?”

Diese Frage kennen Sie bestimmt auch. Man ist mit dem Auto unterwegs und hört Radio. Plötzlich hört man einen Song, zu dem uns aber der Titel oder Interpret nicht einfällt. Dank der App Shazam sind wir uns schon lange gewohnt, diese Information abzurufen. Mit dem Google Assistant geht das heute noch schneller und bequemer: “Ok Google. Wie heisst dieses Lied?”. Der Vorteil ist hier, dass man während der Autofahrt nicht am Handy hantieren muss, um die App aufzurufen, sondern einfach das Smartphone fragen kann, genau wie das Orakel von Delphi.

“Liebe KI, schreib doch diesen Artikel für mich.“

Was vor wenigen Jahren als Science-Fiction abgetan worden wäre, ist heute Realität. Die KI GPT-3 ist heute schon in der Lage, einen Text selber zu schreiben. Es bedarf nur einer kleinen Einführung von wenigen Sätzen mit den relevanten Stichworten, damit diese KI ein längeren Artikel selber schreiben kann, heute vorerst nur auf Englisch. Entwickelt wurde GPT-3 von OpenAI, einer Firma, die auf die Entwicklung und Erforschung Künstlicher Intelligenz spezialisiert ist. Einer der Gründer ist Elon Musk.

Die Menschen damals in der Antike hätten sich die neuen Orakel, die wir heute dank KI zur Verfügung haben, vermutlich nicht in ihren kühnsten Gedanken erahnen können. Wir aber vor dem Smartphone-Zeitalter auch nicht, dass das so wie heute einmal möglich sein wird. Heute haben wir es und es entwickelt sich rasch weiter und wird immer perfekter.

Angebot für die Leser*innen meines Blogs

Gratis mein Bestseller in der 3. Auflage

Mein Buch «Übermorgen – Eine Zeitreise in unsere digitale Zukunft» ist bereits in der 3. Auflage erschienen.

=> Hier geht es zum Bestellformular für das Buch

2 Comments

Comments are closed

Englisch lernen mit künstlicher Intelligenz (KI)Verleihung des Digital Lifetime Award 2020
Wir benutzen Cookies um die Nutzerfreundlichkeit der Webseite zu verbessen. Durch Deinen Besuch stimmst Du dem zu.