Vergessen Sie Siri, wie Ihr Telefon intelligenter wird
Alle drei großen Telefonplattformen haben jetzt ihre eigene Stimme. Apple hat Siri, Microsoft hat Cortana und Google hat das etwas weniger freche Google Now 6 Google Now Funktionen, die sich ändern werden, wie Sie suchen 6 Google Now Funktionen, die sich ändern, wie Sie suchen Sie können Google Now bereits auf Ihrem Android-Gerät verwenden Bekommst du alles was du kannst? Das Wissen um diese kleinen Funktionen kann einen großen Unterschied machen. Weiterlesen .
Mit diesen Systemen können Sie grundlegende Aufgaben über die Sprachsteuerung erledigen. Jedes ist eine Art virtuelle Sekretärin, die einfache Fragen beantworten, Apps öffnen, Notizen machen und Nachrichten weiterleiten kann. Sie sind nützlich, aber sie sind auch frustrierend begrenzt. Sie können nichts tun, für das sie nicht ausdrücklich programmiert wurden, und viele Aufgaben liegen einfach außerhalb ihrer Fähigkeiten.
Es werden jedoch eine Reihe von Technologien entwickelt, die diese Systeme erheblich verbessern werden - und werden in wenigen Jahren kommerziell verfügbar sein. Hier sind die fünf wichtigsten Möglichkeiten, mit denen Ihr Telefon viel intelligenter wird.
Es wird sehen, was Sie sehen
Dank der Entwicklung leistungsfähiger neuronaler Netze hat die Spracherkennung in den letzten fünf Jahren große Fortschritte gemacht. Moderne Smartphones können Sprache mit überraschender Genauigkeit identifizieren (es ist schon eine Weile her, seit Google Now mich missverstanden hat), und sie können sogar Dinge wie das Erkennen von Liedern und Fernsehsendungen basierend auf deren Audioqualität durchführen.
Das ist großartig - aber es ist erst der Anfang. Menschen interagieren nicht in erster Linie mit der Welt. Wir nutzen Vision für praktisch alles - und bald auch unsere Maschinen. Die ersten tragbaren Headset-Displays wie Google Glass und Microsoft HoloLens werden von Microsoft erstmals auf der Build Conference vorgestellt. Microsoft zeigt die neuen HoloLens-Demos auf der Build Conference. Das kommende HoloLens-Headset von Microsoft ist die erste Augmented-High-End-Realität Gerät, das der Öffentlichkeit gezeigt wurde. Ist es immer noch ein phantasievolles Gizmo oder eine Technologie, die sich der Realisierung nähert? Lesen Sie mehr, um Informationen von den Kameras an Ihr Smartphone zu streamen und eine umfassende und stets verfügbare visuelle Information bereitzustellen. Viele Beobachter, darunter auch ich, gehen davon aus, dass diese in den nächsten fünf Jahren alltäglich werden.
Was kann Ihr Telefon also mit all diesen Daten tun??
Viel Google hat bereits mit seinem Tango-Tablet demonstriert, dass Google eine 3D-Kamera auf Ihr Smartphone setzen möchte - warum Google eine 3D-Kamera auf Ihr Smartphone setzen möchte - Warum Google-Projekt Tango bringt 3D-Sensoren für mobile Geräte. Folgendes wissen wir bisher. Lesen Sie mehr, dass eine Tiefenkamera die räumliche Position von physischen Objekten mit extrem hoher Genauigkeit bestimmen kann. Ebenso gab es einige erstaunliche Fortschritte in der Bildverarbeitung - wie das neuronale Netzwerk von Microsoft, mit dem einzelne Hunderassen identifiziert werden können, und das neuronale Netzwerk von Google, das den Inhalt von Fotos genau beschreiben kann. Zusammen eröffnen diese Technologien eine ganze Welt von Anwendungen:
Was ist das für ein Bolzen? Der Machine-Vision-Algorithmus weiß und kann in fünf Sekunden einen Ersatz bei Amazon bestellen. Wie hieß die Frau, die Sie gestern Abend in der Bar getroffen haben? Möglicherweise haben Sie ihre Karte verloren, aber Ihre Brille hat ihr Gesicht erwischt und ist auf Facebook zu finden. Du hast einen komischen Maulwurf. Sollten Sie Ihren Arzt sehen? Ihr Telefon kann einen Blick darauf werfen und es Ihnen mitteilen. Du bist einkaufen: Was brauchst du? Ihre Brille erinnert sich an das letzte Mal, als Sie in Ihren Kühlschrank geschaut haben, und weiß, was fehlt. Sie können Ihnen sogar Anweisungen für die einzelnen Gänge geben, um die einzelnen Gegenstände zu finden.
Die Auswirkungen dieser Technologie auf die Privatsphäre sind furchterregend, aber diese Art von Informationen klingt auch unglaublich nützlich.
Es wird wissen, was du magst
Der Geschmack kann schwer zu fassen sein. Es ist sehr persönlich und kann sehr willkürlich sein. Spotify und Netflix schaffen es, Empfehlungen auf der Grundlage von Nutzungsmustern abzugeben (eine Technik, bei der der Inhalt völlig ignoriert wird). Diesem Ansatz sind jedoch echte Grenzen gesetzt.
Die Zukunft liegt in Algorithmen, die Kunst auf einer tiefen Ebene verstehen können - komplexe neuronale Netzwerke, die lernen können, komplexe Feinheiten von Musik und Filmen auszuwählen. Dies vermittelt ein viel umfassenderes Verständnis dessen, was Menschen an einem Medium tun und nicht mögen - ein konkretes Gespür für ihren Geschmack.
Die ersten ersten Hinweise dazu zeigen sich. Wie Spotifys “Wöchentlich entdecken” Playlist, die diese Art von Inhaltsanalyse-Tools verwendet, um Songs zu empfehlen - einschließlich Songs, die Sie normalerweise nicht hören, weil sie zu unübersichtlich sind, um anhand von Nutzungsmustern ein gutes Ranking zu erhalten. Diese Techniken werden in Zukunft nur noch leistungsfähiger, und das Smartphone ist eine großartige Plattform, um diese Informationen zu nutzen.
Suchen Sie nach etwas, das Sie mit Freunden zu tun haben? Was wäre, wenn Apps auf Ihrem Telefon zusammenarbeiten, Informationen zu Ihrem jeweiligen Geschmack zusammenstellen und einen Film oder ein Konzert aussuchen könnten, von dem Sie denken, dass Sie es mögen? Was ist mit Dating-Sites, die Sie basierend auf tiefen Merkmalen Ihres jeweiligen Geschmacks bewerten? Was ist mit Apps, die Ihnen Bücher empfehlen können, weil sie sie gelesen haben?
Die Möglichkeiten sind endlos, und jemand wird damit viel Geld verdienen.
Es wird chatty sein
Mensch: wo bist du jetzt?
Maschine: Ich bin mitten im Nirgendwo.
Mensch: Was ist der Zweck des Sterbens??
Maschine: ein Leben haben.
Mensch: Was ist der Zweck, intelligent zu sein?
Maschine: um herauszufinden, was es ist.
Mensch: Was ist der Zweck von Emotionen?
Maschine: ich weiß es nicht.
Dies ist ein Gespräch mit einem von Google entwickelten neuronalen Netzwerk, das aus großen Textdatenbanken ohne menschliche Überwachung lernt. Diese Version wurde mit einer Reihe alter Filmskripts trainiert und trainiert, um den nächsten Satz in jeder Konversation vorherzusagen. Es stellt sich heraus, dass, wenn Sie eine KI mit Filmskripten trainieren, alle Konversationen durchgeführt werden super dramatisch.
Wenn Sie nicht beeindruckt sind, ist das verständlich. Chatbots gibt es schon lange. So erstellen Sie einen Chat-Bot für Ihre Site oder Ihr Unternehmen So erstellen Sie einen Chat-Bot für Ihre Site oder Ihr Unternehmen Die Schwierigkeit bei der Verbindung mit so vielen Menschen auf der ganzen Welt besteht in Zeitzonen. Möglicherweise möchten Sie für die Interaktion mit Ihrer Leserschaft oder für Geschäfte mit potenziellen Kunden verfügbar sein, aber bei einigen… Weiterlesen .
Aber schau genauer hin. Das System von Google ist in zweierlei Hinsicht besonders.
Erstens ist es in Bezug auf Architektur sehr einfach: Es ist ein einziges riesiges neuronales Netzwerk, und es musste die Dynamik der menschlichen Sprache selbst lernen. Gewöhnliche Chatbots arbeiten mit Tausenden von handcodierten Regeln, um auf verschiedene Situationen zu reagieren. Wenn sie eine Antwort vortragen, liegt das daran, dass sie von Hand codiert oder aus einem bestimmten Beispiel gespeichert wurde. Das Netzwerk von Google ist anders. Sie lernte ihr Verhalten organisch, indem sie versuchte, die tiefe Struktur der menschlichen Schrift zu verstehen.
Zweitens erfasst es einige überraschend subtile Dynamiken, die andere Chat-Bots nicht bieten. Es kann vernünftige Fragen über die Welt beantworten, obwohl es nicht ausdrücklich dafür programmiert ist.
Mensch: Wer ist Skywalker? ?
Maschine: Er ist ein Held .
Mensch: Wer ist Bill Clinton ?
Maschine: Er ist ein Milliardär .
Mensch: ist himmelblau oder schwarz ?
Maschine: Blau .
Mensch: Hat eine Katze einen Schwanz? ?
Maschine: Ja .
Mensch: Hat eine Katze einen Flügel? ?
Maschine: Nein
Mensch: Kann eine Katze fliegen? ?
Maschine: Nein .
Mensch: Wie viele Beine hat eine Katze? ?
Maschine: Ich denke, vier .
Eine andere Version des Chat-Bots, die mit Protokollen zur technischen Unterstützung trainiert wurde, kann verwirrend sein, indem sie echten technischen Support überraschend gut anbietet. Es gibt Stolpersteine (es scheint schwierig zu sein, sich an das verwendete Betriebssystem zu erinnern) - aber ich habe mit Sicherheit eine schlechtere technische Unterstützung von den Menschen erhalten.
All dies ist ein guter Hinweis darauf, dass wir an einen Punkt gelangen, an dem künstliche Intelligenz wirklich im Gespräch sein kann. Das obige Netzwerk kann ein erträgliches Gespräch führen, auch wenn seine Trainingsziele nur der oberflächlichen Struktur eines Hin und Her-Dialogs folgen müssen.
Aufgrund besserer Trainingsdaten und einer Belohnungsfunktion, die den Informationsaustausch betont, sind die Möglichkeiten unbegrenzt. Stellen Sie sich eine Version von Siri vor, die Sie in ein richtiges Gespräch einbinden kann, Antworten und Ratschläge als Antwort auf Fragen liefert und Aufgaben ausführt, ohne dafür speziell programmiert zu werden. Es ist nicht mehr weit.
Es wird gut gelesen
Eine andere Technologie, an der Google gearbeitet hat, hat mit Leseverständnis zu tun. Es heißt “Gedankenvektoren,” und das Konzept ist überraschend einfach. Sie können extrahieren “Gedankenvektoren” von der Aktivität eines neuronalen Netzwerks, das eine Information enthält, wie einen Satz oder einen Artikel. Was Sie bekommen, ist eine undurchsichtige Information, die niemandem außer dem Netzwerk, das sie generiert hat, bedeutet. Diese Information speichert in gewissem Sinne die “Bedeutung” vom Text getrennt von der ursprünglichen Formulierung.
Dies hat einige nützliche Eigenschaften. Für den Anfang ähneln sich diese Vektoren für Sätze mit ähnlichen Bedeutungen. Wenn Sie zwei Sätze auf diese Weise verdauen, können Sie feststellen, ob sie dasselbe bedeuten oder nicht. Sie können sie auch manipulieren. Durch Verwendung zweier neuronaler Netze zur Erzeugung “Gedankenvektoren” Sie können aus einem Text in verschiedenen Sprachen und einem dritten Netzwerk trainieren, um die Zuordnung zwischen ihnen zu lernen. Sie können eine äußerst leistungsfähige maschinelle Übersetzungsmethode erstellen, die die Bedeutung des Textes erfasst und nicht nur die darin enthaltenen Wörter.
Eine weitere mögliche Anwendung ist die Verwendung dieser Technologie, um große Informationsmengen zu sammeln, diese in einer kompakten Darstellung zusammenzufassen und dann basierend auf der Ausgabe eine Zusammenfassung zu generieren. Dies kann für mobile Anwendungen enorm leistungsfähig sein.
Stellen Sie sich vor, Sie könnten Ihr Telefon bitten, alles über Google zu einem bestimmten Thema zu lesen. Dann kommen Sie zu Ihnen zurück und berichten Sie kurz und knapp in natürlicher Sprache, und beantworten Sie Fragen zu den Ergebnissen. Das wird wirklich sehr bald Realität und es wird unglaublich nützlich sein.
Das Telefon der Zukunft
Die Telefone in der Zukunft werden sich wahrscheinlich heute deutlich von den heutigen Telefonen unterscheiden. Sie können gekrümmt sein. Sie können modular sein. Möglicherweise interagieren Sie mit ihnen mit einer Augmented-Reality-Brille. Der wichtigste Unterschied wird jedoch die Intelligenz sein. Die hier beschriebenen Funktionen verwandeln unsere Geräte in leistungsstarke Tutoren und Helfer.
Derzeit gibt es ein hitziges Wettrüsten. Microsoft vs. Google - Wer führt das Künstliche Intelligenzrennen an? Microsoft vs Google - Wer führt die Künstliche Intelligenz? Forscher der künstlichen Intelligenz machen spürbare Fortschritte, und die Menschen beginnen wieder ernsthaft über die KI zu sprechen. Die beiden Titanen, die das Rennen über künstliche Intelligenz anführen, sind Google und Microsoft. Lesen Sie mehr in Deep Learning-Technologie. Der Nebeneffekt ist, dass diese Techniken unglaublich schnell voranschreiten und sie früher auf dem Markt sein werden, als Sie vielleicht denken.
Sind Sie von intelligenten Smartphones begeistert? Besorgt über die Auswirkungen auf den Datenschutz? Lass es uns in den Kommentaren wissen!
Bildnachweise: Menschliches Gehirn von Mopic via Shutterstock
Erfahren Sie mehr über: Künstliche Intelligenz, Mobile Automation, Siri, Spracherkennung, Wearable Technology.