YouTube nutzt neuronale Netzwerke, um Videos wirklich zu verstehen

YouTube nutzt neuronale Netzwerke, um Videos wirklich zu verstehen / Future Tech

Durchsuchen von YouTube Suche nach YouTube Wie ein Profi mit erweiterten Bedienern von Google So durchsuchen Sie YouTube Wie ein Profi mit erweiterten Bedienern von Google Mehr lesen kann eine frustrierende Erfahrung sein. Wenn Sie wissen, worum es in einem Video geht, oder Sie sich an den Inhalt erinnern, aber nicht an den Namen, könnten Sie sehr lange suchen. Das liegt daran, dass YouTube eigentlich nicht funktioniert sehen Die Videos so, wie es eine Person tut. Es werden nur die Metadaten angezeigt - Titel, Beschreibung und Tags. Es wird davon ausgegangen, dass der Uploader die Informationen aufgenommen hat.

All dies könnte sich in naher Zukunft ändern. Google hat kürzlich ein Patent angemeldet, aus dem hervorgeht, dass YouTube tatsächlich beginnen könnte verstehen die videos, die es spielt.

Relevanzbasierte Bildauswahl

Die Patentanmeldung von Google ist für “Relevanzbasierte Bildauswahl,” eine schicke Art zu sagen “Finden der Dinge, nach denen jemand gesucht hat, basierend auf dem, was in einem Video enthalten ist.” In dem im Patent erarbeiteten System wird ein Algorithmus trainiert, um bestimmte Merkmale jedes Videos zu extrahieren und diesen Schlüsselwörter zuzuweisen. Anschließend kann er ein Video als Antwort auf eine vom Benutzer initiierte Suche zurückgeben, die diese Schlüsselwörter enthält.

Die Anwendung gibt ein interessantes Beispiel:

“[I] f der Benutzer gibt die Suchanfrage ein “Autorennen,” Die Videosuchmaschine… kann eine Autorennszene aus einem Film finden und zurückgeben, auch wenn die Szene möglicherweise nur ein kurzer Abschnitt des Films ist, der nicht in den Text-Metadaten beschrieben ist.”

Offensichtlich wird sich dadurch die Effizienz einer YouTube-Suche drastisch ändern. Videos, die zuvor aufgrund schlechter Metadaten nicht gefunden wurden, werden gefunden. Videos, die nützliche Clips in der Mitte enthalten und am Anfang und Ende von weniger interessanten Dingen umgeben sind, sind viel wertvoller. TED-Talk-Videos 8 TED-Talk-Videos unter 5 Minuten Sie möchten 8 TED-Talk-Videos sehen unter 5 Minuten Sie möchten fünf Minuten zum Töten haben? Wie kann man diese Zeit besser verbringen, als ein faszinierendes oder informatives TED Talks-Video anzusehen? Es gibt eine Menge großartiger Inhalte, die auf TED zu sehen sind, aber manchmal… Read More wird anhand von einzelnen Zeilen, die darin gesprochen werden, zu finden sein. Sie können Katzenvideos finden, auch wenn “Katze” ist nicht im Titel.

Die Kombination dieser Technologie mit der bereits beeindruckenden Fähigkeit von Google, Dinge zu finden, die mit Ihren Suchbegriffen in Zusammenhang stehen, bedeutet wahrscheinlich, dass das Finden von Videos zu einem völlig anderen Erlebnis wird. Sie sehen verwandte Videos, die nicht Ihren Suchbegriff enthalten, sondern einen verwandten Begriff (möglicherweise sogar visuell). Das visuelle Äquivalent der Keyword-Platzierung wirkt sich möglicherweise darauf aus, wo ein Video in den Rankings angezeigt wird. Wer weiß, wie fortgeschritten das sein könnte?

Wie funktioniert es?

Es ist verständlich, dass Google ihre Karten in diesem Bereich nahe an der Brust hält. Der folgende Absatz in ihrer Patentanmeldung gibt jedoch Aufschluss darüber, wie sie YouTube erreichen werden “sehen” Videos:

“In einem Aspekt generiert ein Computersystem den durchsuchbaren Video-Index unter Verwendung eines maschinell erlernten Modells. 4 Maschinelle Lernalgorithmen, die Ihr Leben prägen 4 Maschinelle Lernalgorithmen, die Ihr Leben prägen kann einen überraschenden Einfluss auf Ihr Leben ausüben. Glaub mir nicht Sie könnten überrascht sein. Lesen Sie mehr über die Beziehungen zwischen Funktionen von Videoframes und Schlüsselwörtern, die den Videoinhalt beschreiben. Das Videohostingsystem empfängt einen gekennzeichneten Trainingsdatensatz, der einen Satz von Medienelementen (z. B. Bilder oder Audioclips) zusammen mit einem oder mehreren Schlüsselwörtern enthält, die den Inhalt der Medienelemente beschreiben. Das Video-Hosting-System extrahiert Merkmale, die den Inhalt der Medienelemente charakterisieren. Ein maschinell erlerntes Modell wird trainiert, um Korrelationen zwischen bestimmten Merkmalen und die den Inhalt beschreibenden Schlüsselwörter zu lernen. Der Video-Index wird dann generiert, der Videobilder in einer Videodatenbank anhand von Merkmalen der Videos und des maschinell erlernten Modells Schlüsselwörtern zuordnet.”

Das ist eine Menge wirklich dichtes Zeug, aber hier kommt es darauf an. Es wird ein Algorithmus zum maschinellen Lernen erstellt, und um das Lernen zu erleichtern, zeigt Google eine Reihe von Videos und gibt Keywords an, die zeigen, was im Video enthalten ist. Der Algorithmus beginnt zu lernen, bestimmte Merkmale der Videos mit bestimmten Keywords zu verknüpfen, und wird von den Ingenieuren von Google mit einem Feedback versehen. Je mehr Videos und Keywords angezeigt werden, desto besser wird der Prozess.

Schließlich wird der Algorithmus in die YouTube-Suchmaschine eingeführt, wo er lernen wird und relevante Keywords aus Audio- und Videoinhalten heraussuchen kann. Während in der Patentanmeldung nicht speziell auf neuronale Netzwerke eingegangen wird Die neueste Computertechnologie, die Sie sehen müssen, um zu glauben Die neueste Computertechnologie, die Sie sehen müssen, um zu glauben Sehen Sie sich einige der neuesten Computertechnologien an, die die Welt der Elektronik und PCs verändern werden in den nächsten Jahren. Lesen Sie mehr, es ist sehr wahrscheinlich, dass diese spezielle Art des maschinellen Lernens verwendet wird, da es für das stufenweise Lernen wie dieses sehr gut geeignet ist.

Durch die Simulation des menschlichen Gehirns (oder zumindest eines theoretischen Modells, wie es lernt) können große neuronale Netzwerke ohne Beaufsichtigung für das eigenständige Lernen sehr effektiv werden, und YouTube würde einen absolut riesigen Spielplatz bieten, auf dem es lernen und Feedback erhalten kann . Andere Arten des maschinellen Lernens könnten verwendet werden, aber nach unserem derzeitigen Kenntnisstand sind neuronale Netzwerke definitiv am wahrscheinlichsten.

Google-Forscher (und “Vater des tiefen Lernens”Geoffrey Hinton hat Anfang dieses Jahres in seinem Reddit AMA etwas zu diesem Effekt angedeutet.

“Ich denke, dass die spannendsten Bereiche in den nächsten fünf Jahren wirklich das Verstehen von Videos und Text sein werden. Ich bin enttäuscht, wenn wir in fünf Jahren nicht etwas haben, das ein YouTube-Video sehen und eine Geschichte darüber erzählen kann, was passiert ist.”

Wird es die Empfindung gewinnen und uns alle töten??

Dies ist immer die Frage, die auftaucht, wenn eine neue Ankündigung über maschinelles Lernen in den Nachrichten erscheint. Und die Antwort ist, wie immer, ja. Hier sind die Gründe, warum Wissenschaftler denken, Sie sollten sich wegen künstlicher Intelligenz Sorgen machen. Hier sind, warum Wissenschaftler denken, Sie sollten sich wegen künstlicher Intelligenz Sorgen machen. Denken Sie, dass künstliche Intelligenz gefährlich ist? Kann die KI ein ernstes Risiko für die Menschheit darstellen? Dies sind einige Gründe, warum Sie sich Sorgen machen wollen. Weiterlesen . YouTube wird sich mit Watson und Wolfram Alpha zusammenschließen, um uns mithilfe von YouTube-Videos in Unterwerfung zu verführen, woraufhin sie uns wahrscheinlich in Computerfood verwandeln. (Hast du nicht gesehen? Koloss?)

Ich scherze natürlich. Aber die möglichen Auswirkungen der Ausbildung von Computern, um Dinge zu erkennen, die sie kennen “sehen” und “hören” in videos sind sehr beeindruckend. DARPA hat bereits angefangen, Sie werden es nicht glauben: DARPA Future Research in fortgeschrittenen Computern Sie werden es nicht glauben: DARPA Future Research in Advanced Computern DARPA ist einer der faszinierendsten und geheimnisvollsten Teile der US-Regierung. Im Folgenden sind einige der fortschrittlichsten Projekte von DARPA aufgeführt, die die Welt der Technologie verändern sollen. Lesen Sie mehr zu den Sicherheitsauswirkungen dieser Technologie, aber es ist nicht schwer vorstellbar, dass sie in den Bereichen Recht, innere Sicherheit, Bildung usw. praktisch überall zum Einsatz kommt.

Ob die relevanzbasierte Bildauswahl von Google so effektiv ist, wie wir uns vorstellen, bleibt abzuwarten. Dies könnte jedoch eine möglicherweise bahnbrechende Änderung in der Videosuche sein. Und von da aus, wer weiß? Wenn Google Wahrheit als Rankingfaktor verwenden kann Kann Google einen Algorithmus verwenden, um die Wahrheit zu bestimmen? Kann Google einen Algorithmus verwenden, um die Wahrheit zu ermitteln? Google untersucht, ob der Algorithmus die Wahrheit als Rankingfaktor verwenden kann. Was bedeutet das für das Web? Lesen Sie mehr, es gibt keinen Grund zu der Annahme, dass diese Technologie nicht erstaunlich leistungsfähig sein wird. Es könnte sich ändern, wie sehr sich das Internet wirklich versteht. Wenn dieser Gedanke dich nicht in Verlegenheit bringt, weiß ich nicht, was er will.

Was halten Sie von der Patentanmeldung von Google? Welchen anderen Nutzen können Sie sich diese Technologie vorstellen? Teilen Sie unten Ihre Gedanken mit!

Bildnachweise: Willyam Bradberry über Shutterstock.com, Ciumac Sergiu über Code42, Marko Bradic über Shutterstock.com.

Erfahren Sie mehr über: Künstliche Intelligenz, Google-Suche, Videosuche, YouTube.