So importiere ich Internet-UFO-Sichtungsdaten in eine Google-Kalkulationstabelle

So importiere ich Internet-UFO-Sichtungsdaten in eine Google-Kalkulationstabelle / Internet

Wenn es um Online-Datenbanken und -Informationen geht, finden Sie diese Informationen in der sogenannten “invisible web 10 Suchmaschinen zum Erkunden des unsichtbaren Webs 10 Suchmaschinen zum Erkunden des unsichtbaren Webs Wir sind mit dem Web vertraut. Aber wussten Sie, dass es einen riesigen Informationsspeicher gibt, auf den Suchmaschinen wie Google keinen direkten Zugriff haben? Dies ist das unsichtbare Web. Weiterlesen “, Ich bin kein typischer Benutzer. Sicher, ich verbringe ein bisschen zu viel Zeit damit, Online-Datenbanken wie das Nationalarchiv und den CIA FOIA-Lesesaal zu durchsuchen, aber ich muss sagen, dass mich nichts aufregender macht, als wenn ich eine mit Volumes gefüllte HTML-basierte Tabelle finde von scheinbar komplexen und nicht verbundenen Daten.

Tatsache ist, dass Datentabellen eine Goldgrube wichtiger Wahrheiten sind. Daten werden häufig von Armeen gesammelt, die sich mit Stiefel am Boden aufhalten. Es gibt Leute der US-Volkszählung, die im ganzen Land nach Haushalts- und Familieninformationen reisen. Sie haben gemeinnützige Umweltgruppen, die alle möglichen interessanten Informationen über Umwelt, Umweltverschmutzung, globale Erwärmung und mehr sammeln. Und wenn Sie sich mit der Paranormalen oder Ufologie beschäftigen, gibt es auch ständig aktualisierte Informationstabellen über Sichtungen fremder Objekte am Himmel über uns.

Ironischerweise würde man denken, dass jede Regierung der Welt daran interessiert wäre, zu wissen, welche Art von ausländischem Handwerk über einem Land am Himmel entdeckt wird, aber offenbar nicht - zumindest nicht in den USA. In Amerika wurde die Sammlung ungewöhnlicher Sichtungen von Kunsthandwerk an Teams von Amateuren abgegeben, die zu neuen UFO-Sichtungen wie Motten zu einer Flamme strömen. Mein Interesse an diesen Sichtungen beruht eigentlich nicht auf einer Faszination für Außerirdische oder Handwerker anderer Planeten, sondern auf einer wissenschaftlichen Faszination für Muster - wo und warum mehr Menschen Dinge am Himmel sehen und ob diese Sichtungen etwas sehr Reales und Vieles widerspiegeln mehr bodenständiger geht tatsächlich vor.

Um die Datenmengen zu untersuchen, die von Teams von UFO-Hobbys gesammelt wurden, habe ich tatsächlich eine Möglichkeit entwickelt, große HTML-Datentabellen in eine Google-Tabelle zu importieren und diese Daten anschließend zu bearbeiten und zu analysieren, um aussagekräftige und wichtige Informationen zu extrahieren und zu ermitteln. In diesem Artikel möchte ich Ihnen zeigen, wie Sie dasselbe tun.

Wichtige HTML-Daten in die Google-Tabelle

In diesem Beispiel werde ich Ihnen zeigen, wie Sie Daten, die möglicherweise in einer Tabelle auf einer beliebigen Website im Internet gespeichert sind, in Ihre Google-Tabelle importieren. Denken Sie an die enormen Datenmengen, die heute im Internet in Form von HTML-Tabellen verfügbar sind. Alleine Wikipedia enthält Daten in Tabellen zu Themen wie die globale Erwärmung, das US Census Bureau verfügt über eine Unmenge von Bevölkerungsdatensätzen, und ein wenig Googling wird Sie darüber hinaus noch viel mehr ansprechen.

In meinem Beispiel beginne ich mit einer Datenbank im National UFO Reporting Center, die tatsächlich so aussieht, als sei es eine Datenbank im Abfragestil, aber wenn Sie die URL-Strukturierung beobachten, handelt es sich tatsächlich um ein semi-komplexes Web. Reporting-System bestehend aus statischen Webseiten und statischen HTML-Tabellen - genau das, was wir beim Importieren von Daten wünschen.

NUForc.org ist eine der Organisationen, die als eine der größten Meldestellen für UFO-Sichtungen dient. Es ist nicht das einzige, aber es ist groß genug, um neue Datensätze mit aktuellen Sichtungen für jeden Monat zu finden. Sie können sich die Daten nach Kriterien wie Status oder Datum sortiert anzeigen lassen. Jede dieser Daten wird in Form einer statischen Seite bereitgestellt. Wenn Sie nach Datum sortieren und dann auf das aktuellste Datum klicken, sehen Sie, dass die dort angegebene Tabelle eine statische Webseite enthält, die nach Datumsformat benannt ist.

Wir haben jetzt ein Muster, um regelmäßig die neuesten Sichtungsinformationen aus dieser HTML-basierten Datenbank zu extrahieren. Alles, was Sie tun müssen, ist die erste Tabelle zu importieren, den neuesten Eintrag (den obersten Eintrag) zu verwenden, um das letzte Update zu ermitteln, und dann das Datum dieses Beitrags zum Erstellen des URL-Links verwenden, in dem die neueste HTML-Datentabelle vorhanden ist. Dazu benötigen Sie lediglich einige Instanzen der ImportHTML-Funktion und anschließend einige kreative Verwendungen von Textbearbeitungsfunktionen. Wenn Sie fertig sind, verfügen Sie über eine der coolsten, selbst aktualisierenden Berichtstabellen. Lass uns anfangen.

Tabellen importieren und Daten bearbeiten

Der erste Schritt ist natürlich das Erstellen der neuen Tabelle.

Wie importiert man also HTML-Tabellen? Alles, was Sie brauchen, ist die URL, unter der die Tabelle gespeichert ist, und die Nummer der Tabelle auf der Seite. Normalerweise wird zuerst eine 1 angegeben, die zweite 2 und so weiter. Da ich die URL dieser ersten Tabelle kenne, die Datumsangaben und Zählungen der Sichtungen auflistet, kann der Import durch Eingabe der folgenden Funktion in Zelle A1 erfolgen.

= importhtml (“http://www.nuforc.org/webreports/ndxpost.html?”& H2,”Tabelle”,1)

H2 hat die Funktion “= Stunde (jetzt ())“, Die Tabelle wird also jede Stunde aktualisiert. Dies ist wahrscheinlich extrem für Daten, die dies selten aktualisieren, sodass ich es wahrscheinlich täglich schaffen könnte. Die obige ImportHTML-Funktion fügt die Tabelle wie unten gezeigt hinzu.

Sie müssen auf dieser Seite ein wenig Datenmanipulation durchführen, bevor Sie die URL für die zweite Tabelle mit allen UFO-Sichtungen zusammensetzen können. Erstellen Sie jedoch das zweite Blatt in der Arbeitsmappe.

Bevor Sie versuchen, das zweite Blatt zu erstellen, ist es Zeit, das Postdatum aus dieser ersten Tabelle zu extrahieren, um die Verknüpfung zur zweiten Tabelle herzustellen. Das Problem ist, dass das Datum als Datumsformat und nicht als Zeichenfolge eingegeben wird. Sie müssen also zunächst die TEXT-Funktion verwenden, um das Berichtsdatum in einen String zu konvertieren:

= Text (A2,”mm / tt / jj”)

In der nächsten Zelle rechts müssen Sie die SPLIT-Funktion mit verwenden “/” Trennzeichen, um das Datum in Monat, Tag und Jahr zu unterteilen.

= aufgeteilt (D2,”/”)

Gut aussehen! Jede Zahl muss jedoch aus zwei Ziffern bestehen. Führen Sie dies in den Zellen direkt unter ihnen erneut durch, indem Sie den Befehl TEXT verwenden.

= Text (E2,”00 ")

Ein Format von “00” (das sind Nullen) zwingt zwei Ziffern oder a “0” als Platzhalter.

Jetzt können Sie die gesamte URL mit der neuesten HTML-Tabelle mit neuen Sichtungen neu erstellen. Sie können dies tun, indem Sie die CONCATENATE-Funktion verwenden und alle Informationen zusammensetzen, die Sie gerade aus der ersten Tabelle extrahiert haben.

= verketten (“http://www.nuforc.org/webreports/ndxp”,G3, E3, F3,”.html”)

Auf dem neuen Blatt, das Sie oben erstellt haben (das leere Blatt), werden Sie ein neues erstellen “importhtml” Funktion, aber diesmal für den ersten URL-Link-Parameter, so dass Sie zur ersten Tabelle zurückkehren und auf die Zelle mit dem soeben erstellten URL-Link klicken.

Der zweite Parameter ist “Tabelle” und das letzte ist “1” (weil die Sichtungsliste die erste und nur auf der Seite ist). Drücken Sie die Eingabetaste, und jetzt haben Sie das gesamte Volumen der Sichtungen importiert, die an diesem bestimmten Datum veröffentlicht wurden.

Also denken Sie wahrscheinlich, dass dies eine schöne Neuheit ist und alles - ich meine, schließlich haben Sie vorhandene Informationen aus einer Tabelle im Internet extrahiert und zu einer anderen Tabelle migriert, wenn auch zu einer privaten in Ihrem Google Text & Tabellen-Konto Ja das stimmt. Jetzt, da es sich in Ihrem privaten Google Text & Tabellen-Konto befindet, haben Sie die Werkzeuge und Funktionen zur Verfügung, um diese Daten besser zu analysieren und erstaunliche Verbindungen zu entdecken.

Verwenden von Pivot-Berichten zur Analyse importierter Daten

Vor kurzem habe ich einen Artikel über die Verwendung von Pivot-Berichten in Google Spreadsheet zu einem Experten für Datenanalysen über Nacht mit Google Spreadsheet-Berichtstools geschrieben. Ein Experten für Datenanalysen über Nacht mithilfe von Google Spreadsheet-Berichtstools Analyse ist eigentlich Google Spreadsheet? Der Grund dafür liegt nicht nur daran, dass er fast alles tun kann, was Sie möchten… Lesen Sie mehr, um alle möglichen coolen Datenanalyse-Funktionen auszuführen. Nun, Sie können mit den Daten, die Sie aus dem Internet importiert haben, die gleiche erstaunliche Datenanalyse-Akrobatik ausführen. Dadurch können Sie interessante Verbindungen aufdecken, die möglicherweise vor Ihnen noch niemand entdeckt hat.

Beispielsweise könnte ich mich aus der Tabelle der endgültigen Sichtungen entscheiden, einen Pivot-Bericht zu verwenden, um die Anzahl der verschiedenen eindeutigen Formen zu überprüfen, die in jedem Zustand gemeldet werden, im Vergleich zu der Gesamtzahl der Sichtungen in diesem bestimmten Zustand. Zum Schluss filtere ich auch alles Erwähnende heraus “Außerirdische” in den Kommentaren, um hoffentlich einige der Flügelnuss-Einträge auszusondern.

Dies zeigt tatsächlich einige ziemlich interessante Dinge auf Anhieb, wie zum Beispiel die Tatsache, dass in Kalifornien eindeutig die höchste Anzahl an Sichtungen aller anderen Bundesstaaten zu sehen ist, zusammen mit der Unterscheidung, die höchste Anzahl an Handwerksformen im Land zu melden. Es zeigt auch, dass Massachusetts, Florida und Illinois auch in der UFO-Sichtungsabteilung große Hitter sind (zumindest in den neuesten Daten)..

Eine weitere coole Sache in Google Spreadsheet ist die große Auswahl an Diagrammen, einschließlich einer Geo-Map, mit der Sie sich ausbreiten können “heiße Flecken” von Daten in einem grafischen Format, das wirklich hervorsticht und diese Verbindungen innerhalb der Daten offensichtlich macht.

Wenn Sie darüber nachdenken, ist dies wirklich nur die Spitze des Eisbergs. Wenn Sie jetzt Daten aus Datentabellen auf einer beliebigen Seite im Internet importieren können, denken Sie nur an die Möglichkeiten. Erhalten Sie die neuesten Bestandsnummern oder die neuesten Top 10 Bücher und Autoren der Bestsellerliste der New York Times oder die meistverkauften Autos der Welt. Es gibt HTML-Tabellen zu fast allen Themen, die Sie sich vorstellen können, und in vielen Fällen werden diese Tabellen häufig aktualisiert.

Mit ImportHtml können Sie Ihre Google-Tabelle in das Internet einbinden und die dort vorhandenen Daten abfragen. Es kann zu einem persönlichen Informationszentrum werden, mit dem Sie manipulieren und ein Format erstellen können, mit dem Sie tatsächlich arbeiten können. Es ist nur eine weitere sehr coole Sache, die Google Spreadsheet begeistert.

Haben Sie schon einmal Daten in Ihre Tabellenkalkulation importiert? Welche interessanten Dinge haben Sie in diesen Daten entdeckt? Wie haben Sie die Daten verwendet? Teilen Sie Ihre Erfahrungen und Ideen in den Kommentaren weiter unten!

Bildnachweise: Business Graph

Erfahren Sie mehr über: Google, Tabellenkalkulation.