So finden Sie den Korrelationskoeffizienten mit Excel
Eine der einfachsten und gebräuchlichsten statistischen Excel-Berechnungen So berechnen Sie grundlegende Statistiken in Excel: Einsteigerhandbuch So berechnen Sie grundlegende Statistiken in Excel: Einsteigerhandbuch Microsoft Excel kann Statistiken erstellen! Sie können Prozentsätze, Durchschnittswerte, Standardabweichung, Standardfehler und Student-T-Tests berechnen. Lesen Sie mehr, was Sie machen könnten, ist Korrelation. Dies ist eine einfache Statistik, kann aber sehr aufschlussreich sein, wenn Sie sehen möchten, ob zwei Variablen miteinander verbunden sind. Wenn Sie die richtigen Befehle kennen, ist es sehr einfach, den Korrelationskoeffizienten in Excel zu finden.
Wir werden einen Blick auf die Korrelation werfen, um Ihnen eine Vorstellung von den Informationen zu geben, die Sie erhalten. Anschließend werden wir mit zwei Methoden und einem guten Diagramm für die Korrelationsanalyse einen Korrelationskoeffizienten in Excel suchen. Schließlich gebe ich Ihnen eine sehr kurze Einführung in die lineare Regression, eine weitere statistische Funktion, die sich bei Korrelationen als nützlich erweisen könnte.
Was ist Korrelation??
Bevor wir beginnen, besprechen wir die Definition der Korrelation. Es ist ein einfaches Maß dafür, wie die Dinge zusammenhängen. Schauen wir uns zwei Variablen an, die keinerlei Korrelation haben.
Diese beiden Variablen (eine auf der X-Achse, eine auf der Y-Achse) sind völlig zufällig und stehen nicht in engem Zusammenhang.
Die beiden folgenden Variablen sind jedoch korreliert:
Wenn eine Variable steigt, steigt im Allgemeinen auch die andere. Das ist eine Korrelation. (Beachten Sie, dass es auch umgekehrt sein kann; wenn einer nach oben geht und der andere nach unten geht, ist dies eine negative Korrelation.)
Korrelationskoeffizient verstehen
Der Korrelationskoeffizient zeigt an, wie verwandt zwei Variablen sind. Der Koeffizient liegt zwischen -1 und 1. Ein Korrelationskoeffizient von 0 bedeutet, dass es absolut keine Korrelation zwischen zwei Variablen gibt. Dies ist, was Sie erhalten sollten, wenn Sie zwei Sätze von Zufallszahlen haben.
Ein Koeffizient von -1 bedeutet, dass Sie eine perfekte negative Korrelation haben: Wenn eine Variable zunimmt, nimmt die andere proportional ab. Ein Koeffizient von 1 ist eine perfekte positive Korrelation: Wenn eine Variable zunimmt, steigt auch die andere proportional.
Eine beliebige Zahl zwischen diesen steht für eine Skala. Eine Korrelation von 0,5 ist zum Beispiel eine moderate positive Korrelation.
Wie Sie in der folgenden Grafik sehen können, sucht die Korrelation nur nach einer linearen Beziehung. Zwei Variablen können auf andere Weise stark miteinander verbunden sein und haben noch einen Korrelationskoeffizienten von Null:
So finden Sie den Korrelationskoeffizienten in Excel mithilfe von CORREL
Es gibt eine integrierte Funktion für die Korrelation in Excel. Die CORREL-Funktion hat eine sehr einfache Syntax:
= CORREL (Array1, Array2)
Array1 ist Ihre erste Zahlengruppe und Array2 ist die zweite Gruppe. Excel spuckt eine Zahl aus, und das ist Ihr Korrelationskoeffizient. Schauen wir uns ein Beispiel an.
In dieser Tabelle haben wir eine Liste der Autos mit Modell und Jahr sowie deren Werte. Ich habe die CORREL-Funktion verwendet, um zu sehen, ob das Modelljahr und der Wert in Beziehung stehen:
Es gibt eine sehr schwache positive Korrelation. So wie das Jahr steigt, wird auch der Wert des Fahrzeugs höher. Aber nicht sehr viel.
Korrelationen darstellen
Wenn Sie Korrelationen ausführen, empfiehlt es sich, ein Streudiagramm zu verwenden, um visuell zu verstehen, wie Ihre Datensätze zusammenhängen. Gehe zu Diagramme> Scatter um zu sehen, wie Ihre Daten aussehen:
Sie sehen, dass in diesen Daten das Jahr des Autos den Wert nicht sehr beeinflusst. Da ist ein leicht positiver Trend, aber es ist schwach. Das haben wir mit unserer CORREL-Funktion gefunden.
Ein weiteres nützliches Element in einem Streudiagramm ist eine Trendlinie, die folgendermaßen aussieht:
Die Trendlinie kann nützlich sein, wenn Sie eine Korrelation in Ihrem Streudiagramm klarstellen möchten. Klicken Sie unter Windows auf Diagrammtools> Design> Diagrammelement hinzufügen und wählen Sie Trendlinie. Auf einem Mac müssen Sie zu gehen Diagrammlayout oder Diagramm Design, abhängig von der Edition von Excel.
Vergessen Sie nicht, unseren Leitfaden für die Erstellung großartiger Diagramme in Excel zu lesen. So erstellen Sie leistungsstarke Diagramme und Diagramme in Microsoft Excel. So erstellen Sie leistungsstarke Diagramme und Diagramme in Microsoft Excel. Ein gutes Diagramm kann den Unterschied zwischen dem Punkt und dem Verlassen eines Punktes ausmachen alle dösen aus. Wir zeigen Ihnen, wie Sie in Microsoft Excel leistungsfähige Grafiken erstellen, die Ihre Zielgruppe ansprechen und informieren. Lesen Sie mehr, bevor Sie Ergebnisse präsentieren!
Mehrere Variablen mit dem Datenanalyse-Toolpak korrelieren
Wenn Sie viele verschiedene Mengen von Zahlen haben und Korrelationen zwischen ihnen suchen möchten, müssen Sie die CORREL-Funktion für jede Kombination ausführen. Mit dem Data Analysis Toolpak können Sie jedoch eine Reihe von Datensätzen auswählen und sehen, wo die Korrelationen liegen.
Sie sind sich nicht sicher, ob Sie das Data Analysis Toolpak haben? Informieren Sie sich über die Grundlagen der Grundlagen. So führen Sie eine grundlegende Datenanalyse in Excel aus. So führen Sie eine grundlegende Datenanalyse in Excel durch. Excel ist nicht für die Datenanalyse gedacht, kann aber dennoch Statistiken verarbeiten. Wir zeigen Ihnen, wie Sie mit dem Data Analysis Toolpak-Add-In Excel-Statistiken ausführen. Lesen Sie mehr zum Download und bekommen Sie den Dreh raus.
Zum Starten des Toolpaks gehen Sie zu Daten> Datenanalyse. Sie sehen eine Liste mit Auswahlmöglichkeiten:
Wählen Korrelation und schlagen OK.
Wählen Sie im daraufhin angezeigten Fenster alle Ihre Datensätze aus Eingabebereich und sagen Sie Excel, wo Sie Ihre Ergebnisse platzieren möchten:
Hier erhalten Sie, wenn Sie treffen OK:
In der Abbildung oben haben wir Korrelationen mit vier verschiedenen Datensätzen durchgeführt: dem Jahr, der Weltbevölkerung und zwei Gruppen von Zufallszahlen.
Die Korrelation jedes Datensatzes mit sich selbst ist 1. Das Jahr und die Weltbevölkerung weisen eine extrem starke Korrelation auf, wohingegen es an anderer Stelle sehr schwache Korrelationen gibt, wie wir es bei Zufallszahlen erwarten würden.
Korrelation vs. lineare Regression in Excel
Die Korrelation ist ein einfaches Maß: Wie eng sind zwei Variablen verbunden? Diese Maßnahme hat jedoch keinen prädiktiven oder ursächlichen Wert. Nur weil zwei Variablen korreliert sind, bedeutet dies nicht, dass eine Änderung in der anderen verursacht wird. Das ist eine entscheidende Sache, um Korrelation zu verstehen.
Wenn Sie Interesse an der Angabe der Kausalität haben, müssen Sie die lineare Regression verwenden. Sie können auch über das Data Analysis Toolpak darauf zugreifen. (In diesem Artikel wird nicht näher auf die Funktionsweise der linearen Regression eingegangen. Es gibt jedoch viele kostenlose Statistikressourcen. Lernen Sie Statistiken kostenlos mit diesen 6 Ressourcen. Lernen Sie Statistiken kostenlos mit diesen 6 Ressourcen.) Statistiken haben den Ruf eines Themas, das schwer zu verstehen ist Wenn Sie jedoch von der richtigen Ressource lernen, werden Sie die Umfrageergebnisse, Wahlberichte und Ihre Klassenzuweisungen in kürzester Zeit besser verstehen. Weitere Informationen dazu finden Sie in den Grundlagen.)
Öffnen Sie das Data Analysis Toolpak, und wählen Sie Regression, und klicken Sie auf OK.
Füllen Sie die X- und Y-Bereiche (der X-Wert ist die erklärende Variable und der Y-Wert ist der Wert, den Sie vorhersagen möchten). Wählen Sie dann aus, wohin Ihre Ausgabe gehen soll, und klicken Sie auf OK nochmal.
Die Zahl, auf die Sie sich hier konzentrieren möchten, ist der p-Wert für Ihre erklärende Variable:
Wenn es weniger als 0,05 ist, haben Sie ein starkes Argument, dass Änderungen in Ihrer X-Variablen Änderungen in Ihrer Y-Variablen verursachen. Im obigen Bild haben wir gezeigt, dass das Jahr ein bedeutender Prädiktor für die Weltbevölkerung ist.
Die lineare Regression ist auch nützlich, da mehrere Werte betrachtet werden können. Hier haben wir Regression verwendet, um zu sehen, ob Jahr und Bevölkerung signifikante Prädiktoren für den Rohölpreis sind:
Beide p-Werte liegen unter 0,05, sodass wir schließen können, dass sowohl das Jahr als auch die Weltbevölkerung signifikante Prädiktoren für den Rohölpreis sind. (Obwohl starke Korrelationen zwischen X-Variablen ihre eigenen Probleme verursachen können.)
Dies ist wiederum eine sehr einfache Erklärung für die lineare Regression. Wenn Sie an Kausalität interessiert sind, sollten Sie sich in einigen Statistik-Tutorials informieren.
Nun haben Sie jedoch eine Vorstellung davon, wie Sie über die einfache Korrelation hinausgehen, wenn Sie nach statistischen Informationen suchen!
Holen Sie bessere Daten aus Excel heraus
Wenn Sie grundlegende statistische Funktionen in Excel kennen, können Sie mit Ihren Daten viel mehr nützliche Informationen erhalten. Die Korrelation ist eine einfache Maßnahme, kann jedoch eine große Hilfe sein, wenn Sie versuchen, Angaben zu den Zahlen in Ihrer Kalkulationstabelle zu machen.
Natürlich können Sie auch andere komplizierte Maßnahmen durchführen. Aber wenn Sie mit Statistiken nicht vertraut sind, sollten Sie mit den Grundlagen beginnen. 8 Tipps zum schnellen Erlernen von Excel 8 Tipps zum schnellen Erlernen von Excel Sie sind mit Excel nicht so vertraut, wie Sie möchten? Beginnen Sie mit einfachen Tipps zum Hinzufügen von Formeln und zum Verwalten von Daten. Folgen Sie dieser Anleitung, und Sie sind in kürzester Zeit auf dem neuesten Stand. Weiterlesen .
Verwenden Sie regelmäßig die Korrelationsfunktion von Excel? Welche statistischen Funktionen möchten Sie gerne kennenlernen??
Erfahren Sie mehr über: Microsoft Excel.