Grundlegende Datenanalyse in Excel

Grundlegende Datenanalyse in Excel / Produktivität

Wenn Sie Statistiken ausführen, möchten Sie meistens Statistiksoftware verwenden. Diese Tools sind für Berechnungen wie gebaut t-Tests, Chi-Quadrat-Tests, Korrelationen usw. Excel ist nicht für die Datenanalyse gedacht. Das heißt aber nicht, dass Sie es nicht tun können.

Leider sind die statistischen Funktionen von Excel nicht immer intuitiv. Und sie geben Ihnen normalerweise esoterische Ergebnisse. Anstatt Statistikfunktionen zu verwenden, verwenden wir das Add-In für das Statistik-Add-In von Excel: das Data Analysis Toolpak.

Das Toolpak enthält trotz seiner recht unglücklichen Schreibweise eine Vielzahl nützlicher Statistikfunktionen. Mal sehen, was wir mit Excel-Statistiken machen können.

Hinzufügen des Excel-Datenanalyse-Toolpakets

Während du können Statistiken ohne das Data Analysis Toolpak ausführen, ist damit viel einfacher. Um das Toolpak in Excel 2016 zu installieren, gehen Sie zu Datei> Optionen> Add-Ins.

Klicken Gehen neben an “Verwalten: Excel-Add-Ins.”

Aktivieren Sie im daraufhin angezeigten Fenster das Kontrollkästchen neben Analyse-Toolpak und klicken Sie dann auf OK.

Wenn Sie das Datenanalyse-Toolpaket ordnungsgemäß in Excel hinzugefügt haben, wird ein angezeigt Datenanalyse Taste in der Daten Registerkarte, gruppiert in der Analyse Sektion:

Wenn Sie noch mehr Leistung benötigen, sollten Sie unbedingt die anderen Add-Ins von Excel mit Excel 10-Add-Ins zur Verarbeitung, Analyse und Visualisierung von Daten ausprobieren Wie ein Pro-Vanilla Excel ist erstaunlich, aber Sie können es mit Add-Ins noch leistungsfähiger machen. Bei allen Daten, die Sie verarbeiten müssen, besteht die Möglichkeit, dass jemand eine Excel-App dafür erstellt hat. Hier ist eine Auswahl. Weiterlesen .

Beschreibende Statistiken in Excel

Unabhängig davon, welchen statistischen Test Sie ausführen, möchten Sie wahrscheinlich zuerst die beschreibenden Statistiken von Excel erhalten. Auf diese Weise erhalten Sie Informationen zu Mittelwerten, Medianwerten, Abweichungen, Standardabweichungen und -fehlern, Kurtosis, Schräglage und einer Vielzahl anderer Zahlen.

Das Ausführen von beschreibenden Statistiken in Excel ist einfach. Klicken Datenanalyse Wählen Sie auf der Registerkarte Daten die Option aus Beschreibende Statistik, und wählen Sie Ihren Eingabebereich. Klicken Sie auf den Pfeil neben dem Eingabebereichsfeld, klicken Sie und ziehen Sie, um Ihre Daten auszuwählen, und klicken Sie auf Eingeben (oder klicken Sie auf den entsprechenden Abwärtspfeil), wie in der untenstehenden GIF.

Vergewissern Sie sich anschließend, dass Sie Excel mitzuteilen haben, ob Ihre Daten Beschriftungen enthalten, ob die Ausgabe in einem neuen Blatt oder auf demselben Blatt erfolgen soll und ob Übersichtsstatistiken und andere Optionen gewünscht werden.

Danach drücken Sie OK, und du bekommst deine beschreibenden Statistiken:

Schülertest in Excel

Das t-test ist einer der grundlegendsten statistischen Tests und mit dem Toolpak leicht in Excel zu berechnen. Drücke den Datenanalyse und blättern Sie nach unten, bis Sie sehen t-Testoptionen.

Sie haben drei Möglichkeiten:

  • t-Test: Zwei Stichproben für Mittel sollte verwendet werden, wenn Ihre Messungen oder Beobachtungen gepaart wurden. Verwenden Sie diese Option, wenn Sie zwei Messungen an denselben Probanden durchgeführt haben, z. B. vor und nach einem Eingriff den Blutdruck.
  • t-Test: Zwei Stichproben unter Annahme gleicher Varianzen sollte verwendet werden, wenn Ihre Messungen unabhängig sind (was normalerweise bedeutet, dass sie zu zwei verschiedenen Themengruppen durchgeführt wurden). Wir werden das besprechen “gleiche Abweichungen” Teil in einem Moment.
  • t-Test: Zwei Stichproben nehmen ungleiche Abweichungen an ist auch für unabhängige Messungen, wird jedoch verwendet, wenn Ihre Abweichungen ungleich sind.

Um zu testen, ob die Varianzen Ihrer beiden Proben gleich sind, müssen Sie einen F-Test durchführen. Finden F-Test zwei Stichproben auf Abweichungen Wählen Sie es in der Liste Analysis Tools aus und klicken Sie auf OK.

Geben Sie Ihre zwei Datensätze in die Eingabebereichsfelder ein. Lassen Sie den Alpha-Wert bei 0,05, sofern Sie keinen Grund haben, ihn zu ändern. Wenn Sie nicht wissen, was das bedeutet, gehen Sie einfach los. Klicken Sie abschließend auf OK.

Excel gibt Ihnen die Ergebnisse in einem neuen Arbeitsblatt (sofern Sie dies nicht ausgewählt haben Ausgabebereich und eine Zelle in Ihrem aktuellen Blatt):

Sie sehen hier den P-Wert. Wenn es weniger als 0,05 ist, haben Sie ungleiche Abweichungen. Also das laufen zu lassen t-Zum Testen sollten Sie die Option "Ungleiche Abweichungen" verwenden.

Ein laufen lassen t-Test, wählen Sie den entsprechenden Test im Fenster Analysis Tools aus, und wählen Sie beide Datensätze auf dieselbe Weise wie für den F-Test aus. Lassen Sie den Alpha-Wert bei 0,05 und drücken Sie OK.

Die Ergebnisse enthalten alles, was Sie für einen Bericht benötigen t-test: die Mittelwerte, Freiheitsgrade (df), t-Statistik und die P-Werte für ein- und zweiseitige Tests. Wenn der P-Wert weniger als 0,05 beträgt, unterscheiden sich die beiden Proben signifikant.

Wenn Sie nicht sicher sind, ob Sie einen ein- oder zweiseitigen Schwanz verwenden möchten t-Test, überprüfen Sie diese Erklärung von UCLA.

ANOVA in Excel

Das Excel Data Analysis Toolpak bietet drei Arten der Varianzanalyse (ANOVA). Leider können Sie die erforderlichen Folgetests wie Tukey oder Bonferroni nicht durchführen. Sie können jedoch feststellen, ob zwischen verschiedenen Variablen ein Zusammenhang besteht.

Hier sind die drei ANOVA-Tests in Excel:

  • ANOVA: Einzelfaktor analysiert die Varianz mit einer abhängigen und einer unabhängigen Variablen. Es ist vorzuziehen, mehrere zu verwenden t-testet, wenn Sie mehr als zwei Gruppen haben.
  • ANOVA: Zwei-Faktoren mit Replikation ist dem gepaart ähnlich t-Prüfung; Es umfasst mehrere Messungen an einzelnen Objekten. Das “Zwei-Faktor” Teil dieses Tests zeigt an, dass es zwei unabhängige Variablen gibt.
  • ANOVA: Zwei-Faktoren ohne Replikation beinhaltet zwei unabhängige Variablen, aber keine Replikation bei der Messung.

Wir werden uns hier mit der Ein-Faktor-Analyse befassen. In unserem Beispiel betrachten wir drei Zahlengruppen, die mit einem Namen versehen sind “Intervention 1,” “Intervention 2,” und “Intervention 3.” Um eine ANOVA auszuführen, klicken Sie auf Datenanalyse, dann auswählen ANOVA: Einzelfaktor.

Wählen Sie den Eingabebereich aus und vergewissern Sie sich, dass Sie in Excel angeben, ob sich Ihre Gruppen in Spalten oder Zeilen befinden. Ich habe auch ausgewählt “Etiketten in der ersten Reihe” hier, damit die Gruppennamen in den Ergebnissen angezeigt werden.

Nach dem Schlagen OK, Wir erhalten die folgenden Ergebnisse:

Beachten Sie, dass der P-Wert weniger als 0,05 beträgt, sodass wir ein signifikantes Ergebnis haben. Das heißt, es gibt einen signifikanten Unterschied zwischen mindestens zwei der Testgruppen. Aber weil Excel keine Tests zur Verfügung stellt welche Die Gruppen unterscheiden sich, das Beste, was Sie tun können, ist, sich die Durchschnittswerte anzusehen, die in der Zusammenfassung angezeigt werden. In unserem Beispiel sieht Intervention 3 so aus wahrscheinlich die eine, die sich unterscheidet.

Das ist statistisch nicht richtig. Aber wenn Sie nur sehen wollen, ob es einen Unterschied gibt und welche Gruppe dies wahrscheinlich verursacht, wird es funktionieren.

Zwei-Faktor-ANOVA ist komplizierter. Wenn Sie mehr darüber erfahren möchten, wann die Zwei-Faktoren-Methode verwendet werden soll, lesen Sie dieses Video von Sophia.org und die “ohne replikation” und “mit Replikation” Beispiele aus echten Statistiken.

Korrelation in Excel

Die Berechnung der Korrelation in Excel ist viel einfacher als die t-Test oder eine ANOVA. Verwenden Sie die Datenanalyse Klicken Sie auf die Schaltfläche, um das Fenster Analysis Tools zu öffnen, und wählen Sie Korrelation.

Wählen Sie Ihren Eingabebereich aus, identifizieren Sie Ihre Gruppen als Spalten oder Zeilen und teilen Sie Excel mit, ob Beschriftungen vorhanden sind. Danach drücken Sie OK.

Sie erhalten keine Signifikanzkennzahlen, aber Sie können sehen, wie jede Gruppe mit den anderen korreliert. Ein Wert von Eins ist eine absolute Korrelation, die angibt, dass die Werte genau gleich sind. Je näher der Korrelationswert an eins liegt, desto stärker ist die Korrelation.

Regression in Excel

Die Regression ist einer der am häufigsten verwendeten statistischen Tests in der Industrie, und Excel bietet eine erstaunliche Menge an Leistung für diese Berechnung. Wir führen hier eine schnelle mehrfache Regression in Excel durch. Wenn Sie mit der Regression nicht vertraut sind, lesen Sie den HBR-Leitfaden zur Verwendung der Regression für Unternehmen.

Nehmen wir an, unsere abhängige Variable ist der Blutdruck, und unsere beiden unabhängigen Variablen sind Gewicht und Salzaufnahme. Wir wollen sehen, welcher der bessere Blutdruck ist (oder ob sie beide gut sind).

Klicken Datenanalyse und wählen Sie Regression. Beim Ausfüllen der Eingabebereichsfelder müssen Sie vorsichtig sein. Das Eingabe Y-Bereich Die Box sollte Ihre einzelne abhängige Variable enthalten. Das Eingabe X-Bereich Die Box kann mehrere unabhängige Variablen enthalten. Machen Sie sich für eine einfache Regression keine Sorgen über den Rest (vergessen Sie jedoch nicht, Excel zu sagen, ob Sie Beschriftungen ausgewählt haben).

So sieht unsere Berechnung aus:

Nach dem Schlagen OK, Sie erhalten eine große Ergebnisliste. Ich habe hier den P-Wert sowohl für die Gewichts- als auch für die Salzaufnahme hervorgehoben:

Wie Sie sehen, ist der P-Wert für das Gewicht größer als 0,05, daher gibt es keine signifikante Beziehung. Der P-Wert für Salz liegt jedoch unter 0,05, was auf einen guten Blutdruckwert hindeutet.

Wenn Sie Ihre Regressionsdaten präsentieren möchten, denken Sie daran, dass Sie einem Streudiagramm in Excel eine Regressionslinie hinzufügen können. Es ist eine großartige visuelle Hilfe. So visualisieren Sie Ihre Datenanalyse mit den Power Tools von Excel. So können Sie Ihre Datenanalyse mit den Excel Tools von Excel visualisieren. Excel beendet es mit seinen erweiterten Datenverwaltungsfunktionen. Wenn Sie eines der neuen Tools verwendet haben, werden Sie alle benötigen. Werden Sie zum Meister Ihrer Datenanalyse mit Elektrowerkzeugen! Lesen Sie mehr für diese Analyse.

Excel-Statistiken: Überraschend gut

Excel ist zwar nicht für seine statistische Leistungsfähigkeit bekannt, enthält jedoch wirklich nützliche Funktionen. Insbesondere, wenn Sie das Statistikanalyse-Add-In Data Analysis Toolpak heruntergeladen haben. Ich hoffe, Sie haben gelernt, mit dem Toolpak umzugehen, und dass Sie jetzt alleine herumspielen können, um herauszufinden, wie Sie mehr Funktionen nutzen können.

Bringen Sie Ihre Excel-Kenntnisse jetzt auf die nächste Stufe. In unseren Artikeln zur Verwendung der Excel-Funktion "Goal Seek" für mehr Datenverarbeitung, zum Beherrschen von IF-Anweisungen in Excel und zum Hinzufügen von Dropdown-Listen als Zellen in Excel.

Ich habe auch Links zu anderen Websites mit guten Statistik-Tutorials erstellt, bei denen wir verwirrende Konzepte überspringen mussten. Lesen Sie unseren Leitfaden zu kostenlosen Statistikressourcen. Lernen Sie Statistiken kostenlos mit diesen 6 Ressourcen. Lernen Sie Statistiken kostenlos mit diesen 6 Ressourcen. Statistiken haben den Ruf eines Themas, das schwer zu verstehen ist. Wenn Sie jedoch von der richtigen Quelle lernen, werden Sie die Umfrageergebnisse, Wahlberichte und Ihre Klassenzuweisungen in kürzester Zeit besser verstehen. Lesen Sie auch mehr.

Erfahren Sie mehr über: Microsoft Excel, Tabellenkalkulation.