Wie man eine grundlegende Datenanalyse in Excel durchführt

Wie man eine grundlegende Datenanalyse in Excel durchführt

Wenn Sie Statistiken ausführen, möchten Sie meistens eine Statistiksoftware verwenden. Diese Tools wurden entwickelt, um Berechnungen durchzuführen wie T -Tests, Chi-Quadrat-Tests, Korrelationen und so weiter. Excel ist nicht für die Datenanalyse gedacht. Aber das bedeutet nicht, dass Sie es nicht tun können.





Leider sind die statistischen Funktionen von Excel nicht immer intuitiv. Und sie liefern Ihnen normalerweise esoterische Ergebnisse. Anstatt Statistikfunktionen zu verwenden, verwenden wir also das Excel-Statistik-Add-In: das Datenanalyse Werkzeugpaket.





Das Toolpak enthält trotz seiner eher unglücklichen Schreibweise eine Vielzahl nützlicher Statistikfunktionen. Mal sehen, was wir mit Excel-Statistiken machen können.





Hinzufügen des Excel Data Analysis Toolpak

Während du kann Erstellen Sie Statistiken ohne das Data Analysis Toolpak, es ist viel einfacher damit. Um das Toolpak in Excel 2016 zu installieren, gehen Sie zu Datei > Optionen > Add-Ins .

Klicken gehen neben 'Verwalten: Excel-Add-Ins'.



Aktivieren Sie im resultierenden Fenster das Kontrollkästchen neben Analyse-Toolpak und dann klick OK .

Wenn Sie das Data Analysis Toolpak korrekt zu Excel hinzugefügt haben, sehen Sie ein Datenanalyse Knopf im Daten Registerkarte, gruppiert in die Analyse Sektion:





Wenn Sie noch mehr Leistung wünschen, sollten Sie sich die anderen Add-Ins von Excel ansehen.

Beschreibende Statistik in Excel

Unabhängig davon, welchen statistischen Test Sie ausführen, möchten Sie wahrscheinlich zuerst die deskriptiven Statistiken von Excel abrufen. Dadurch erhalten Sie Informationen zu Mittelwerten, Medianen, Varianz, Standardabweichung und Fehler, Kurtosis, Schiefe und einer Vielzahl anderer Zahlen.





Das Ausführen von beschreibenden Statistiken in Excel ist einfach. Klicken Datenanalyse Wählen Sie auf der Registerkarte Daten die Option Beschreibende Statistik, und wählen Sie Ihren Eingangsbereich. Klicken Sie auf den Pfeil neben dem Eingabebereichsfeld, klicken und ziehen Sie, um Ihre Daten auszuwählen, und drücken Sie Eintreten (oder klicken Sie auf den entsprechenden Abwärtspfeil), wie im GIF unten.

Stellen Sie danach sicher, dass Sie Excel mitteilen, ob Ihre Daten Beschriftungen haben, ob Sie die Ausgabe in einem neuen Blatt oder auf demselben Blatt wünschen und ob Sie zusammenfassende Statistiken und andere Optionen wünschen.

Danach schlagen OK , und Sie erhalten Ihre beschreibenden Statistiken:

t-Test für Studenten in Excel

Die T -test ist einer der grundlegendsten statistischen Tests und lässt sich mit dem Toolpak einfach in Excel berechnen. Drücke den Datenanalyse und scrollen Sie nach unten, bis Sie das T -Testoptionen.

Sie haben drei Möglichkeiten:

  • t-Test: Gepaarte zwei Stichproben für Mittelwerte sollte verwendet werden, wenn Ihre Messungen oder Beobachtungen gepaart wurden. Verwenden Sie dies, wenn Sie zwei Messungen an denselben Probanden durchgeführt haben, z. B. den Blutdruck vor und nach einem Eingriff.
  • t-Test: Zweistichproben unter Annahme gleicher Varianzen sollte verwendet werden, wenn Ihre Messungen unabhängig sind (was normalerweise bedeutet, dass sie an zwei verschiedenen Themengruppen durchgeführt wurden). Wir werden den Teil 'gleiche Varianzen' gleich besprechen.
  • t-Test: Zweistichproben unter Annahme ungleicher Varianzen wird auch für unabhängige Messungen verwendet, wird jedoch verwendet, wenn Ihre Varianzen ungleich sind.

Um zu testen, ob die Varianzen Ihrer beiden Stichproben gleich sind, müssen Sie einen F-Test ausführen. Finden F-Test bei zwei Stichproben für Abweichungen Wählen Sie es in der Liste Analysetools aus und klicken Sie auf OK .

Geben Sie Ihre beiden Datensätze in die Eingabebereichsfelder ein. Lassen Sie den Alpha-Wert bei 0,05, es sei denn, Sie haben einen Grund, ihn zu ändern. Wenn Sie nicht wissen, was das bedeutet, gehen Sie einfach. Klicken Sie abschließend auf OK .

Excel zeigt Ihnen die Ergebnisse in einem neuen Blatt an (es sei denn, Sie haben ausgewählt Ausgabebereich und eine Zelle in Ihrem aktuellen Blatt):

Sie sehen hier den P-Wert. Wenn es weniger als 0,05 beträgt, haben Sie ungleiche Abweichungen . Also um die zu laufen T -test, sollten Sie die Option ungleiche Varianzen verwenden.

Laufen T -test, wählen Sie den entsprechenden Test aus dem Fenster Analysetools aus und wählen Sie beide Datensätze auf die gleiche Weise wie beim F-Test aus. Lassen Sie den Alpha-Wert bei 0,05 und drücken Sie OK .

Die Ergebnisse enthalten alles, was Sie für eine Meldung benötigen T -test: Mittelwerte, Freiheitsgrade (df), t-Statistik und die P-Werte für ein- und zweiseitige Tests. Wenn der P-Wert weniger als 0,05 beträgt, unterscheiden sich die beiden Proben signifikant.

Wenn Sie sich nicht sicher sind, ob Sie ein ein- oder zweischwänziges verwenden sollen T -test, check out dieser Erklärer von der UCLA .

ANOVA in Excel

Das Excel Data Analysis Toolpak bietet drei Arten der Varianzanalyse (ANOVA). Leider gibt es Ihnen nicht die Möglichkeit, die notwendigen Folgetests wie Tukey oder Bonferroni durchzuführen. Aber Sie können sehen, ob es eine Beziehung zwischen einigen verschiedenen Variablen gibt.

Hier sind die drei ANOVA-Tests in Excel:

  • ANOVA: Einzelfaktor analysiert die Varianz mit einer abhängigen Variablen und einer unabhängigen Variablen. Es ist vorzuziehen, mehrere zu verwenden T -Tests, wenn Sie mehr als zwei Gruppen haben.
  • ANOVA: Zwei-Faktor mit Replikation ist dem gepaarten ähnlich T -Prüfung; es beinhaltet mehrere Messungen an einzelnen Themen. Der „Zwei-Faktoren“-Teil dieses Tests zeigt an, dass es zwei unabhängige Variablen gibt.
  • ANOVA: Zwei-Faktor ohne Replikation beinhaltet zwei unabhängige Variablen, aber keine Replikation bei der Messung.

Wir werden hier die Einzelfaktoranalyse durchgehen. In unserem Beispiel sehen wir uns drei Zahlengruppen mit den Bezeichnungen „Intervention 1“, „Intervention 2“ und „Intervention 3“ an. Um eine ANOVA auszuführen, klicken Sie auf Datenanalyse , dann wähle ANOVA: Einzelfaktor .

Wählen Sie den Eingabebereich aus und teilen Sie Excel mit, ob sich Ihre Gruppen in Spalten oder Zeilen befinden. Außerdem habe ich hier 'Labels in erster Reihe' ausgewählt, damit die Gruppennamen in den Ergebnissen angezeigt werden.

Nach dem Schlagen OK , erhalten wir folgende Ergebnisse:

Beachten Sie, dass der P-Wert kleiner als 0,05 ist, sodass wir ein signifikantes Ergebnis haben. Das bedeutet, dass es einen signifikanten Unterschied zwischen mindestens zwei der Gruppen im Test gibt. Aber weil Excel keine Tests zur Verfügung stellt, um zu bestimmen welcher Gruppen unterscheiden, schauen Sie sich am besten die in der Zusammenfassung angezeigten Durchschnittswerte an. In unserem Beispiel sieht Intervention 3 so aus, als wäre es wahrscheinlich der, der sich unterscheidet.

Das ist statistisch nicht stichhaltig. Aber wenn Sie nur sehen möchten, ob es einen Unterschied gibt und welche Gruppe ihn wahrscheinlich verursacht, wird es funktionieren.

Die Zwei-Faktor-ANOVA ist komplizierter. Wenn Sie mehr darüber erfahren möchten, wann Sie die Zwei-Faktoren-Methode verwenden sollten, lesen Sie dieses Video von Sophia.org und der ' ohne Replikation ' und ' mit Nachbildung “ Beispiele aus Real Statistics.

Korrelation in Excel

Die Berechnung der Korrelation in Excel ist viel einfacher als die T -Test oder eine ANOVA. Verwenden Sie die Datenanalyse , um das Fenster Analysetools zu öffnen und wählen Sie Korrelation .

Wählen Sie Ihren Eingabebereich aus, identifizieren Sie Ihre Gruppen als Spalten oder Zeilen und teilen Sie Excel mit, ob Sie Beschriftungen haben. Danach schlagen OK .

Sie erhalten keine Signifikanzmaße, aber Sie können sehen, wie jede Gruppe mit den anderen korreliert. Ein Wert von eins ist eine absolute Korrelation, die anzeigt, dass die Werte genau gleich sind. Je näher der Korrelationswert an eins liegt, desto stärker ist die Korrelation.

Regression in Excel

Die Regression ist einer der am häufigsten verwendeten statistischen Tests in der Industrie, und Excel bietet eine überraschend große Leistungsfähigkeit für diese Berechnung. Wir führen hier eine schnelle multiple Regression in Excel aus. Wenn Sie mit Regression nicht vertraut sind, schauen Sie sich an HBR-Leitfaden zur Verwendung von Regression für Unternehmen .

Nehmen wir an, unsere abhängige Variable ist der Blutdruck und unsere beiden unabhängigen Variablen sind Gewicht und Salzaufnahme. Wir wollen sehen, welcher der bessere Prädiktor für den Blutdruck ist (oder ob beide gut sind).

Klicken Datenanalyse und wählen Sie Rückschritt . Sie müssen dieses Mal vorsichtig sein, wenn Sie die Eingabebereichsfelder ausfüllen. Die Eingang Y-Bereich box sollte Ihre einzelne abhängige Variable enthalten. Die Eingabe X-Bereich Box kann mehrere unabhängige Variablen enthalten. Machen Sie sich für eine einfache Regression keine Sorgen um den Rest (denken Sie jedoch daran, Excel mitzuteilen, wenn Sie Beschriftungen ausgewählt haben).

So sieht unsere Berechnung aus:

Nach dem Schlagen OK , erhalten Sie eine große Ergebnisliste. Ich habe hier den P-Wert sowohl für das Gewicht als auch für die Salzaufnahme hervorgehoben:

Wie Sie sehen, ist der P-Wert für das Gewicht größer als 0,05, es besteht also kein signifikanter Zusammenhang. Der P-Wert für Salz liegt jedoch unter 0,05, was darauf hindeutet, dass es ein guter Prädiktor für den Blutdruck ist.

Wenn Sie Ihre Regressionsdaten präsentieren möchten, denken Sie daran, dass Sie einem Streudiagramm in Excel eine Regressionslinie hinzufügen können. Es ist ein tolle Sehhilfe für diese Analyse.

Excel-Statistiken: Überraschend leistungsfähig

Obwohl Excel nicht für seine statistische Leistung bekannt ist, enthält es einige wirklich nützliche Funktionen, wie z das PowerQuery-Tool , was für Aufgaben wie das Kombinieren von Datensätzen praktisch ist. (Erfahren Sie, wie Sie Ihr erstes Microsoft Power Query-Skript generieren.) Es gibt auch das Statistik-Add-In Data Analysis Toolpak, das einige der besten Funktionen von Excel wirklich hervorbringt. Ich hoffe, Sie haben gelernt, wie man das Toolpak verwendet, und können jetzt selbst herumspielen, um herauszufinden, wie Sie mehr seiner Funktionen nutzen können.

beste Foto-App für Windows 10

Bringen Sie jetzt Ihre Excel-Kenntnisse mit unseren Artikeln auf die nächste Stufe Verwenden der Zielsuchfunktion von Excel für mehr Datenverarbeitung und Suche nach Werten mit vlookup . Irgendwann möchten Sie vielleicht auch lernen, wie Sie Excel-Daten in Python importieren.

Teilen Teilen Tweet Email Löschen Sie diese Windows-Dateien und -Ordner, um Speicherplatz freizugeben

Müssen Sie Speicherplatz auf Ihrem Windows-Computer freigeben? Hier sind die Windows-Dateien und -Ordner, die sicher gelöscht werden können, um Speicherplatz freizugeben.

Weiter lesen
Verwandte Themen
  • Produktivität
  • Kalkulationstabelle
  • Microsoft Excel
Über den Autor Dann Albright(506 veröffentlichte Artikel)

Dann ist ein Content-Strategie- und Marketingberater, der Unternehmen dabei unterstützt, Nachfrage und Leads zu generieren. Er bloggt auch über Strategie und Content Marketing auf dannalbright.com.

Mehr von Dann Albright

Abonniere unseren Newsletter

Abonnieren Sie unseren Newsletter für technische Tipps, Rezensionen, kostenlose E-Books und exklusive Angebote!

Klicken Sie hier, um sich zu abonnieren