Berechnung der Varianz in Excel - Stichprobe & Probe; Formel für die Varianz der Grundgesamtheit

  • Teile Das
Michael Brown

In diesem Tutorium werden wir uns ansehen, wie man eine Varianzanalyse in Excel durchführt und welche Formeln zu verwenden sind, um die Varianz einer Stichprobe und einer Grundgesamtheit zu ermitteln.

Die Varianz ist eines der nützlichsten Werkzeuge in der Wahrscheinlichkeitstheorie und Statistik. In der Wissenschaft beschreibt sie, wie weit jede Zahl im Datensatz vom Mittelwert abweicht. In der Praxis zeigt sie oft, wie stark sich etwas verändert. Zum Beispiel hat die Temperatur in Äquatornähe eine geringere Varianz als in anderen Klimazonen. In diesem Artikel werden wir verschiedene Methoden zur Berechnung der Varianz in Excel analysieren.

    Was ist Varianz?

    Abweichung ist das Maß für die Variabilität eines Datensatzes, das angibt, wie weit die verschiedenen Werte auseinander liegen. Mathematisch ist es definiert als der Durchschnitt der quadrierten Differenzen vom Mittelwert.

    Um besser zu verstehen, was Sie eigentlich mit der Varianz berechnen, betrachten Sie bitte dieses einfache Beispiel.

    Angenommen, in Ihrem örtlichen Zoo gibt es 5 Tiger, die 14, 10, 8, 6 und 2 Jahre alt sind.

    Befolgen Sie diese einfachen Schritte, um die Abweichung zu ermitteln:

    1. Berechnen Sie den Mittelwert (einfacher Durchschnitt) der fünf Zahlen:

    2. Ziehen Sie von jeder Zahl den Mittelwert ab, um die Differenzen zu ermitteln. Zur Veranschaulichung stellen wir die Differenzen in einem Diagramm dar:

    3. Quadriere jede Differenz.
    4. Berechne den Durchschnitt der quadrierten Differenzen.

    Die Varianz beträgt also 16. Doch was bedeutet diese Zahl eigentlich?

    In Wahrheit gibt die Varianz nur eine sehr allgemeine Vorstellung von der Streuung des Datensatzes. Ein Wert von 0 bedeutet, dass es keine Streuung gibt, d. h. alle Zahlen im Datensatz sind gleich. Je größer die Zahl, desto stärker sind die Daten gestreut.

    Dieses Beispiel bezieht sich auf die Varianz der Grundgesamtheit (d. h. 5 Tiger sind die gesamte Gruppe, an der Sie interessiert sind). Wenn es sich bei Ihren Daten um eine Auswahl aus einer größeren Grundgesamtheit handelt, müssen Sie die Stichprobenvarianz anhand einer etwas anderen Formel berechnen.

    Berechnung der Varianz in Excel

    Es gibt 6 eingebaute Funktionen für die Abweichung in Excel: VAR, VAR.S, VARP, VAR.P, VARA, und VARPA.

    Die Wahl der Varianzformel wird durch folgende Faktoren bestimmt:

    • Die Version von Excel, die Sie verwenden.
    • Ob Sie die Stichproben- oder die Populationsvarianz berechnen.
    • ob Sie Text und logische Werte auswerten oder ignorieren wollen.

    Excel-Abweichungsfunktionen

    Die folgende Tabelle gibt einen Überblick über die in Excel verfügbaren Variationsfunktionen, um Ihnen die Auswahl der für Ihre Bedürfnisse am besten geeigneten Formel zu erleichtern.

    Name Excel-Version Datentyp Text und Logicals
    VAR 2000 - 2019 Muster Unbeachtet
    VAR.S 2010 - 2019 Muster Unbeachtet
    VARA 2000 - 2019 Muster Bewertet
    VARP 2000 - 2019 Bevölkerung Unbeachtet
    VAR.P 2010 - 2019 Bevölkerung Unbeachtet
    VARPA 2000 - 2019 Bevölkerung Bewertet

    VAR.S vs. VARA und VAR.P vs. VARPA

    VARA und VARPA unterscheiden sich von anderen Varianzfunktionen nur in der Art und Weise, wie sie logische und Textwerte in Referenzen behandeln. Die folgende Tabelle gibt einen Überblick darüber, wie Textdarstellungen von Zahlen und logischen Werten ausgewertet werden.

    Argument Typ VAR, VAR.S, VARP, VAR.P VARA & VARPA
    Logische Werte in Arrays und Referenzen Unbeachtet Bewertet

    (WAHR=1, FALSCH=0)

    Textdarstellungen von Zahlen in Arrays und Referenzen Unbeachtet Bewertet als Null
    Logische Werte und Textdarstellungen von Zahlen, die direkt in Argumente eingegeben werden Bewertet

    (WAHR=1, FALSCH=0)

    Leere Zellen Unbeachtet

    Berechnung der Stichprobenabweichung in Excel

    A Muster ist ein Datensatz, der aus der gesamten Grundgesamtheit entnommen wurde, und die aus einer Stichprobe berechnete Varianz wird als Stichprobenvarianz .

    Wenn man zum Beispiel wissen möchte, wie die Größe der Menschen variiert, wäre es technisch nicht machbar, alle Menschen auf der Erde zu vermessen. Die Lösung ist, eine Stichprobe der Bevölkerung zu nehmen, z. B. 1.000 Menschen, und die Größe der gesamten Bevölkerung auf der Grundlage dieser Stichprobe zu schätzen.

    Die Stichprobenvarianz wird mit dieser Formel berechnet:

    Wo:

    • x̄ ist der Mittelwert (einfacher Durchschnitt) der Stichprobenwerte.
    • n ist der Stichprobenumfang, d. h. die Anzahl der Werte in der Stichprobe.

    In Excel gibt es 3 Funktionen zur Ermittlung der Stichprobenvarianz: VAR, VAR.S und VARA.

    VAR-Funktion in Excel

    Sie ist die älteste Excel-Funktion zur Schätzung der Varianz auf der Grundlage einer Stichprobe. Die VAR-Funktion ist in allen Excel-Versionen 2000 bis 2019 verfügbar.

    VAR(Zahl1, [Zahl2], ...)

    Hinweis: In Excel 2010 wurde die Funktion VAR durch VAR.S ersetzt, die eine höhere Genauigkeit bietet. Obwohl VAR aus Gründen der Abwärtskompatibilität weiterhin verfügbar ist, wird empfohlen, VAR.S in den aktuellen Excel-Versionen zu verwenden.

    VAR.S-Funktion in Excel

    Sie ist das moderne Gegenstück zur VAR-Funktion von Excel. Verwenden Sie die VAR.S-Funktion, um die Stichprobenvarianz in Excel 2010 und später zu ermitteln.

    VAR.S(Zahl1, [Zahl2], ...)

    VARA-Funktion in Excel

    Die Excel-Funktion VARA liefert eine Stichprobenabweichung auf der Grundlage einer Reihe von Zahlen, Text und logischen Werten, wie in dieser Tabelle dargestellt.

    VARA(Wert1, [Wert2], ...)

    Beispiel einer Varianzformel in Excel

    Wenn Sie mit einem numerischen Datensatz arbeiten, können Sie jede der oben genannten Funktionen zur Berechnung der Stichprobenvarianz in Excel verwenden.

    Um beispielsweise die Varianz einer Stichprobe zu ermitteln, die aus 6 Positionen besteht (B2:B7), können Sie eine der folgenden Formeln verwenden:

    =VAR(B2:B7)

    =VAR.S(B2:B7)

    =VARA(B2:B7)

    Wie in der Abbildung zu sehen ist, liefern alle Formeln das gleiche Ergebnis (gerundet auf 2 Dezimalstellen):

    Um das Ergebnis zu überprüfen, führen wir eine manuelle Var-Berechnung durch:

    1. Ermitteln Sie den Mittelwert, indem Sie die Funktion MITTELWERT verwenden:

      =DURCHSCHNITT(B2:B7)

      Der Durchschnitt geht in eine beliebige leere Zelle, beispielsweise B8.

    2. Ziehen Sie den Durchschnitt von jeder Zahl in der Stichprobe ab:

      =B2-$B$8

      Die Differenzen gehen in die Spalte C, beginnend in C2.

    3. Quadriere jede Differenz und trage die Ergebnisse in Spalte D ein, beginnend in D2:

      =C2^2

    4. Addieren Sie die quadrierten Differenzen und teilen Sie das Ergebnis durch die Anzahl der Artikel in der Stichprobe minus 1:

      =SUM(D2:D7)/(6-1)

    Wie Sie sehen, ist das Ergebnis unserer manuellen var-Berechnung genau dasselbe wie die Zahl, die von den integrierten Funktionen von Excel zurückgegeben wird:

    Wenn Ihr Datensatz die Boolesche und/oder Text Der Grund dafür ist, dass VAR und VAR.S alle Werte außer Zahlen in Referenzen ignorieren, während VARA Textwerte als Nullen, TRUE als 1 und FALSE als 0 bewertet. Wählen Sie also die Varianzfunktion für Ihre Berechnungen sorgfältig aus, je nachdem, ob Sie Text und Logicals verarbeiten oder ignorieren wollen.

    Berechnung der Bevölkerungsabweichung in Excel

    Bevölkerung sind alle Mitglieder einer bestimmten Gruppe, d. h. alle Beobachtungen im Untersuchungsgebiet. Varianz der Bevölkerung beschreibt, wie die Datenpunkte in der gesamten Grundgesamtheit verteilt sind.

    Die Varianz der Population kann mit dieser Formel ermittelt werden:

    Wo:

    • x̄ ist der Mittelwert der Grundgesamtheit.
    • n ist die Populationsgröße, d. h. die Gesamtzahl der Werte in der Population.

    Es gibt 3 Funktionen zur Berechnung der Bevölkerungsvarianz in Excel: VARP, VAR.P und VARPA.

    VARP-Funktion in Excel

    Die Excel-Funktion VARP liefert die Varianz einer Grundgesamtheit auf der Basis der gesamten Zahlenmenge und ist in allen Versionen von Excel 2000 bis 2019 verfügbar.

    VARP(Zahl1, [Zahl2], ...)

    Hinweis: In Excel 2010 wurde VARP durch VAR.P ersetzt, wird aber aus Gründen der Abwärtskompatibilität beibehalten. Es wird empfohlen, VAR.P in den aktuellen Excel-Versionen zu verwenden, da es keine Garantie dafür gibt, dass die VARP-Funktion in zukünftigen Excel-Versionen verfügbar sein wird.

    VAR.P-Funktion in Excel

    Es handelt sich um eine verbesserte Version der VARP-Funktion, die in Excel 2010 und höher verfügbar ist.

    VAR.P(Zahl1, [Zahl2], ...)

    VARPA-Funktion in Excel

    Die VARPA-Funktion berechnet die Varianz einer Grundgesamtheit auf Basis der gesamten Menge an Zahlen, Text und logischen Werten und ist in allen Excel-Versionen 2000 bis 2019 verfügbar.

    VARA(Wert1, [Wert2], ...)

    Formel für die Bevölkerungsabweichung in Excel

    Im Beispiel für die Berechnung der Varianz haben wir eine Varianz von 5 Prüfungsergebnissen ermittelt, wobei wir davon ausgegangen sind, dass diese Ergebnisse eine Auswahl aus einer größeren Gruppe von Studierenden darstellen. Wenn Sie Daten über alle Studierenden in der Gruppe erheben, repräsentieren diese Daten die gesamte Population, und Sie berechnen die Varianz der Population mit Hilfe der oben genannten Funktionen.

    Angenommen, wir haben die Prüfungsergebnisse einer Gruppe von 10 Schülern (B2:B11), die die gesamte Grundgesamtheit darstellen, so dass wir die Varianz mit diesen Formeln berechnen:

    =VARP(B2:B11)

    =VAR.P(B2:B11)

    =VARPA(B2:B11)

    Und alle Formeln werden das gleiche Ergebnis liefern:

    Um sicherzugehen, dass Excel die Abweichung richtig berechnet hat, können Sie die Formel für die manuelle Abweichungsberechnung verwenden, die in der folgenden Abbildung dargestellt ist:

    Wenn einige der Studenten nicht an der Prüfung teilgenommen haben und statt einer Punktzahl N/A haben, wird die VARPA-Funktion ein anderes Ergebnis liefern. Der Grund dafür ist, dass VARPA Textwerte als Nullen auswertet, während VARP und VAR.P Text- und logische Werte in Referenzen ignorieren. Weitere Einzelheiten finden Sie unter VAR.P vs. VARPA.

    Abweichungsformel in Excel - Verwendungshinweise

    Um die Abweichungsanalyse in Excel korrekt durchzuführen, beachten Sie bitte diese einfachen Regeln:

    • Geben Sie Argumente als Werte, Arrays oder Zellreferenzen an.
    • In Excel 2007 und späteren Versionen können Sie bis zu 255 Argumente für eine Stichprobe oder Grundgesamtheit angeben; in Excel 2003 und älteren Versionen sind es bis zu 30 Argumente.
    • Nur zu bewerten Zahlen in Referenzen, wobei leere Zellen, Text und die logischen Werte ignoriert werden, verwenden Sie die Funktion VAR oder VAR.S zur Berechnung der Stichprobenvarianz und VARP oder VAR.P zur Ermittlung der Bevölkerungsvarianz.
    • Zur Bewertung logisch und Text Werte in Referenzen, verwenden Sie die Funktion VARA oder VARPA.
    • Mindestens bereitstellen zwei numerische Werte zu einer Stichprobenvarianzformel und mindestens ein numerischer Wert in eine Formel für die Varianz der Grundgesamtheit in Excel einfügen, da sonst ein Fehler #DIV/0! auftritt.
    • Argumente, die Text enthalten, der nicht als Zahlen interpretiert werden kann, führen zu #VALUE!-Fehlern.

    Varianz vs. Standardabweichung in Excel

    Die Varianz ist zweifelsohne ein nützliches Konzept in der Wissenschaft, aber sie liefert nur sehr wenige praktische Informationen. Wir haben zum Beispiel das Alter der Tigerpopulation in einem örtlichen Zoo ermittelt und die Varianz berechnet, die 16 beträgt. Die Frage ist: Wie können wir diese Zahl tatsächlich verwenden?

    Mit Hilfe der Varianz können Sie die Standardabweichung berechnen, die ein viel besseres Maß für die Schwankungsbreite eines Datensatzes ist.

    Standardabweichung wird als Quadratwurzel aus der Varianz berechnet. Wir nehmen also die Quadratwurzel aus 16 und erhalten die Standardabweichung von 4.

    In Kombination mit dem Mittelwert kann die Standardabweichung Aufschluss darüber geben, wie alt die meisten Tiger sind. Wenn beispielsweise der Mittelwert 8 und die Standardabweichung 4 beträgt, ist die Mehrheit der Tiger im Zoo zwischen 4 Jahren (8 - 4) und 12 Jahren (8 + 4) alt.

    Microsoft Excel verfügt über spezielle Funktionen zur Berechnung der Standardabweichung einer Stichprobe und einer Grundgesamtheit. Eine ausführliche Erläuterung aller Funktionen finden Sie in diesem Tutorial: Wie man die Standardabweichung in Excel berechnet.

    Um sich die in diesem Tutorial besprochenen Formeln genauer anzusehen, können Sie gerne unsere Beispiel-Arbeitsmappe am Ende dieses Beitrags herunterladen. Ich danke Ihnen für die Lektüre und hoffe, Sie nächste Woche in unserem Blog begrüßen zu dürfen!

    Praxis-Arbeitsheft

    Varianzberechnung in Excel - Beispiele (.xlsx-Datei)

    Michael Brown ist ein begeisterter Technologie-Enthusiast mit einer Leidenschaft für die Vereinfachung komplexer Prozesse mithilfe von Softwaretools. Mit mehr als einem Jahrzehnt Erfahrung in der Technologiebranche hat er seine Fähigkeiten in Microsoft Excel und Outlook sowie Google Sheets und Docs verfeinert. Michaels Blog widmet sich dem Teilen seines Wissens und seiner Expertise mit anderen und bietet leicht verständliche Tipps und Tutorials zur Verbesserung von Produktivität und Effizienz. Egal, ob Sie ein erfahrener Profi oder ein Anfänger sind, Michaels Blog bietet wertvolle Einblicke und praktische Ratschläge, wie Sie diese wichtigen Softwaretools optimal nutzen können.