Excel-Zufallsauswahl: Wie erhält man eine Zufallsstichprobe aus einem Datensatz?

  • Teile Das
Michael Brown

In diesem Tutorial lernen Sie, wie Sie Namen, Zahlen oder andere Daten nach dem Zufallsprinzip auswählen, wie Sie eine Zufallsstichprobe ohne Duplikate erhalten und wie Sie mit einem Mausklick eine bestimmte Anzahl oder einen bestimmten Prozentsatz von Zellen, Zeilen oder Spalten zufällig auswählen können.

Ganz gleich, ob Sie Marktforschung für eine neue Produkteinführung betreiben oder die Ergebnisse Ihrer Marketingkampagne auswerten, es ist wichtig, dass Sie eine unvoreingenommene Datenstichprobe für Ihre Analyse verwenden. Und der einfachste Weg, dies zu erreichen, ist eine Zufallsauswahl in Excel.

    Was ist eine Stichprobe?

    Bevor wir uns mit den Stichprobenverfahren befassen, sollten wir ein paar Hintergrundinformationen über die Zufallsauswahl geben und darüber, wann man sie verwenden sollte.

    In der Wahrscheinlichkeitstheorie und Statistik ist eine Stichprobe ist eine Teilmenge von Daten, die aus einem größeren Datensatz ausgewählt wurde, auch bekannt als Bevölkerung Jedes Element einer Zufallsstichprobe wird rein zufällig ausgewählt und hat die gleiche Wahrscheinlichkeit, ausgewählt zu werden. Wozu braucht man eine Stichprobe? Grundsätzlich, um ein unverfälschtes Bild der Gesamtpopulation zu erhalten.

    Sie möchten beispielsweise eine kleine Umfrage unter Ihren Kunden durchführen. Natürlich wäre es unklug, einen Fragebogen an jede einzelne Person in Ihrer mehrtausendköpfigen Datenbank zu verschicken. Wen befragen Sie also? Sind es die 100 neuesten Kunden, die ersten 100 Kunden in alphabetischer Reihenfolge oder die 100 Personen mit den kürzesten Namen? Keiner dieser Ansätze entspricht Ihren Anforderungen, da sie von Natur ausUm eine unparteiische Stichprobe zu erhalten, bei der jeder die gleiche Chance hat, ausgewählt zu werden, führen Sie eine Zufallsauswahl durch, indem Sie eine der unten beschriebenen Methoden anwenden.

    Excel-Zufallsauswahl mit Formeln

    In Excel gibt es keine eingebaute Funktion, um Zellen nach dem Zufallsprinzip auszuwählen, aber Sie können eine der Funktionen verwenden, um Zufallszahlen zu generieren. Diese können wahrscheinlich nicht als einfache intuitive Formeln bezeichnet werden, aber sie funktionieren.

    Auswahl eines Zufallswertes aus einer Liste

    Angenommen, Sie haben eine Liste von Namen in den Zellen A2:A10 und möchten einen Namen zufällig aus der Liste auswählen, so können Sie dies mit einer der folgenden Formeln tun:

    =INDEX($A$2:$A$10,RANDBETWEEN(1,COUNTA($A$2:$A$10)),1)

    oder

    =INDEX($A$2:$A$10,RANDBETWEEN(1,ROWS($A$2:$A$10)),1)

    Das war's! Ihre zufällige Namensauswahl für Excel ist nun fertig eingerichtet und einsatzbereit:

    Hinweis: Bitte beachten Sie, dass RANDBETWEEN ein flüchtig Funktion, d.h. sie wird bei jeder Änderung, die Sie am Arbeitsblatt vornehmen, neu berechnet. Dadurch ändert sich auch Ihre Zufallsauswahl. Um dies zu verhindern, können Sie den extrahierten Namen kopieren und als Wert in eine andere Zelle einfügen ( Einfügen Spezial > Werte Eine ausführliche Anleitung finden Sie unter Ersetzen von Formeln durch Werte.

    Natürlich können diese Formeln nicht nur zufällige Namen, sondern auch zufällige Zahlen, Datumsangaben oder beliebige andere zufällige Zellen auswählen.

    Wie diese Formeln funktionieren

    Kurz gesagt, Sie verwenden die Funktion INDEX, um einen Wert aus der Liste zu extrahieren, der auf einer zufälligen Zeilennummer basiert, die von RANDBETWEEN zurückgegeben wird.

    Genauer gesagt erzeugt die Funktion RANDBETWEEN eine Zufallszahl zwischen den beiden von Ihnen angegebenen Werten. Für den unteren Wert geben Sie die Zahl 1 an. Für den oberen Wert verwenden Sie entweder COUNTA oder ROWS, um die Gesamtzahl der Zeilen zu ermitteln. Als Ergebnis gibt RANDBETWEEN eine Zufallszahl zwischen 1 und der Gesamtzahl der Zeilen in Ihrem Datensatz zurück. Diese Zahl geht in den zeilen_nummer Argument der INDEX-Funktion, das ihr mitteilt, welche Zeile ausgewählt werden soll. Für die spalte_num Argument verwenden wir 1, da wir einen Wert aus der ersten Spalte extrahieren wollen.

    Hinweis: Diese Methode eignet sich gut für die Auswahl von eine zufällige Zelle Wenn Ihre Stichprobe mehrere Zellen umfassen soll, kann die obige Formel mehrere Vorkommen desselben Wertes zurückgeben, da die Funktion RANDBETWEEN nicht duplikatfrei ist. Dies ist insbesondere dann der Fall, wenn Sie eine relativ große Stichprobe aus einer relativ kleinen Liste auswählen. Das nächste Beispiel zeigt, wie Sie in Excel eine Zufallsauswahl ohne Duplikate durchführen können.

    Zufällige Auswahl in Excel ohne Duplikate

    Es gibt mehrere Möglichkeiten, in Excel Zufallsdaten ohne Duplikate auszuwählen. Im Allgemeinen verwenden Sie die Funktion RAND, um jeder Zelle eine Zufallszahl zuzuweisen, und wählen dann einige Zellen mit Hilfe einer Indexrangformel aus.

    Mit der Namensliste in den Zellen A2:A16 führen Sie bitte die folgenden Schritte aus, um einige zufällige Namen zu extrahieren:

    1. Geben Sie die Rand-Formel in B2 ein, und kopieren Sie sie in die Spalte:

    =RAND()

  • Geben Sie die folgende Formel in C2 ein, um einen Zufallswert aus Spalte A zu extrahieren:
  • =INDEX($A$2:$A$16, RANK(B2,$B$2:$B$16), 1)

  • Kopieren Sie die obige Formel in so viele Zellen, wie Sie zufällige Werte auswählen möchten. In unserem Fall kopieren wir die Formel in vier weitere Zellen (C2:C6).
  • Das war's! Fünf zufällige Namen werden ohne Duplikate extrahiert:

    Wie diese Formel funktioniert

    Wie im vorherigen Beispiel verwenden Sie die Funktion INDEX, um einen Wert aus Spalte A auf der Grundlage einer zufälligen Zeilenkoordinate zu extrahieren. In diesem Fall sind zwei verschiedene Funktionen erforderlich, um den Wert zu erhalten:

    • Die RAND-Formel füllt Spalte B mit Zufallszahlen auf.
    • Die Funktion RANK gibt den Rang einer zufälligen Zahl in derselben Zeile zurück. Zum Beispiel liefert RANK(B2,$B$2:$B$16) in Zelle C2 den Rang der Zahl in B2. Beim Kopieren nach C3 ändert sich die relative Referenz B2 in B3 und gibt den Rang der Zahl in B3 zurück usw.
    • Die von RANK zurückgegebene Zahl wird an die zeilen_zahl Argument der INDEX-Funktion, so dass sie den Wert aus dieser Zeile auswählt. In der spalte_num geben Sie 1 an, weil Sie einen Wert aus der ersten Spalte extrahieren wollen.

    Ein Wort der Warnung! Wie in der obigen Abbildung zu sehen ist, enthält unsere Excel-Zufallsauswahl nur eindeutige Werte. Theoretisch besteht jedoch eine geringe Chance, dass Duplikate in Ihrer Stichprobe auftauchen. Der Grund dafür ist folgender: Bei einem sehr großen Datensatz könnte RAND doppelte Zufallszahlen generieren, und RANK wird für diese Zahlen den gleichen Rang zurückgeben. Ich persönlich habe bei meinen Tests nie Duplikate erhalten, aber theoretisch ist eine solche Wahrscheinlichkeitgibt es.

    Wenn Sie eine kugelsichere Formel suchen, um eine zufällige Auswahl mit nur eindeutigen Werten zu erhalten, dann verwenden Sie die Kombination RANK + COUNTIF oder RANK.EQ + COUNTIF anstelle von RANK allein.

    Die vollständige Formel ist etwas umständlich, aber 100% duplikatfrei:

    =INDEX($A$2:$A$16, RANK.EQ(B2, $B$2:$B$16) + COUNTIF($B$2:B2, B2) - 1, 1)

    Anmerkungen:

    • Wie RANDBETWEEN erzeugt auch die Excel-Funktion RAND bei jeder Neuberechnung Ihres Arbeitsblatts neue Zufallszahlen, so dass sich die Zufallsauswahl ändert. Um Ihr Muster unverändert zu lassen, kopieren Sie es und fügen Sie es an anderer Stelle als Werte ein ( Kleister Besonderes > Werte ).
    • Wenn ein und derselbe Name (eine Zahl, ein Datum oder ein anderer Wert) mehr als einmal in Ihrem Originaldatensatz vorkommt, kann eine Stichprobe auch mehrere Vorkommen desselben Wertes enthalten.

    Weitere Möglichkeiten, eine Zufallsauswahl ohne Wiederholungen in Excel 365 - 2010 zu erhalten, werden hier beschrieben: Wie man in Excel eine Zufallsstichprobe ohne Duplikate erhält.

    Zufällige Zeilen in Excel auswählen

    Wenn Ihr Arbeitsblatt mehr als eine Datenspalte enthält, können Sie auf diese Weise eine Zufallsstichprobe auswählen: Ordnen Sie jeder Zeile eine Zufallszahl zu, sortieren Sie diese Zahlen und wählen Sie die gewünschte Anzahl von Zeilen aus. Die detaillierten Schritte folgen unten.

    1. Fügen Sie eine neue Spalte rechts oder links von Ihrer Tabelle ein (in diesem Beispiel Spalte D).
    2. Geben Sie in der ersten Zelle der eingefügten Spalte, ohne die Spaltenüberschriften, die Formel RAND ein: =RAND()
    3. Doppelklicken Sie auf den Füllgriff, um die Formel in die Spalte zu kopieren. Als Ergebnis wird jeder Zeile eine Zufallszahl zugewiesen.
    4. Sortieren der Zufallszahlen größte bis kleinste (eine Sortierung in aufsteigender Reihenfolge würde die Spaltenüberschriften an den unteren Rand der Tabelle verschieben, sortieren Sie also unbedingt absteigend). Gehen Sie dazu in den Bereich Daten tab> Sortieren & Filtern Excel erweitert automatisch die Auswahl und sortiert die gesamten Zeilen in zufälliger Reihenfolge.

      Wenn Sie mit der zufälligen Sortierung Ihrer Tabelle nicht zufrieden sind, klicken Sie erneut auf die Schaltfläche Sortieren, um die Tabelle neu zu sortieren. Eine ausführliche Anleitung finden Sie unter Zufällige Sortierung in Excel.

    5. Wählen Sie schließlich die gewünschte Anzahl von Zeilen für Ihr Muster aus, kopieren Sie sie und fügen Sie sie an der gewünschten Stelle ein.

    Um sich die in diesem Tutorial besprochenen Formeln genauer anzusehen, können Sie gerne unsere Beispielarbeitsmappe zu Excel Random Selection herunterladen.

    Zufallsauswahl in Excel mit dem Tool Randomize

    Nachdem Sie nun eine Handvoll Formeln kennen, um eine Zufallsstichprobe in Excel zu erhalten, wollen wir sehen, wie Sie das gleiche Ergebnis mit einem Mausklick erreichen können.

    Mit dem Zufallsgenerator für Excel, der in unserer Ultimate Suite enthalten ist, können Sie wie folgt vorgehen:

    1. Markieren Sie eine beliebige Zelle in Ihrer Tabelle.
    2. Gehen Sie zum Ablebits Tools tab> Versorgungsunternehmen Gruppe, und klicken Sie auf Randomisieren > Zufällig auswählen :

  • Wählen Sie im Fenster des Add-Ins aus, was ausgewählt werden soll: zufällige Zeilen, zufällige Spalten oder zufällige Zellen.
  • Geben Sie die Anzahl oder den Prozentsatz für den gewünschten Stichprobenumfang an.
  • Klicken Sie auf die Wählen Sie Taste. Erledigt!
  • So können wir zum Beispiel 5 zufällige Zeilen aus unserem Beispieldatensatz auswählen:

    Sie erhalten dann in einer Sekunde eine Zufallsauswahl:

    Jetzt können Sie Strg + C drücken, um Ihre Stichprobe zu kopieren, und dann Strg + V drücken, um sie an einer Stelle auf demselben oder einem anderen Blatt einzufügen.

    Wenn Sie das Randomize-Tool in Ihren Arbeitsblättern testen möchten, können Sie unten eine Testversion von Ultimate Suite herunterladen. Falls Sie Google-Tabellen verwenden, finden Sie vielleicht unseren Zufallsgenerator für Google Sheets nützlich.

    Verfügbare Downloads

    Auswahl der Stichprobe - Formelbeispiele (.xlsx-Datei)

    Ultimate Suite - Testversion (.exe-Datei)

    Michael Brown ist ein begeisterter Technologie-Enthusiast mit einer Leidenschaft für die Vereinfachung komplexer Prozesse mithilfe von Softwaretools. Mit mehr als einem Jahrzehnt Erfahrung in der Technologiebranche hat er seine Fähigkeiten in Microsoft Excel und Outlook sowie Google Sheets und Docs verfeinert. Michaels Blog widmet sich dem Teilen seines Wissens und seiner Expertise mit anderen und bietet leicht verständliche Tipps und Tutorials zur Verbesserung von Produktivität und Effizienz. Egal, ob Sie ein erfahrener Profi oder ein Anfänger sind, Michaels Blog bietet wertvolle Einblicke und praktische Ratschläge, wie Sie diese wichtigen Softwaretools optimal nutzen können.