Lựa chọn ngẫu nhiên Excel: cách lấy mẫu ngẫu nhiên từ tập dữ liệu

  • Chia Sẻ Cái Này
Michael Brown

Hướng dẫn này sẽ hướng dẫn bạn một số cách nhanh chóng để chọn ngẫu nhiên tên, số hoặc bất kỳ dữ liệu nào khác. Bạn cũng sẽ tìm hiểu cách lấy mẫu ngẫu nhiên mà không trùng lặp và cách chọn ngẫu nhiên một số hoặc tỷ lệ phần trăm ô, hàng hoặc cột cụ thể chỉ bằng một cú nhấp chuột.

Cho dù bạn thực hiện nghiên cứu thị trường cho một sản phẩm mới ra mắt sản phẩm hoặc đánh giá kết quả của chiến dịch tiếp thị, điều quan trọng là bạn phải sử dụng mẫu dữ liệu khách quan để phân tích. Và cách dễ nhất để đạt được điều này là lấy lựa chọn ngẫu nhiên trong Excel.

    Mẫu ngẫu nhiên là gì?

    Trước khi thảo luận về các kỹ thuật lấy mẫu, hãy cung cấp một chút thông tin cơ bản về lựa chọn ngẫu nhiên và khi nào bạn có thể muốn sử dụng nó.

    Trong lý thuyết xác suất và thống kê, mẫu ngẫu nhiên là một tập hợp con dữ liệu được chọn từ tập dữ liệu lớn hơn, còn gọi là dân số . Mỗi phần tử của một mẫu ngẫu nhiên được chọn hoàn toàn ngẫu nhiên và có xác suất được chọn như nhau. Tại sao bạn cần một cái? Về cơ bản, để có được thông tin đại diện không thiên vị về tổng dân số.

    Ví dụ: bạn muốn tiến hành một cuộc khảo sát nhỏ giữa các khách hàng của mình. Rõ ràng, sẽ không khôn ngoan nếu gửi bảng câu hỏi cho từng người trong cơ sở dữ liệu nhiều nghìn người của bạn. Vì vậy, ai làm cuộc khảo sát của bạn? Đó sẽ là 100 khách hàng mới nhất hay 100 khách hàng đầu tiên được liệt kê theo thứ tự abc hay 100 người có thời gian ngắn nhấttên? Không có cách tiếp cận nào trong số này phù hợp với nhu cầu của bạn vì chúng có thành kiến ​​bẩm sinh. Để có được một mẫu khách quan trong đó mọi người đều có cơ hội được chọn như nhau, hãy thực hiện lựa chọn ngẫu nhiên bằng cách sử dụng một trong các phương pháp được mô tả bên dưới.

    Lựa chọn ngẫu nhiên Excel với các công thức

    Không tích hợp sẵn để chọn ngẫu nhiên các ô trong Excel, nhưng bạn có thể sử dụng một trong các hàm để tạo số ngẫu nhiên như một giải pháp thay thế. Đây có lẽ không thể được gọi là công thức trực quan đơn giản, nhưng chúng hoạt động.

    Cách chọn một giá trị ngẫu nhiên từ danh sách

    Giả sử bạn có một danh sách tên trong các ô A2:A10 và bạn muốn để chọn ngẫu nhiên một tên từ danh sách. Điều này có thể được thực hiện bằng cách sử dụng một trong các công thức sau:

    =INDEX($A$2:$A$10,RANDBETWEEN(1,COUNTA($A$2:$A$10)),1)

    hoặc

    =INDEX($A$2:$A$10,RANDBETWEEN(1,ROWS($A$2:$A$10)),1)

    Vậy là xong! Bộ chọn tên ngẫu nhiên cho Excel của bạn đã được thiết lập xong và sẵn sàng phục vụ:

    Lưu ý. Xin lưu ý rằng RANDBETWEEN là hàm dễ bay hơi , nghĩa là hàm này sẽ tính toán lại với mọi thay đổi bạn thực hiện đối với trang tính. Do đó, lựa chọn ngẫu nhiên của bạn cũng sẽ thay đổi. Để ngăn điều này xảy ra, bạn có thể sao chép tên được trích xuất và dán dưới dạng giá trị vào một ô khác ( Dán Đặc biệt > Giá trị ). Để biết hướng dẫn chi tiết, vui lòng xem Cách thay thế công thức bằng giá trị.

    Đương nhiên, những công thức này không chỉ có thể chọn tên ngẫu nhiên mà còn chọn số ngẫu nhiên, ngày tháng hoặc bất kỳ thứ gì ngẫu nhiên kháccác ô.

    Cách thức hoạt động của các công thức này

    Tóm lại, bạn sử dụng hàm INDEX để trích xuất một giá trị từ danh sách dựa trên số hàng ngẫu nhiên do RANDBETWEEN trả về.

    Cụ thể hơn, hàm RANDBETWEEN tạo ra một số nguyên ngẫu nhiên giữa hai giá trị mà bạn chỉ định. Đối với giá trị thấp hơn, bạn cung cấp số 1. Đối với giá trị cao hơn, bạn sử dụng COUNTA hoặc ROWS để lấy tổng số hàng. Do đó, RANDBETWEEN trả về một số ngẫu nhiên trong khoảng từ 1 đến tổng số hàng trong tập dữ liệu của bạn. Con số này đi đến đối số row_num của hàm INDEX cho nó biết cần chọn hàng nào. Đối với đối số column_num , chúng tôi sử dụng 1 vì chúng tôi muốn trích xuất một giá trị từ cột đầu tiên.

    Lưu ý. Phương pháp này hoạt động tốt để chọn một ô ngẫu nhiên từ danh sách. Nếu mẫu của bạn được cho là bao gồm một số ô, thì công thức trên có thể trả về một số lần xuất hiện của cùng một giá trị vì hàm RANDBETWEEN không phải là hàm không trùng lặp. Đặc biệt là trường hợp khi bạn chọn một mẫu tương đối lớn từ một danh sách tương đối nhỏ. Ví dụ tiếp theo cho thấy cách thực hiện lựa chọn ngẫu nhiên trong Excel mà không có dữ liệu trùng lặp.

    Cách chọn ngẫu nhiên trong Excel mà không có dữ liệu trùng lặp

    Có một số cách để chọn dữ liệu ngẫu nhiên mà không có dữ liệu trùng lặp trong Excel. Nói chung, bạn sẽ sử dụng hàm RAND để gán một số ngẫu nhiên cho từng ô, sau đó bạn chọn một vài ô theosử dụng công thức Xếp hạng Chỉ mục.

    Với danh sách tên trong các ô A2:A16, vui lòng làm theo các bước sau để trích xuất một số tên ngẫu nhiên:

    1. Nhập công thức Xếp hạng trong B2, và sao chép nó xuống cột:

    =RAND()

  • Đặt công thức bên dưới vào C2 để trích xuất một giá trị ngẫu nhiên từ cột A:
  • =INDEX($A$2:$A$16, RANK(B2,$B$2:$B$16), 1)

  • Sao chép công thức trên vào bao nhiêu ô bằng bao nhiêu giá trị ngẫu nhiên mà bạn muốn chọn. Trong trường hợp của chúng tôi, chúng tôi sao chép công thức vào bốn ô nữa (C2:C6).
  • Vậy là xong! Năm tên ngẫu nhiên được trích xuất mà không trùng lặp:

    Cách thức hoạt động của công thức này

    Giống như trong ví dụ trước, bạn sử dụng hàm INDEX để trích xuất một giá trị từ cột A dựa trên tọa độ hàng ngẫu nhiên. Trong trường hợp này, cần hai hàm khác nhau để lấy:

    • Công thức RAND điền vào cột B các số ngẫu nhiên.
    • Hàm RANK trả về thứ hạng một số ngẫu nhiên trong cùng một hàng ngang. Ví dụ: RANK(B2,$B$2:$B$16) trong ô C2 nhận thứ hạng của số trong B2. Khi được sao chép sang C3, tham chiếu tương đối B2 thay đổi thành B3 và trả về thứ hạng của số trong B3, v.v.
    • Số do RANK trả về được đưa vào đối số row_num của hàm INDEX để nó chọn giá trị từ hàng đó. Trong đối số column_num , bạn cung cấp 1 vì bạn muốn trích xuất một giá trị từ cột đầu tiên.

    Lưu ý! Như minh họa trong ảnh chụp màn hình ở trên, Excel ngẫu nhiên của chúng tôilựa chọn chỉ chứa các giá trị duy nhất. Nhưng về mặt lý thuyết, có rất ít khả năng trùng lặp xuất hiện trong mẫu của bạn. Đây là lý do: trên một tập dữ liệu rất lớn, RAND có thể tạo ra các số ngẫu nhiên trùng lặp và RANK sẽ trả về cùng thứ hạng cho các số đó. Cá nhân tôi chưa bao giờ gặp bất kỳ sự trùng lặp nào trong các thử nghiệm của mình, nhưng về lý thuyết, khả năng như vậy là có tồn tại.

    Nếu bạn đang tìm kiếm một công thức chống đạn để có được lựa chọn ngẫu nhiên chỉ với các giá trị duy nhất, thì hãy sử dụng RANK + Kết hợp COUNTIF hoặc RANK.EQ + COUNTIF thay vì chỉ RANK. Để biết giải thích chi tiết về logic, vui lòng xem Xếp hạng duy nhất trong Excel.

    Công thức hoàn chỉnh hơi rườm rà nhưng 100% không bị trùng lặp:

    =INDEX($A$2:$A$16, RANK.EQ(B2, $B$2:$B$16) + COUNTIF($B$2:B2, B2) - 1, 1)

    Lưu ý:

    • Giống như RANDBETWEEN, hàm RAND của Excel cũng tạo ra các số ngẫu nhiên mới với mỗi lần tính toán lại trang tính của bạn, làm cho lựa chọn ngẫu nhiên thay đổi. Để giữ nguyên mẫu của bạn, hãy sao chép mẫu và dán vào một nơi khác dưới dạng giá trị ( Dán Đặc biệt > Giá trị ).
    • Nếu trùng tên (số, ngày hoặc bất kỳ giá trị nào khác) xuất hiện nhiều lần trong tập dữ liệu gốc của bạn, một mẫu ngẫu nhiên cũng có thể chứa một số lần xuất hiện có cùng giá trị.

    Có nhiều cách khác để có được lựa chọn ngẫu nhiên với không lặp lại trong Excel 365 - 2010 được mô tả tại đây: Cách lấy mẫu ngẫu nhiên trong Excel mà không trùng lặp.

    Cách chọn hàng ngẫu nhiên trong ExcelExcel

    Trong trường hợp trang tính của bạn chứa nhiều hơn một cột dữ liệu, bạn có thể chọn một mẫu ngẫu nhiên theo cách này: gán một số ngẫu nhiên cho mỗi hàng, sắp xếp các số đó và chọn số lượng hàng cần thiết. Các bước chi tiết thực hiện theo bên dưới.

    1. Chèn một cột mới vào bên phải hoặc bên trái bảng của bạn (cột D trong ví dụ này).
    2. Trong ô đầu tiên của bảng được chèn cột, ngoại trừ các tiêu đề cột, hãy nhập công thức RAND: =RAND()
    3. Nhấp đúp vào núm điều khiển điền để sao chép công thức xuống cột. Kết quả là bạn sẽ có một số ngẫu nhiên được chỉ định cho mỗi hàng.
    4. Sắp xếp các số ngẫu nhiên lớn nhất đến nhỏ nhất (sắp xếp theo thứ tự tăng dần sẽ di chuyển các tiêu đề cột ở cuối bảng , vì vậy hãy đảm bảo sắp xếp giảm dần). Đối với điều này, hãy chuyển đến tab Dữ liệu > Sắp xếp & Lọc nhóm và nhấp vào nút ZA. Excel sẽ tự động mở rộng vùng chọn và sắp xếp toàn bộ hàng theo thứ tự ngẫu nhiên.

      Nếu bạn không hoàn toàn hài lòng với cách bảng của mình được sắp xếp ngẫu nhiên, hãy nhấn lại nút sắp xếp để sử dụng. Để biết hướng dẫn chi tiết, vui lòng xem Cách sắp xếp ngẫu nhiên trong Excel.

    5. Cuối cùng, chọn số hàng cần thiết cho mẫu của bạn, sao chép chúng và dán vào bất kỳ đâu bạn thích.

    Để xem kỹ hơn các công thức được thảo luận trong hướng dẫn này, bạn có thể tải xuống mẫu của chúng tôisổ làm việc sang Lựa chọn ngẫu nhiên trong Excel.

    Cách chọn ngẫu nhiên trong Excel bằng công cụ Randomize

    Bây giờ bạn đã biết một số công thức để lấy mẫu ngẫu nhiên trong Excel, hãy xem cách bạn có thể đạt được kết quả tương tự khi nhấp chuột.

    Với Trình tạo ngẫu nhiên cho Excel có trong Ultimate Suite của chúng tôi, bạn sẽ làm như sau:

    1. Chọn bất kỳ ô nào trong bảng của bạn.
    2. Chuyển đến tab Công cụ Ablebits > Utilities và nhấp vào Ngẫu nhiên > Chọn ngẫu nhiên :

  • Trên ngăn của phần bổ trợ, hãy chọn nội dung cần chọn: hàng ngẫu nhiên, cột ngẫu nhiên hoặc ô ngẫu nhiên.
  • Chỉ định số lượng hoặc tỷ lệ phần trăm cho cỡ mẫu mong muốn.
  • Nhấp vào nút Chọn . Xong!
  • Ví dụ: đây là cách chúng tôi có thể chọn 5 hàng ngẫu nhiên từ tập dữ liệu mẫu của mình:

    Và bạn sẽ nhận được một lựa chọn ngẫu nhiên trong một thứ hai:

    Bây giờ, bạn có thể nhấn Ctrl + C để sao chép mẫu ngẫu nhiên của mình, sau đó nhấn Ctrl + V để dán mẫu đó vào vị trí trong cùng một trang tính hoặc một trang tính khác.

    Nếu bạn muốn thử nghiệm công cụ Ngẫu nhiên hóa trong trang tính của mình, chỉ cần lấy phiên bản dùng thử của Ultimate Suite bên dưới. Trong trường hợp bạn đang sử dụng bảng tính Google, bạn có thể thấy Trình tạo ngẫu nhiên cho Google Trang tính của chúng tôi hữu ích.

    Các bản tải xuống có sẵn

    Chọn mẫu ngẫu nhiên - ví dụ về công thức (tệp .xlsx)

    Ultimate Suite - phiên bản dùng thử (tệp .exe)

    Michael Brown là một người đam mê công nghệ chuyên dụng với niềm đam mê đơn giản hóa các quy trình phức tạp bằng các công cụ phần mềm. Với hơn một thập kỷ kinh nghiệm trong ngành công nghệ, anh ấy đã trau dồi kỹ năng của mình trong Microsoft Excel và Outlook, cũng như Google Trang tính và Tài liệu. Blog của Michael dành để chia sẻ kiến ​​thức và chuyên môn của anh ấy với những người khác, cung cấp các mẹo và hướng dẫn dễ thực hiện để cải thiện năng suất và hiệu quả. Cho dù bạn là một chuyên gia dày dạn kinh nghiệm hay người mới bắt đầu, blog của Michael đều cung cấp những hiểu biết có giá trị và lời khuyên thiết thực để tận dụng tối đa những công cụ phần mềm thiết yếu này.