Excel 임의 선택: 데이터 집합에서 임의 샘플을 가져오는 방법

  • 이 공유
Michael Brown

이 자습서에서는 이름, 숫자 또는 기타 데이터를 임의로 선택하는 몇 가지 빠른 방법을 알려줍니다. 또한 중복 없이 임의 샘플을 얻는 방법과 마우스 클릭으로 지정된 수 또는 백분율의 셀, 행 또는 열을 임의로 선택하는 방법을 배웁니다.

새로운 제품 출시 또는 마케팅 캠페인 결과 평가를 위해 분석을 위해 편향되지 않은 데이터 샘플을 사용하는 것이 중요합니다. 이를 달성하는 가장 쉬운 방법은 Excel에서 무작위로 선택하는 것입니다.

    무작위 샘플이란 무엇입니까?

    샘플링 기술에 대해 논의하기 전에 약간의 배경 정보를 제공하겠습니다. 무작위 선택 및 언제 사용할 수 있는지에 대해 알아보세요.

    확률 이론 및 통계에서 무작위 샘플 은 더 큰 데이터 세트, 즉 모집단에서 선택한 데이터의 하위 집합입니다. . 무작위 샘플의 각 요소는 전적으로 우연히 선택되며 동일한 확률로 선택됩니다. 왜 필요할까요? 기본적으로 전체 모집단에 대해 편향되지 않은 대표성을 얻기 위해.

    예를 들어 고객을 대상으로 약간의 설문조사를 수행하려고 합니다. 분명히, 당신의 수천 데이터베이스에 있는 각 개인에게 설문지를 보내는 것은 현명하지 않을 것입니다. 그래서, 당신의 설문조사는 누구에게 합니까? 신규 고객 100명, 알파벳순으로 나열된 처음 100명의 고객, 또는 가장 짧은 고객 100명 중 무엇입니까?이름? 이러한 접근 방식은 본질적으로 편향되어 있기 때문에 귀하의 요구에 맞지 않습니다. 모든 사람이 동등한 선택 기회를 갖는 공정한 표본을 얻으려면 아래에 설명된 방법 중 하나를 사용하여 무작위 선택을 수행하십시오.

    수식을 사용하여 탁월한 무작위 선택

    내장된 기능이 없습니다. 함수를 사용하여 Excel에서 임의로 셀을 선택하지만 해결 방법으로 함수 중 하나를 사용하여 난수를 생성할 수 있습니다. 간단하고 직관적인 수식이라고 할 수는 없지만 작동합니다.

    목록에서 임의의 값을 선택하는 방법

    A2:A10 셀에 이름 목록이 있고 다음을 원한다고 가정합니다. 목록에서 하나의 이름을 무작위로 선택합니다. 이것은 다음 공식 중 하나를 사용하여 수행할 수 있습니다.

    =INDEX($A$2:$A$10,RANDBETWEEN(1,COUNTA($A$2:$A$10)),1)

    또는

    =INDEX($A$2:$A$10,RANDBETWEEN(1,ROWS($A$2:$A$10)),1)

    그게 다입니다! Excel용 임의 이름 선택기가 모두 설정되어 게재할 준비가 되었습니다.

    참고. RANDBETWEEN은 휘발성 함수이므로 워크시트를 변경할 때마다 다시 계산됩니다. 결과적으로 임의 선택도 변경됩니다. 이를 방지하려면 추출된 이름을 복사하여 다른 셀에 값으로 붙여넣을 수 있습니다( 선택하여 붙여넣기 > ). 자세한 지침은 수식을 값으로 바꾸는 방법을 참조하십시오.

    당연히 이러한 수식은 임의의 이름을 선택할 수 있을 뿐만 아니라 임의의 숫자, 날짜 또는 기타 임의의 항목을 선택할 수 있습니다.cells.

    수식 작동 방식

    간단히 말해서 INDEX 함수를 사용하여 RANDBETWEEN에서 반환한 임의의 행 번호를 기반으로 목록에서 값을 추출합니다.

    보다 구체적으로, RANDBETWEEN 함수는 지정한 두 값 사이에 임의의 정수를 생성합니다. 낮은 값의 경우 숫자 1을 제공합니다. 높은 값의 경우 COUNTA 또는 ROWS를 사용하여 총 행 수를 가져옵니다. 결과적으로 RANDBETWEEN은 1과 데이터 세트의 총 행 수 사이의 임의의 숫자를 반환합니다. 이 숫자는 선택할 행을 알려주는 INDEX 함수의 row_num 인수로 이동합니다. column_num 인수의 경우 첫 번째 열에서 값을 추출하려고 하므로 1을 사용합니다.

    참고. 이 방법은 목록에서 하나의 무작위 셀 을 선택하는 데 적합합니다. 샘플에 여러 셀이 포함되어야 하는 경우 RANDBETWEEN 함수가 중복되지 않기 때문에 위 수식은 동일한 값을 여러 번 반환할 수 있습니다. 상대적으로 작은 목록에서 상대적으로 큰 샘플을 선택하는 경우 특히 그렇습니다. 다음 예는 Excel에서 중복 없이 임의 선택하는 방법을 보여줍니다.

    Excel에서 중복 없이 임의로 선택하는 방법

    Excel에서 중복 없이 임의 데이터를 선택하는 몇 가지 방법이 있습니다. 일반적으로 RAND 함수를 사용하여 각 셀에 난수를 할당한 다음 몇 개의 셀을 선택합니다.Index Rank 수식을 사용합니다.

    A2:A16 셀에 이름 목록이 있는 경우 다음 단계에 따라 임의의 이름 몇 개를 추출하십시오.

    1. B2에 Rand 수식을 입력하고 열에 복사합니다.

    =RAND()

  • 열 A에서 임의의 값을 추출하려면 C2에 아래 수식을 입력합니다.
  • =INDEX($A$2:$A$16, RANK(B2,$B$2:$B$16), 1)

  • 선택하려는 임의의 값만큼 위의 수식을 많은 셀에 복사하십시오. 여기서는 수식을 4개의 셀(C2:C6)에 더 복사합니다.
  • 그게 다입니다! 5개의 임의 이름이 중복 없이 추출됩니다.

    이 공식 작동 방식

    이전 예와 마찬가지로 INDEX 함수를 사용하여 열에서 값을 추출합니다. 임의의 행 좌표를 기반으로 하는 A입니다. 이 경우 이를 얻기 위해 두 가지 다른 함수가 필요합니다.

    • RAND 수식은 열 B를 임의의 숫자로 채웁니다.
    • RANK 함수는 동일한 위치에서 순위를 임의의 숫자로 반환합니다. 열. 예를 들어 셀 C2의 RANK(B2,$B$2:$B$16)은 B2에 있는 숫자의 순위를 가져옵니다. C3에 복사되면 상대 참조 B2는 B3으로 변경되고 B3에 있는 숫자의 순위를 반환하는 식입니다.
    • RANK에서 반환된 숫자는 다음의 row_num 인수에 공급됩니다. INDEX 함수이므로 해당 행에서 값을 선택합니다. column_num 인수에서 첫 번째 열에서 값을 추출하려고 하므로 1을 제공합니다.

    주의 사항! 위 스크린샷, Excel 무작위선택 항목에는 고유한 값만 포함됩니다. 그러나 이론적으로 샘플에 중복 항목이 나타날 가능성은 희박합니다. 그 이유는 다음과 같습니다. 매우 큰 데이터 세트에서 RAND는 중복 난수를 생성할 수 있으며 RANK는 해당 숫자에 대해 동일한 순위를 반환합니다. 개인적으로 테스트 중 중복이 나온 적은 없지만 이론상으로는 그런 확률이 존재합니다.

    유일한 값만 있는 무작위 선택을 얻기 위한 방탄 공식을 찾고 있다면 RANK + 그냥 RANK 대신 COUNTIF 또는 RANK.EQ + COUNTIF 조합. 논리에 대한 자세한 설명은 Excel의 고유 순위를 참조하세요.

    완전한 공식은 조금 복잡하지만 100% 중복이 없습니다:

    =INDEX($A$2:$A$16, RANK.EQ(B2, $B$2:$B$16) + COUNTIF($B$2:B2, B2) - 1, 1)

    참고:

    • RANDBETWEEN과 마찬가지로 Excel RAND 함수도 워크시트를 다시 계산할 때마다 새 난수를 생성하여 임의 선택을 변경합니다. 샘플을 변경하지 않으려면 복사하여 값으로 다른 곳에 붙여넣으십시오( 붙여넣기 특수 > ).
    • 이름이 같은 경우 (숫자, 날짜 또는 기타 값)이 원래 데이터 세트에 두 번 이상 나타나는 경우 임의 샘플에는 동일한 값이 여러 번 포함될 수도 있습니다.

    Excel 365 - 2010의 반복 없음은 여기에 설명되어 있습니다. How to get random sample in Excel without duplicates.

    How to select random rows inExcel

    워크시트에 데이터 열이 두 개 이상 포함된 경우 다음과 같은 방식으로 임의 샘플을 선택할 수 있습니다. 각 행에 임의의 숫자를 할당하고 해당 숫자를 정렬한 다음 필요한 행 수를 선택합니다. 자세한 단계는 다음과 같습니다.

    1. 표의 오른쪽이나 왼쪽에 새 열을 삽입합니다(이 예에서는 D열).
    2. 삽입된 첫 번째 셀에 열 머리글을 제외한 열에 RAND 수식을 입력합니다. =RAND()
    3. 수식을 열 아래로 복사하려면 채우기 핸들을 두 번 클릭합니다. 결과적으로 각 행에 임의의 숫자가 할당됩니다.
    4. 임의의 숫자를 내림차순으로 정렬합니다(오름차순으로 정렬하면 열 머리글이 표 맨 아래로 이동함) 이므로 내림차순으로 정렬해야 합니다.) 이를 위해 데이터 탭 > 정렬 & Filter 그룹을 선택하고 ZA 버튼을 클릭합니다. Excel은 선택 항목을 자동으로 확장하고 전체 행을 무작위 순서로 정렬합니다.

      테이블이 무작위화된 방식이 만족스럽지 않으면 정렬 버튼을 다시 눌러 재정렬하십시오. 자세한 지침은 Excel에서 임의로 정렬하는 방법을 참조하세요.

    5. 마지막으로 샘플에 필요한 행 수를 선택하고 복사하여 원하는 위치에 붙여넣습니다. 좋아하세요.

    이 튜토리얼에서 논의된 수식을 자세히 살펴보려면 샘플을 다운로드하세요.워크북을 Excel 임의 선택으로 변환합니다.

    Randomize 도구를 사용하여 Excel에서 임의로 선택하는 방법

    이제 Excel에서 임의 샘플을 가져오는 몇 가지 수식을 알았으므로 다음을 수행하는 방법을 살펴보겠습니다. 마우스 클릭으로 동일한 결과를 얻을 수 있습니다.

    Ultimate Suite에 포함된 Excel용 Random Generator를 사용하여 수행할 작업은 다음과 같습니다.

    1. 표에서 아무 셀이나 선택합니다.
    2. Ablebits 도구 탭 > 유틸리티 그룹으로 이동하여 무작위화 > 임의로 선택 :
    을 클릭합니다.

  • 추가 기능 창에서 임의 행, 임의 열 또는 임의 셀 중에서 선택할 항목을 선택합니다.
  • 원하는 샘플 크기의 수 또는 백분율을 지정합니다.
  • 선택 버튼을 클릭하세요. 완료!
  • 예를 들어 샘플 데이터 세트에서 5개의 임의 행을 선택하는 방법은 다음과 같습니다.

    두 번째:

    이제 Ctrl + C를 눌러 무작위 샘플을 복사한 다음 Ctrl + V를 눌러 동일한 시트 또는 다른 시트의 위치에 붙여넣을 수 있습니다.

    워크시트에서 Randomize 도구를 테스트하려면 아래에서 Ultimate Suite 평가판을 다운로드하세요. Google 스프레드시트를 사용하는 경우 Google 스프레드시트용 임의 생성기가 유용할 수 있습니다.

    사용 가능한 다운로드

    임의 샘플 선택 - 수식 예제(.xlsx 파일)

    Ultimate Suite - 평가판(.exe 파일)

    Michael Brown은 소프트웨어 도구를 사용하여 복잡한 프로세스를 단순화하려는 열정을 가진 열성적인 기술 애호가입니다. 기술 산업에서 10년 이상의 경험을 쌓은 그는 Microsoft Excel 및 Outlook은 물론 Google 스프레드시트 및 문서 도구에 대한 기술을 연마했습니다. Michael의 블로그는 자신의 지식과 전문 지식을 다른 사람과 공유하는 데 전념하며 따라하기 쉬운 팁과 생산성 및 효율성 향상을 위한 자습서를 제공합니다. 노련한 전문가이든 초보자이든 Michael의 블로그는 이러한 필수 소프트웨어 도구를 최대한 활용하기 위한 귀중한 통찰력과 실용적인 조언을 제공합니다.