난수 테이블을 사용하는 방법

Artículo revisado y aprobado por nuestro equipo editorial, siguiendo los criterios de redacción y edición de YuBrain.

난수 테이블은 0에서 9까지 완전히 순서가 지정되지 않은 숫자 시퀀스를 포함하는 테이블입니다. 즉, 어떤 패턴이나 규칙도 따르지 않는 일련의 숫자입니다 . 이러한 이유로 테이블에 있는 다른 모든 숫자의 값과 위치를 알고 있더라도 어떤 숫자가 뒤에 오는지 확인하거나 계산할 수 없습니다.

이 유형의 테이블은 특히 샘플을 구성할 모집단의 요소를 선택하기 위한 무작위 샘플링 프로세스 중에 추론 통계에서 자주 사용됩니다. 표본이 연구 중인 모집단을 진정으로 대표하기 위한 가장 중요한 조건 중 하나는 표본의 요소가 완전히 무작위로 선택된다는 것입니다. 또한 점추정, 신뢰구간, 가설검정 등의 추론통계연구에서 타당한 결론을 도출할 수 있는 것도 필수조건 중 하나이다.

즉, 이 기사에서는 난수 테이블이 구축되는 방법, 가장 중요한 일부 기능 및 샘플 선택 프로세스에 사용되는 방법을 보여줍니다.

난수 테이블은 어떻게 생성됩니까?

난수 표를 생성하는 방법에는 여러 가지가 있지만 오늘날 가장 일반적인 방법은 해당 목적으로 설계된 컴퓨터 프로그램을 사용하여 난수를 생성하는 것입니다. 대부분의 통계 소프트웨어 패키지에는 일종의 난수 생성기가 있습니다. 또한 과학에서 다양한 자연 현상의 시뮬레이션을 수행하는 데 사용되는 거의 모든 프로그램도 이러한 생성기를 사용합니다.

허용 가능한 난수 테이블을 생성하는 매우 쉬운 방법은 Excel 또는 Google 스프레드시트와 같은 스프레드시트를 사용하는 것입니다. 이 시트에는 시트가 업데이트될 때마다 각 셀에 난수를 생성할 수 있는 기능이 포함되어 있습니다.

난수 테이블의 특성: 정말 난수입니까?

난수 테이블의 주요 특징은 숫자가 어떤 패턴도 따르지 않는다는 사실입니다. 그러나 통계적으로 유용하려면 몇 가지 다른 조건도 충족해야 합니다.

  1. 표를 구성하는 모든 숫자, 즉 숫자 0, 1, 2, 3, 4, 5, 6, 7, 8, 9는 나올 확률이 같아야 합니다. 이렇게 하면 테이블 구성에서 편향을 피하는 데 도움이 됩니다.
  2. 각 숫자는 다른 모든 숫자와 완전히 독립적이어야 합니다. 즉, 예를 들어 표의 첫 번째 숫자가 7이라는 사실이 다음 상자에 숫자가 나타날 확률에 영향을 미치지 않아야 합니다.

이것은 이론적으로는 간단해 보이지만 실제로는 달성하기가 매우 어렵습니다. 사실, 대부분의 전산화된 난수 생성기는 실제로 알고리즘에 따라 숫자를 생성합니다. 즉, 패턴을 따른다는 의미입니다. 많은 숫자를 분석해야만 패턴을 감지할 수 있습니다. 오늘날 양자 컴퓨팅의 발달로 진정한 난수 생성기가 설계되고 있지만 우리의 목적을 위해 Excel 또는 다른 유사한 응용 프로그램으로 생성할 수 있는 것이 잘 작동합니다.

난수 테이블의 예

다음은 Excel에서 생성된 난수 테이블의 예입니다. 이 표는 앞서 언급한 소프트웨어 의 RANDOM.BETWEEN(0; 9) 기능으로 생성된 0에서 9까지의 총 625개의 숫자를 포함하며 간단한 임의 샘플 선택을 연습하는 데 사용할 수 있습니다.

난수 테이블을 사용하는 방법

이 표에서 첫 번째 열은 난수가 아닌 행의 식별자로 구성되어 난수 선택의 시작점을 쉽게 식별할 수 있습니다.

단순 무작위 샘플링을 위해 난수 테이블을 사용하는 단계

샘플링에 난수 테이블을 사용하는 것은 아래에 설명된 간단한 5단계 프로세스입니다.

1단계: 모집단의 각 구성원에게 고유한 번호 또는 색인을 할당합니다.

첫 번째 단계는 고유 번호 또는 인덱스로 샘플을 얻을 모집단의 각 구성원 또는 데이터를 식별하는 것입니다. 이런 식으로 난수표에서 이 숫자가 선택되면 우리는 그것이 어떤 주제 또는 데이터인지 분명하게 알게 될 것입니다.

일반적으로 인덱스 할당은 임의로 수행할 수 있지만 이러한 숫자를 작성할 때 몇 가지 일반적인 규칙과 권장 사항을 따라야 합니다.

  • 인덱스를 반복해서는 안 됩니다.
  • 색인으로 할당된 모든 숫자는 동일한 자릿수를 가져야 합니다. 다른 숫자보다 자릿수가 적은 숫자가 하나 이상 있는 경우 왼쪽에 0을 추가해야 완성됩니다. 예를 들어, 20명의 개인 샘플이 있고 1에서 20까지 번호를 지정하려는 경우 1에서 9까지의 숫자에 앞에 0을 추가하여 10의 다른 숫자와 마찬가지로 두 자리를 갖도록 해야 합니다. 20 (01, 02, 03… 09, 10 등).
  • 0 또는 1(또는 다른 특정 번호)부터 번호 매기기를 시작하는 것이 필수는 아닙니다. 번호가 순서나 패턴을 따르는 것도 의무 사항이 아닙니다. 그러나 단순화를 위해 반복을 피하기 위해 인덱스를 순서대로 지정하는 것이 일반적입니다.

2단계: 테이블에서 임의로 시작 위치를 선택합니다.

이 테이블에서 난수를 선택할 때 시작점이 매우 중요합니다. 항상 테이블의 같은 위치에서 시작하여 같은 자릿수를 가진 숫자를 선택하면 항상 같은 순서의 난수를 얻게 되므로 나중에 두 번째 샘플을 채취해야 하는 경우에는 바람직하지 않습니다. 이런 이유로 시작점을 임의로 선택해야 하고 나중에 반복하지 않도록 노력해야 합니다.

3단계: 표의 숫자를 모집단 지수와 같은 자릿수 그룹으로 그룹화

난수 테이블에서 시작점을 선택하면 이전 단계에서 선택한 첫 번째 숫자부터 시작하여 모집단 지수와 같은 자릿수를 가진 모든 숫자가 추출되기 시작합니다. 인덱스는 모두 같은 수의 숫자를 갖도록 지정되었음을 기억해야 합니다. 그렇게 하는 아이디어는 모든 지수가 선택될 기회를 갖도록 하기 위한 것이었습니다.

4단계: 모집단 구성원에 해당하지 않는 모든 번호를 목록에서 제거

난수 표를 사용하는 기본 규칙은 모집단의 어떤 요소에도 해당하지 않거나 할당되지 않은 숫자는 모두 버려야 한다는 것입니다. 예를 들어 모집단에 인덱스를 할당할 때 50에서 90까지의 숫자를 선택한 경우 50보다 작거나 90보다 큰 임의의 숫자를 버려야 합니다.

5단계: 필요한 경우 반복되는 숫자 제거

개인 또는 개체 선택과 같은 일부 유형의 샘플링은 데이터의 반복을 허용하지 않습니다. 이 경우 난수 선택 과정에서 반복되는 모든 숫자를 제거해야 합니다.

반면에 반복이 허용되는 일부 응용 프로그램이 있습니다. 이에 대한 예는 가상 실험을 위해 무작위 데이터를 생성하는 것입니다. 이 경우 두 실험 결과가 같은 경우가 있을 수 있으므로 숫자를 반복하는 것을 반드시 금지하는 것은 아니다.

샘플의 모든 요소를 ​​얻을 때까지 이 프로세스를 계속합니다.

이것이 난수표를 사용하기 위해 반드시 거쳐야 할 기본 과정입니다. 고정 자릿수로 숫자를 추출하고 유효한 색인에 해당하지 않는 숫자를 제거하고 필요한 경우 반복 숫자를 추출하는 동일한 절차는 우리가 취해야 할 표본의 크기가 완료될 때까지 계속됩니다.

난수 테이블 사용 예

100개의 데이터 포인트를 포함하는 모집단에서 크기가 10인 무작위 표본을 선택하라는 요청을 받았다고 가정합니다. 위에 제시된 표를 사용하여 위에서 설명한 다섯 단계에 따라 이 문제를 해결할 것입니다.

  • 1단계: 모집단에 100개의 데이터 포인트가 있으므로 00에서 99까지의 숫자를 할당합니다. 즉, 모집단의 각 요소는 00, 01, 02…97, 98 사이의 고유 인덱스로 식별됩니다. 그리고 99. 1부터 100까지 번호가 매겨지지 않았습니다. 이 경우 모든 인덱스가 100과 동일한 자릿수를 가지려면 1에서 99 사이의 모든 인덱스에 0을 추가해야 하기 때문입니다. 옵션을 선택했다면 문제가 발생했을 것이고 할당할 인덱스가 겨우 100개인데 3자리 숫자가 1000개라는 문제가 발생했을 것입니다. 이는 테이블에서 생성된 난수 10개 중 평균 9개를 제거해야 함을 의미했을 것입니다.
  • 2단계: 이 예의 목적을 위해 다음 그림에 표시된 대로 9행의 네 번째 열에서 시작합니다.
난수 테이블을 사용하는 방법

  • 3단계: 데이터에 할당된 모든 숫자는 두 자리 숫자로 구성되어 있으므로 표의 숫자는 위에 표시된 지점에서 시작하여 오른쪽으로 이동하면서 두 그룹으로 그룹화됩니다. 행 끝에 도달하면 다음 행을 계속하십시오. 아래 그림은 첫 번째 행에서 만든 그룹화를 보여줍니다.
난수 테이블을 사용하는 방법

결과는 56, 24, 83, 08, 17, 83, 47, 44, 78, 17, 84, 63, 03, 27, 24, 83, 47, 45, 38, 46, 72, 35, 13, 57, 08, 09, 51, 84, 31, 61, 50, 56, 97, 94, 70, 55, …

  • 4단계: 모집단에 100명의 구성원이 있고 두 자리 숫자를 모두 차지하기 때문에 이 숫자 중 어느 것도 처음부터 목록에서 제외되지 않습니다.
  • 5단계: 현재 샘플의 요소를 선택하고 있으며 반복할 수 없기 때문에 목록을 왼쪽에서 오른쪽으로 이동하여 반복되는 모든 숫자를 제거해야 합니다.

56, 24, 83, 08, 17, 83 , 47, 44, 78, 17 , 84, 63 , 03, 27, 24, 83 , 47 , 45 , 38 , 46, 72, 35, 13, 57, 08 , 09, 51, 84 , 31, 61, 50, 56, 97, 94, 70, 55 , …

마지막으로 10개의 난수만 필요하고 여기에는 더 많은 난수가 있으므로 반복되지 않는 처음 10개를 선택하면 됩니다. 따라서 샘플은 데이터 번호 56, 24, 83, 08, 17, 47, 44, 78, 84 및 63 으로 구성되어야 합니다 .

참조

mm
Israel Parada (Licentiate,Professor ULA)
(Licenciado en Química) - AUTOR. Profesor universitario de Química. Divulgador científico.

Artículos relacionados