乱数表の使い方

Artículo revisado y aprobado por nuestro equipo editorial, siguiendo los criterios de redacción y edición de YuBrain.


乱数テーブルは、0 から 9 までの完全に順不同の数字のシーケンスを含むテーブルです。つまり、どのパターンにも規則にも従わない、長い一連の数字です。このため、テーブル内の他のすべての桁の値と位置がわかっている場合でも、次の数字を特定または計算することはできません。

このタイプのテーブルは、推論統計で頻繁に使用されます。特に、サンプルを構成する母集団の要素を選択するためのランダム サンプリング プロセス中に使用されます。サンプルが調査中の母集団を真に代表するための最も重要な条件の 1 つは、サンプルの要素が完全に無作為に選択されることです。さらに、点推定、信頼区間、仮説検定などの推論統計研究から有効な結論を引き出すことができることも、必須条件の 1 つです。

そうは言っても、この記事では、乱数テーブルがどのように構築されるか、最も重要な機能のいくつか、およびサンプル選択プロセスにどのように使用されるかを示します。

乱数のテーブルはどのように生成されますか?

乱数の表を生成する方法は多数ありますが、今日最も一般的なのは、その目的のために設計されたコンピューター プログラムを使用して乱数を生成することです。ほとんどの統計ソフトウェア パッケージには、何らかの形式の乱数ジェネレーターが含まれています。さらに、科学でさまざまな自然現象のシミュレーションを実行するために使用されるほとんどすべてのプログラムも、これらのジェネレーターを使用しています。

許容できる乱数の表を生成する非常に簡単な方法は、Excel や Google スプレッドシートなどのスプレッドシートを使用することです。これらのシートには、シートが更新されるたびに各セルに乱数を生成できる関数が含まれています。

乱数表の特徴: 本当に乱数なのか?

乱数表の主な特徴は、数値がどのようなパターンにも従わないことです。ただし、統計的に有用であるためには、他の条件も満たす必要があります。

  1. 表を構成するすべての数字または数字、つまり数字0、1、2、3、4、5、6、7、8、および9は、表に現れる確率が同じでなければなりません。これは、表の構成におけるバイアスを回避するのに役立ちます。
  2. 各数字は、他のすべての数字から完全に独立している必要があります。つまり、たとえば、表の最初の数字が 7 であるという事実は、次のボックスに数字が表示される確率に影響を与えるべきではありません。

これは理論的には簡単に思えますが、実際に達成するのは非常に困難です。実際、コンピューター化された乱数ジェネレーターのほとんどは、実際にはアルゴリズムに従って数値を生成します。つまり、パターンに従っているということです。何が起こるかというと、多くの数値が分析された場合にのみパターンを検出できます。今日、量子コンピューティングの発展に伴い、真の乱数ジェネレーターが設計されていますが、私たちの目的では、Excel または別の同様のアプリケーションで生成できるものはうまく機能します。

乱数表の例

以下は、Excel で生成された乱数の表の例です。このテーブルには、前述のソフトウェアの RANDOM.BETWEEN(0; 9) 関数で生成された 0 から 9 までの合計 625 桁が含まれており、簡単なランダム サンプルの選択を練習するために使用できます。

乱数表の使い方

この表では、最初の列は乱数の一部ではなく、乱数の選択の開始点を識別しやすくするために行の識別子で構成されていることに注意してください。

単純なランダム サンプリングに乱数テーブルを使用する手順

サンプリングに乱数テーブルを使用するのは、以下に概説する簡単な 5 ステップのプロセスです。

ステップ #1: 母集団の各メンバーに一意の番号またはインデックスを割り当てる

最初のステップは、一意の番号またはインデックスを使用して、サンプルを取得する母集団の各メンバーまたはデータを識別することです。このように、この数字が乱数表で選択されると、それが何の対象またはデータであるかが明確にわかります。

一般的に言えば、インデックスの割り当ては任意に行うことができますが、これらの数値を記述する際には、いくつかの一般的な規則と推奨事項に従う必要があります。

  • インデックスを繰り返さないでください。
  • インデックスとして割り当てられるすべての数字は、同じ桁数でなければなりません。他の数字よりも桁数が少ない数字が 1 つ以上ある場合は、左側にゼロを追加して完成させる必要があります。たとえば、20 人のサンプルがあり、それらに 1 から 20 までの番号を付けたい場合、1 から 9 までの数字に先行ゼロを追加して、他の 10 からの数字と同様に 2 桁になるようにする必要があります。から 20 (01、02、03… 09、10 など)。
  • 0 または 1 (またはその他の特定の番号) から番号付けを開始することは必須ではないことに注意してください。また、番号が任意の順序またはパターンに従うことも必須ではありません。ただし、簡単にするために、繰り返しを避けるために順番にインデックスを割り当てるのが通例です。

ステップ #2: テーブルの開始位置をランダムに選択する

これらの表で乱数を選択する場合、開始点が非常に重要です。常にテーブルの同じ場所から開始し、同じ桁数の数字を選択すると、常に同じ乱数のシーケンスが得られます。これは、後で 2 番目のサンプルを取得する必要がある場合に望ましくありません。このため、開始点をランダムに選択する必要があり、後で繰り返さないようにする必要もあります。

ステップ #3: 表の数字を人口指数と同じ桁数のグループにグループ化する

乱数表で開始点が選択されると、前のステップで選択した最初の桁から、人口指数と同じ桁数を持つすべての数値が抽出され始めます。インデックスは、すべて同じ数の数字を持つように割り当てられたことを覚えておく必要があります。それを行うという考えは、すべてのインデックスが選択される可能性があることを保証することでした.

ステップ #4: 母集団のメンバーに対応しないすべての番号をリストから削除する

乱数の表を使用する基本的な規則は、母集団のどの要素にも対応しない、または割り当てられていない数値は破棄する必要があるということです。たとえば、母集団にインデックスを割り当てる際に 50 から 90 までの数値を選択した場合、50 未満または 90 を超える乱数を破棄する必要があります。

ステップ #5: 必要に応じて繰り返し数字を削除する

個人やオブジェクトの選択など、一部のタイプのサンプリングでは、データの繰り返しが許可されません。この場合、乱数の選択プロセス中に繰り返される数字を削除する必要があります。

一方、繰り返しが許可されているアプリケーションもあります。この例は、仮説実験用のランダム データの生成です。これらの場合、実験の 2 つの結果が同じである可能性があるため、数値の繰り返しが必ずしも禁止されているわけではありません。

サンプルのすべての要素が取得されるまで、このプロセスを続けます。

これは、乱数テーブルを使用するために従う必要がある基本的なプロセスです。固定桁数の数値を抽出し、有効なインデックスに対応しない数値を削除し、必要に応じて数値を繰り返す同じ手順を、取得する必要があるサンプルのサイズが完了するまで続けます。

乱数表の使用例

100 個のデータ ポイントを含む母集団からサイズ 10 のランダム サンプルを選択するよう求められたとします。上記の表を使用して、上記の 5 つの手順に従ってこの問題を解決します。

  • ステップ 1:母集団には 100 個のデータ ポイントがあるため、それらに 00 から 99 までの番号を割り当てます。つまり、母集団の各要素は、00、01、02…97、98 の間の一意のインデックスで識別されます。この場合、すべてのインデックスが 100 と同じ桁数になるようにするには、1 から 99 までのすべてのインデックスに 0 を追加する必要があるため、1 から 100 までの番号は付けられませんでした。つまり、割り当てられるインデックスは 100 個しかないのに、3 桁の数字が 1000 個あるという問題が発生します。これは、テーブルによって生成された 10 個の乱数のうち、平均して 9 個を削除する必要があることを意味していました。
  • ステップ 2:この例では、次の図に示すように、行 9 の 4 列目から開始します。
乱数表の使い方

  • ステップ 3:データに割り当てられたすべての番号は 2 桁で構成されているため、テーブル内の番号は、上記のポイントから右に移動して、2 つのグループにグループ化されます。行の終わりに到達したら、次の行に進みます。次の図は、最初の行で行われたグループ化を示しています。
乱数表の使い方

結果は次の 2 桁の数字のセットです: 56、24、83、08、17、83、47、44、78、17、84、63、03、27、24、83、47、45、38、 46, 72, 35, 13, 57, 08, 09, 51, 84, 31, 61, 50, 56, 97, 94, 70, 55, …

  • ステップ 4:母集団には 100 人のメンバーがいて、すべて 2 桁の数字を占めているため、最初からこれらの数字がリストから除外されることはありません。
  • ステップ 5:この場合、サンプルの要素が選択されており、これらの要素を繰り返すことはできないため、リストを左から右に見て、すべての繰り返し番号を削除する必要があります。

56、24、83、08、17、83、47、44、78、17、84、63、03、27、24、83、47、45、38、46、72、35、13、57、08 _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ 09、51、84、31、61、50、56、97、94、70、55_ _

最後に、必要な乱数は 10 個だけで、ここではさらに多くの乱数があるため、繰り返されない最初の 10 個を選択することを思い出してください。したがって、サンプルはデータ番号56、24、83、08、17、47、44、78、84、および 63で構成されている必要があります。

参考文献

-広告-

mm
Israel Parada (Licentiate,Professor ULA)
(Licenciado en Química) - AUTOR. Profesor universitario de Química. Divulgador científico.

Artículos relacionados

実数は?

確率の公理

円周の計算