Cómo utilizar una tabla de números aleatorios

Las tablas de números aleatorios son tablas que contienen una secuencia de dígitos del 0 al 9 completamente desordenada; es decir, es una larga secuencia de números que no sigue ningún patrón y ninguna regla. Por esta razón, no se puede determinar o calcular qué cifra viene después de otra, ni siquiera conociendo el valor y la posición de todos los demás dígitos de la tabla.

Este tipo de tablas se utiliza con frecuencia en estadística inferencial, en especial durante los procesos de muestreo aleatorio para seleccionar los elementos de la población que conformarán la muestra. Una de las condiciones más importantes para que la muestra pueda ser realmente representativa de la población bajo estudio es que los elementos de una muestra se seleccionen de forma completamente aleatoria. Además, también es una de las condiciones esenciales para poder extraer conclusiones válidas de un estudio estadístico inferencial, como por ejemplo una estimación puntual, un intervalo de confianza o un contraste de hipótesis.

Dicho esto, en el presente artículo mostraremos cómo se construyen las tablas de números aleatorias, algunas de sus características más importantes y cómo se utilizan para el proceso de selección de una muestra.

¿Cómo se generan las tablas de números aleatorios?

Hay muchas formas de generar tablas de números aleatorios, sin embargo, hoy en día lo más común es generarlas mediante programas de computación diseñados para ese fin. La mayoría de paquetes de software de estadística cuenta con algún tipo de generador de números aleatorios. Además, casi todos los programas que se utilizan para llevar a cabo simulaciones de distintos fenómenos naturales en la ciencia también utilizan estos generadores .

Una manera muy sencilla de generar una tabla aceptable de números aleatorios es utilizando una hoja de cálculo como Excel o Google Sheets. Estas hojas contienen una función que permite generar un número aleatorio en cada celda cada vez que se actualiza la hoja.

Características de las tablas de números aleatorios: ¿son realmente aleatorios?

La principal característica de una tabla de números aleatorios es el hecho que los números no siguen ningún patrón. Sin embargo, también deben cumplir algunas otras condiciones para ser útiles desde el punto de vista estadístico.

  1. Todas las cifras o dígitos que conforman la tabla, es decir, los números 0, 1, 2, 3, 4, 5, 6, 7, 8 y 9, deben tener la misma probabilidad de aparición en la tabla. Esto ayuda a evitar el sesgo en la construcción de la tabla.
  2. Cada uno de los dígitos debe ser completamente independiente de todos los demás. Es decir, el hecho de que la primera cifra de la tabla sea un 7, por ejemplo, no debe afectar la probabilidad de que aparezca cualquier número en la siguiente casilla.

Esto pareciera ser sencillo en teoría, pero en la práctica resulta muy difícil de lograr. De hecho, la mayoría de generadores de números aleatorios computarizados en realidad generan los números siguiendo un algoritmo, lo que significa que sí siguen un patrón. Lo que pasa es que el patrón solo se puede detectar si se analizan muchísimos números. Hoy en día, con el desarrollo de la computación cuántica sí se están diseñando generadores de números verdaderamente aleatorios, pero para nuestros fines, los que se pueden generar con Excel u otra aplicación parecida funcionan bien.

Ejemplo de una tabla de números aleatorios

El siguiente es un ejemplo de una tabla de números aleatorios generada en Excel. Esta tabla contiene un total de 625 dígitos entre el 0 y el 9 generados con la función ALEATORIO.ENTRE(0; 9) del mencionado software, y se puede utilizar para practicar la selección de muestras aleatorias simples.

Cómo utilizar una tabla de números aleatorios

Cabe resaltar que, en esta tabla, la primera columna no forma parte de los números aleatorios sino que consiste en el identificador de las filas para hacer más fácil identificar los puntos de partida de la selección de números aleatorios.

Pasos para utilizar una tabla de números aleatorios para hacer un muestreo aleatorio simple

El uso de la tabla de números aleatorios para el muestreo es un proceso simple de 5 pasos que se describen a continuación:

Paso #1: Asignar un número único o índice a cada miembro de la población

El primer paso consiste en identificar a cada miembro o dato de la población de la cual obtendremos la muestra con un número único o índice. De esta manera, cuando se seleccione este número en la tabla de números aleatorios, sabremos inequívocamente de qué sujeto o dato se trata.

En términos generales, la asignación de índices se puede hacer de manera arbitraria, pero se deben seguir algunas reglas y recomendaciones generales al momento de escribir estos números:

  • Ningún índice se debe repetir.
  • Todos los números que se asignen como índices deben poseer la misma cantidad de dígitos. En caso de haber algún o algunos números con menos dígitos que otros, se les debe añadir ceros a la izquierda para completar. Por ejemplo, si tenemos una muestra de 20 individuos y queremos numerarlos del 1 al 20, entonces a los números del 1 al 9 debemos agregarle un cero a la izquierda para que tengan dos cifras, al igual que los demás números del 10 al 20 (01, 02, 03… 09, 10, etcétera).
  • Cabe resaltar que no es obligatorio comenzar a numerar desde el 0 o desde el 1 (o de ningún otro número particular). Tampoco es obligatorio que los números sigan alguna secuencia o patrón. Sin embargo, por simplicidad, se acostumbra a asignar los índices de forma ordenada para evitar repeticiones.

Paso #2: Seleccionar al azar una posición donde comenzar en la tabla

El punto de partida es de gran importancia al momento de seleccionar números aleatorios en estas tablas. Si partimos siempre desde el mismo lugar en la tabla y seleccionamos números con la misma cantidad de cifras, siempre obtendremos la misma secuencia de números aleatorios, lo cual no es deseable si luego tenemos que tomar una segunda muestra. Por esta razón, el punto de partida lo debemos elegir al azar y debemos también procurar no repetirlo más adelante.

Paso #3: Agrupar los números de la tabla en grupos que tengan la misma cantidad de dígitos que los índices de la población

Una vez seleccionado el punto de partida en la tabla de números aleatorios se comenzará a extraer todos los números que tengan la misma cantidad de cifras que los índices de la población, comenzando en el primer dígito que seleccionamos en el paso anterior. Hay que recordar que los índices se asignaron de tal manera que todos ellos tuvieran la misma cantidad de cifras. La idea de hacer eso era justamente asegurar que todos los índices tuvieran la oportunidad de ser seleccionados.

Paso #4: Eliminar de la lista todos los números que no correspondan a un miembro de la población

Una regla elemental del uso de la tabla de números aleatorios es que hay que descartar todo aquel número que no corresponda o no esté asignado a algún elemento de la población. Por ejemplo, si al asignar los índices a la población escogimos los números del 50 al 90, entonces debemos descartar cualquier número aleatorio que sea menor que 50 o mayor que 90.

Paso #5: Eliminar los números repetidos si es necesario

Algunos tipos de muestreo, como por ejemplo la selección de individuos u objetos, no admiten la repetición de los datos. Si este es el caso, se debe eliminar todo aquel número que se repita durante el proceso de selección de los números aleatorios.

Por otro lado, hay algunas aplicaciones en las cuales sí se permiten las repeticiones. Un ejemplo de esto sería la generación de datos aleatorios para un experimento hipotético. En estos casos, no está necesariamente prohibido que los números se repitan, ya que se pudiera dar el caso en el que dos resultados del experimento fueran iguales.

Seguir este proceso hasta obtener todos los elementos de la muestra

Este es el proceso básico que se debe seguir para utilizar la tabla de números aleatorios. Este mismo procedimiento de extraer números con una cantidad fija de cifras, eliminar los que no correspondan a un índice válido y, de ser necesario, a los números repetidos, se continúa hasta haber completado el tamaño de la muestra que debemos tomar.

Ejemplo del uso de la tabla de números aleatorios

Supongamos que se pide seleccionar una muestra aleatoria de tamaño 10 de una población que contiene 100 datos. Utilizaremos la tabla presentada anteriormente para resolver este problema siguiendo los cinco pasos descritos anteriormente:

  • Paso 1: Como tenemos 100 datos en la población, les asignaremos los números desde el 00 hasta el 99. En otras palabras, cada elemento de la población se identificará con un único índice de entre el 00, 01, 02…97, 98 y 99. No se numeraron desde el 1 hasta el 100, ya que, en este caso, tendríamos que haberle agregado un 0 a todos los índices entre el 1 y el 99 para que todos los índices tuvieran el mismo número de dígitos que el 100. De habe escojido esta opción, hubiera surgido un problema, y es que que apenas habrían 100 índices por asignar, pero existen 1000 números de tres dígitos. Esto hubiera significado tener que eliminar, en promedio, 9 de cada 10 números aleatorios generados por la tabla.
  • Paso 2: Para efectos de este ejemplo, comenzaremos desde la cuarta columna de la fila 9, como se indica en la siguiente figura:
Cómo utilizar una tabla de números aleatorios
  • Paso 3: Como todos los números asignados a los datos están formados por dos dígitos, se agrupan los números de la tabla en grupos de dos, comenzando en el punto indicado anteriormente y desplazándonos hacia la derecha. Al llegar al final de una fila, se continúa en la siguiente. La figura que se presenta a continuación muestra la agrupación realizada en la primera fila.
Cómo utilizar una tabla de números aleatorios

El resultado es el siguiente conjunto de números de dos cifras: 56, 24, 83, 08, 17, 83, 47, 44, 78, 17, 84, 63, 03, 27, 24, 83, 47, 45, 38, 46, 72, 35, 13, 57, 08, 09, 51, 84, 31, 61, 50, 56, 97, 94, 70, 55, …

  • Paso 4: Como la población tiene 100 miembros y ocupa todos los números de dos cifras, ninguno de estos números queda fuera de la lista desde un principio.
  • Paso 5: En el presente caso, como se están seleccionando elementos de una muestra y estos no pueden repetirse, se deben eliminar todos los números que se repiten al recorrer la lista de izquierda a derecha.

56, 24, 83, 08, 17, 83, 47, 44, 78, 17, 84, 63, 03, 27, 24, 83, 47, 45, 38, 46, 72, 35, 13, 57, 08, 09, 51, 84, 31, 61, 50, 56, 97, 94, 70, 55, …

Finalmente, recordemos que sólo se requieren 10 números aleatorios y aquí tenemos muchos más, así que seleccionamos los primeros 10 que no sean repetidos, y ya está. En consecuencia, la muestra debe estar compuesta por los datos número 56, 24, 83, 08, 17, 47, 44, 78, 84 y 63.

Referencias