La forma tradicional de obtener una muestra aleatoria es mediante Tablas de Números Aleatorios. Es interesante recordar que la primera tabla de números aleatorios se formó con base en los resultados de la Lotería Española. En prácticamente todos los libros de estadística viene una tabla de números aleatorios, pero hoy en día las computadoras nos proporcionan algo que los puristas llaman pseudo muestras aleatorias, en una distinción muy sutil que tiene que ver con la predeterminación de las muestras que generan las computadoras.
El párrafo anterior puede entenderse mejor si consideramos un ejemplo sencillo como el siguiente: Si lanzamos una moneda balanceada al aire, esto es, que no esté cargada ni para las «águilas» ni para los «soles», entonces sabremos que la probabilidad de que la moneda en el aire nos resulte, al caer, con la cara superior mostrando el águila, es 0.5.
Si en lugar de lanzarla para que caiga al suelo, la capturamos con nuestras manos, vemos el resultado evitando que una persona frente a nosotros lo vea y le pedimos que adivine el resultado, ella pensará que tiene una probabilidad de acertar también de 0.5, pero incurrirá en una imprecisión. Me explico:
Diferenciemos primero dos situaciones. Los hechos consumados y las cosas que se encuentran en proceso y que producirán un resultado que no podemos con certeza anticipar. El desconocimiento de los hechos o datos nos ubica en una condición de ignorancia, mientras que el desconocimiento del resultado futuro de un proceso nos coloca en la incertidumbre.
En los ejemplos anteriores es claro que, cuando la moneda está en el aire, estamos ante la incertidumbre y tiene cabal sentido que digamos que si nuestra apuesta es «águila», la probabilidad que tenemos de ganar es 0.5. Sin embargo, cuando la moneda ya está en la mano, no tenemos incertidumbre sino ignorancia. El resultado ya quedó definido, de modo que si alguien quiere adivinar el resultado, por la forma en que se llegó a éste el pensará efectivamente que tiene una probabilidad de acertar de 0.5, cuando en realidad lo que tiene es una confianza del 50% de ganar la apuesta. A decir verdad la probabilidad de acertar de la persona en cuestión es uno o cero. ¿Por qué?
Lo que planteamos respecto de las muestras «aleatorias» que nos generan las computadoras es un razonamiento similar al descrito para diferenciar entre probabilidad y confianza. Como en aquel caso, en términos prácticos tenemos finalmente la misma cosa, en virtud de que la muestra, aunque determinada, fue generada por un proceso de resultados impredecibles, casi aleatorios, de modo que confortablemente podemos utilizar los programas computacionales para obtener nuestras muestras que podemos en la práctica asumir como auténticamente aleatorias.
Para obtener una muestra aleatoria en Statgraphics Plus, versión 5, el procedimiento es el siguiente:
1. Seleccione la secuencia Describe-Distributions-Probability Distributions. Al aceptar esa instrucción le aparecerá una pantalla con una serie de distribuciones de probabilidad donde se señala como la opción predeterminada o por default a la distribución normal. Aquí debe usted seleccionar la distribución uniforme discreta (Discrete Uniform) y aceptar presionando la opción Ok. Al hacerlo le aparecerá una pantalla dividida en cuatro secciones y en la parte superior izquierda, justo debajo de la leyenda Probability Distributions, encontrará cuatro iconos, uno de color rojo (Input dialog), otro de color amarillo (Tabular options), un tercero que tiene una gráfica (Graphical options) y un cuarto que tiene la figura de un diskette (Save results).
2. Seleccione el icono de color amarillo o tabular options. Al hacerlo le aparecerá una pequeña pantalla donde la última opción es Random Numbers, debe seleccionarla y aceptar. El resultado será una sección más en el lado izquierdo titulada Random Numbers.
3. Colocando el cursor de la computadora en la sección inferior izquierda de la pantalla, titulada Random Numbers, oprima el ratón en la opción derecha y le aparecerá una pantalla que en la parte superior dice Pane Options y Analysis Options.
4. Seleccione Análisis Options y le aparecerá ahora una pantalla solicitándole un valor inferior y un valor superior (Lower Limit, Upper Limit). En este momento debe usted alimentar el valor 1 para el valor inferior y el número que corresponda al total de elementos de la población de interés. Por ejemplo, si usted desea obtener una muestra de una población de 5,000 estudiantes, entonces el valor superior que deberá indicar será justo el 5,000 y aceptar.
5. Repita la acción anterior, pero ahora seleccione la opción Pane Options y le aparecerá una pantalla pidiéndole el tamaño de muestra (Size), escriba ahí el tamaño de muestra deseado, acepte y se generará la muestra.
6. Para poder ver la muestra obtenida seleccione ahora el icono Save Results. Le aparecerá una pantalla solicitándole grabar los resultados (Save) en la parte izquierda (hágalo haciendo clik en el cuadrito), y en la derecha le solicitará un nombre para su muestra (Target Variables). Escriba el nombre que desee y acepte.
7. Para ver la muestra obtenida ahora minimice la pantalla y aparecerá ante sus ojos una hermosa muestra aleatoria.
Siempre es posible que algunos números aleatorios se repitan, por ello es conveniente que solicite una cantidad ligeramente mayor, o volver a iniciar el procedimiento para generar los números faltantes. Se entiende que tenemos previamente establecido, en el caso del ejemplo, la identificación de cada estudiante con un número del 1 al 5000, de modo que la muestra aleatoria de números corresponderá a una muestra aleatoria de estudiantes.