Octava lección: “Las Muestras Aleatorias, tercera parte”
La fusión de la Estadística Descriptiva con la Probabilidad le da el sentido que hoy tiene la Ciencia Estadística. La variación genera incertidumbre y la variación, como característica de prácticamente todos los fenómenos naturales, puede atenderse eficientemente con métodos estadísticos que no dan seguridad absoluta respecto de sus hallazgos, pero sí al menos confianza elevada de que son correctos.
La confianza en estadística tiene un origen probabilístico, como ya lo ilustramos antes, porque en sus esquemas para llegar a conclusiones establece dispositivos conceptuales justo en términos probabilísticos, que al aplicarse a situaciones concretas se traducen en confianza.
Precisar lo anterior es importante, porque la estadística se maneja en un marco de probabilidades y de confianzas, ambas determinadas por la condición de incertidumbre derivada de la variación. Para construir esos esquemas se parte del concepto de Distribución de Probabilidad, el cual veremos más adelante, pero sobre el cual adelantamos que es una forma de construir, en el ámbito de la Estadística Matemática, representaciones de situaciones muy comunes en el mundo real, que se expresan utilizando los parámetros que, como ya vimos, nos dan información condensada de lo esencial que sobre una población deseamos conocer.
Dentro de las distribuciones de probabilidad, un grupo muy importante es conocido como distribuciones de muestreo, porque son las que resultan asociadas a los estadísticos que, como recordaremos, son finalmente los valores muestrales que nos permiten asomarnos, por aproximación, a los valores de los parámetros. Entre las distribuciones de probabilidad más famosas de este tipo, podemos mencionar a la Normal o campana de Gauss, la t de Student, la F de Fisher y la Chi cuadrada.
Todo el edificio metodológico descrito anteriormente, descansa en que las referidas muestras, obtenidas para calcular los estadísticos, sean aleatorias. Esto es, que todos los elementos de la población bajo estudio hayan tenido la misma probabilidad de ser seleccionados como parte de la muestra.
Las formas de obtención, como ya vimos, son las tablas de números aleatorios y los programas de computación diseñados para tal propósito. Ya en la práctica, dependiendo de la naturaleza de las poblaciones bajo estudio, tenemos diferentes esquemas de muestreo aleatorio, siendo los fundamentales los siguientes: Muestreo aleatorio simple o irrestricto, muestreo sistemático, muestreo estratificado y muestreo por conglomerados.
Cuando lleguemos a la lección sobre Encuestas de Opinión insistiremos en este tema. Por el momento lo que deseamos subrayar es el hecho de que todo el discurso estadístico de niveles de confianza, de márgenes de error, también a ciertos niveles de confianza, y los niveles de Significancia, que son expresiones también muy comunes en el discurso estadístico, cobran sentido únicamente cuando las muestras son aleatorias.
Es una agresión a la inteligencia que se afirme que, después de aplicar un muestreo no probabilístico, se llegó a una estimación con un margen de error al 95% confianza. Si la muestra no fue aleatoria no hay forma de derivar un nivel de confianza. Por ello resulta también una agresión a nuestra disciplina que agencias de Investigación de Mercados y algunos Encuestólogos engañen a sus clientes con tales afirmaciones, y una ofensa a la Opinión Pública confundirla con tales muestras de ignorancia o mala fe; peor que todo lo anterior, resulta una imperdonable agresión a nuestro país que instituciones de educación superior, de las más prestigiadas, induzcan este tipo de costosas imprecisiones al enseñar en sus aulas estos errores, confiados porque los han leído en libros de texto de figuras renombradas en el mundo de la Mercadotecnia, que cometen la osadía de abordar temas correspondientes a una disciplina que desconocen.
El aporte de las Muestras Aleatorias es tener la posibilidad de evaluar los riesgos que tenemos al decidir, es la oportunidad que tenemos de jugar con la suerte a nuestro favor. Cuando a un inversionista lo inducen a decisiones corriendo riesgos más elevados de los razonables, por el hecho de no utilizar efectivamente una muestra aleatoria en los estudios de mercado, se aventura más de lo que piensa y las consecuencias se ven en la gran cantidad de negocios quebrados.
En resumen, si algo es importante garantizar en un estudio estadístico, es justo tener la certeza de que la muestra que se utilice sea efectivamente aleatoria. La única garantía de que una muestra sea representativa es que sea aleatoria; todas las demás consideraciones como balances entre hombres y mujeres y de otro tipo, para sustentar la representatividad, son meras fantasías.
Hasta la próxima, cuando abordaremos el tema de Variables aleatorias y Distribuciones de Probabilidad.