Las distribuciones de probabilidad se expresan mediante fórmulas que contienen, como casi todas las fórmulas, símbolos y números; algunos números muy famosos como aquel que en la escuela primaria utilizábamos para calcular el perímetro de una circunferencia al multiplicarlo por la longitud del diámetro, el número phi, representado por la letra griega π (3.1415..), o el número que servía de base para los logaritmos naturales, el número e (2.7182..), menos famoso que el π, pero también muy frecuente en el discurso de la Estadística-Matemática.
Los símbolos que se utilizan en las fórmulas que constituyen la expresión matemática de las distribuciones de probabilidad, por lo común representan de manera directa, o con leves modificaciones, a los parámetros más importantes de tendencia central y de variabilidad, tales como la media, la variancia y la desviación estándar. El propósito de utilizar símbolos para representar los valores de los parámetros antes referidos, es el de representar en una única fórmula a la infinidad de distribuciones de probabilidad específicas que se constituyen al determinar los valores de los parámetros.
En esta y en las siguientes dos lecciones, nos referiremos a tres distribuciones de probabilidad muy importantes, a saber, la Binomial, la Poisson y la Normal, y veremos, para cada una de ellas, cuáles son los símbolos y cómo se modifican para conformar los valores de los parámetros que hemos mencionado.
La Distribución Binomial
La distribución binomial es el resultado de la repetición de un tipo de experimentos o eventos, que a su vez constituyen una distribución de probabilidad, conocidos como de Bernoulli, que es el modelo abstracto que resulta de una variedad de situaciones muy frecuentes tales como las siguientes:
i) Una rifa o sorteo, donde se gana o se pierde.
ii) Lanzar una moneda, donde el resultado es águila o sol.
iii) Un proceso industrial. Donde cada producto puede ser conformable o no conformable.
iv) Un tratamiento médico. Donde el paciente muere o sobrevive.
v) Un proceso electoral. Donde cada elector decide acudir a la urna o no. Decide apoyar a un candidato o no.
Como puede apreciarse, en los casos anteriores siempre tenemos dos opciones: Ganar o perder en el sorteo o rifa; que el resultado al lanzar la moneda sea «águila» o «sol»; que el producto sea defectuoso o efectivo; que el paciente muera o sobreviva y finalmente que una persona reaccione a favor o en contra de algo o de alguien.
Es común que, para diferenciar a los dos resultados de un experimento de Bernoulli, nos refiramos a uno de ellos como «éxito» y al otro como «fracaso». Por lo común llamamos éxito al resultado sobre el cual estamos más interesados, aunque obtener un éxito en el contexto de una distribución de Bernoulli no tenga en el sentido común del término nada de exitoso, como podría ser el caso de la muerte de un paciente.
Por lo común tiene sentido repetir un ensayo de Bernoulli. Es claro que un paciente que muere después de someterse a un tratamiento no podrá repetir el experimento, pero lo que sí se puede repetir es el tratamiento en otros pacientes. Cuando se desarrollan las repeticiones nuestro interés ahora es en cuántos éxitos se logran en un determinado número de ensayos o repeticiones del experimento.
Si lanzamos una moneda dos veces, es claro que se podrían obtener ninguna, una o dos águilas, como ya lo vimos anteriormente. Vimos también que las probabilidades correspondientes eran un cuarto, un medio y un cuarto. Pues bien, esta descripción que acabamos de hacer constituye una Distribución Binomial, donde tenemos dos ensayos y una probabilidad «p» de éxito de 0.5. Al número de ensayos por lo común se le representa por la letra «n», de modo que los parámetros de la distribución binomial son justo n y p, que en el ejemplo que acabamos de describir toman los valores 2 y 0.5.
Los parámetros n y p son suficientes para conocer el valor de la media y la variancia de la distribución binomial; la media resulta al multiplicar n por p, y la variancia de multiplicar n por p y por (1-p) que usualmente se denota por «q». Siendo p la probabilidad de éxito y q la probabilidad de fracaso.
En el paquete Statgraphics se puede graficar la distribución binomial para distintos valores de n y de p. Si nos interesan los valores n igual a 2 y p igual a 0.5. Podemos generar la gráfica siguiendo los siguientes pasos:
Paso 1: Seleccione Plot- Probability Distributions y aceptar.
Paso 2: Le aparecerá una pantalla con el título Probability Distributions, con la distribución normal señalada por default. Seleccione usted la opción Binomial y acepte. En el primer cuadro a la izquierda le aparecerán los parámetros por default que utiliza la computadora con un valor para p de 0.1 y para n de 10.
Paso 3: Para utilizar los parámetros p = 0.5 y n = 2, teniendo el cursor en el referido cuadro de la parte superior izquierda accione el ratón derecho y seleccione Análisis Options. Le aparecerá una ventana con los valores por default para p (Event Probability) y para n (Trails). Aquí alimente para p el valor 0.5 y para n el valor 2 y acepte.
Paso 4: La gráfica buscada aparece ahora en el cuadro superior derecho. Si hace doble clic sobre la gráfica, la imagen se magnificará.
En la gráfica obtenida, que mostramos abajo, puede apreciarse que al valor 0 le corresponde una probabilidad de 0.25, que al valor 1 le corresponde una probabilidad de 0.5 y que al valor 2 una probabilidad de 0.25. Como puede apreciarse es el mismo caso de lanzar una moneda balanceada dos veces.
Se muestran además dos distribuciones binomiales más; la que corresponde a la segunda gráfica mantiene la probabilidad de éxito, es decir, sigue siendo 0.5 como cuando lanzamos una moneda, pero el número de ensayos es 10, y en la última también se mantiene la probabilidad de éxito pero el número de ensayos es 30. Analice estas gráficas, observe cómo la figura se va transformando conforme se incrementa el número de ensayos. Esto es de gran trascendencia.
Hasta la próxima, con la distribución de Poisson.