El documento explica conceptos básicos sobre variables aleatorias discretas y continuas. Define una variable aleatoria como una función que asigna un número real a cada suceso posible de un experimento aleatorio. Explica las funciones de probabilidad y distribución de probabilidad para variables discretas y los tipos más importantes como la binomial.
1. Variables Aleatorias Una función f de R en R es una colección de pares ordenados de números reales que no contiene dos pares distintos con el primer elemento igual. El resultado de un experimento aleatorio puede ser descrito como una cantidad numérica . Hemos visto que los posibles resultados de un experimento aleatorio (espacio muestral E) no son siempre numéricos. El suceso "cara" al tirar una moneda al aire o el suceso "bastos" al sacar una carta de la baraja. Hablábamos, por ejemplo, de que saliese el dos o el cinco al tirar un dado, pero estos números sólo servían para distinguir una cara del dado de la otra. A partir de ahora nos vamos a referir a fenómenos cuantitativos, tales como cuántas veces sale cara al tirar repetidamente una moneda al aire, la media de edad de los consumidores de cierta marca de chicle, etc. Desde un punto de vista formal diremos que una variable aleatoria es toda función que permite atribuir un número real y sólo uno a cada suceso del espacio muestral. En otras palabras es una aplicación X: E -> R
2. Variables Aleatorias Experimento aleatorio: Sacar dos cartas de una baraja española y observar el palo al que pertenecen. Representamos con "O", "C", "E" y "B" los palos de oros, copas, espadas y bastos respectivamente, los resultados posibles son: OO, OC, OE, OB, CC, CE, CB, EE, EB, BB Definamos, la variable aleatoria " número de copas ", los valores que se atribuyen a cada uno de los sucesos que constituyen el espacio muestral son: 0, 1, 0, 0, 2, 1, 1, 0, 0, 0 respectivamente. Pero podemos definir también sobre este mismo espacio muestral otra variable aleatoria que da 1 punto a cada carta de oros, 2 a las de copas, 3 a las de espadas y 4 a las de bastos, sumando los valores de las cartas de cada mano, ahora los valores de la nueva variable serían 2, 3, 4, 5, 4, 5, 6, 6, 7, 8 respectivamente. Dado un único espacio muestral cabe definir distintas variables aleatorias pero, sea cual sea el procedimiento de atribución de valores seleccionado, a cada suceso le corresponderá un valor y sólo uno de la variable (recordar el concepto de función) .
3. Variables Aleatorias Dos tipos de variables aleatorias: Puesto que los espacios muestrales pueden ser clasificados como discretos o continuos, también las variables aleatorias definidas sobre dichos espacios muestrales serán discretas o continuas, radicando la diferencia en si sus elementos son numerables o no. La naturaleza, discreta o continua, de las variables aleatorias, tiene una importancia decisiva sobre el proceso matemático del cálculo de las probabilidades de sus valores. Variables Aleatorias Discretas : Son aquellas variables que se definen sobre espacios muestrales finitos (p.e “tirar un dado al aire”) o infinitos pero numerables. (p.e. “el número de accidentes de trafico en un fin de semana”) Variables Aleatorias Continuas : Son aquellas variables que se definen sobre espacios muestrales infinitos pero numerables. (p.e. la estatura de los alumnos de esta clase)
4. Variables Aleatorias Discretas Dos conceptos de vital importancia relacionados con las variables aleatorias discretas son los que se refieren a las funciones que asocian a cada uno de sus valores las probabilidades de que éstas adopten esos valores y a las de que adopten como mucho esos valores. La Función de Probabilidad. La Función de Distribución de Probabilidad.
5. Función de Distribución de Probabilidad F(x) Es aquella que asigna a todo número real, x i , la probabilidad de que la variable aleatoria X asuma ese valor x i o cualquier valor inferior a x i . Simbólicamente se define: Función de Probabilidad f(x) Es aquella que asigna a todo número real, x i , la probabilidad de que la variable aleatoria X asuma ese valor, valga x i . Simbólicamente se define: Variables Aleatorias Discretas
6. Eligiendo al azar una familia, definamos la variable “Nº de coches de la unidad familiar”. Se trata de una Variable Aleatoria y dado que los valores encontrados oscilan entre 0 y 5 coches la variable es aleatoria y discreta. Frecuencia Relativa (Función de Probabilidad) Frecuencia Relativa Acumulada (Función de Distribución de Probabilidad) Variables Aleatorias Discretas 1.000 6487 ∑ 0.008 53 5 0.050 324 4 0.277 1796 3 0.441 2865 2 0.219 1422 1 0.004 27 0 p i n i Nº coches en la unidad familiar 1.000 ∑ 1.000 0.008 5 0.992 0.050 4 0.942 0.277 3 0.665 0.441 2 0.223 0.219 1 0.004 0.004 0 Fx p a fx p x Probabilidad de que una familia seleccionada al azar tenga 3 coches o menos Probabilidad de que una familia seleccionada al azar tenga 3 coches
7. Funciones de Distribución y Probabilidad discretas Las distribuciones de probabilidad discretas de mayor importancia para Psicología son la de Bernoulli , la binomial y la de Poisson . La distribución de Bernoulli ofrece las probabilidades de éxito y fracaso en experimentos con dos resultados. Se trata de una función de probabilidad que se define para variables aleatorias con sólo dos valores, 0 y 1 (fracaso y éxito) Experimento de Bernoulli Un gran número de problemas de estadística y probabilidad aplicada, se refieren a situaciones donde un experimento se repite muchas veces, y éste sólo tiene dos resultados posibles. Así en la posible efectividad de un nuevo tratamiento de la fobia social, cada paciente recibe un tratamiento individual (ensayo) y para cada uno de ellos, el tratamiento puede ser efectivo (éxito) o no efectivo (fracaso).
8. Funciones de Distribución y Probabilidad discretas Un experimento se denomina de Bernoulli si: a) El resultado de cada ensayo puede clasificarse como éxito (ocurrencia del evento) o fracaso (no ocurrencia). b) Los ensayos son independientes entre si. c) La probabilidad de éxito p se mantiene constante entre ensayo y ensayo.
9. Experimento de Bernouilli En una ruleta hay 38 números de los cuales 18 son rojos, 18 negros y 2 verdes. Si hacemos girar la ruleta, cada uno de los 38 números, son evidentemente equiprobables. Si ganamos solamente cuando la bola cae en rojo, sólo existirán dos resultados no igualmente equiprobables: éxito o fracaso. Si definimos p como la probabilidad de éxito. En nuestro ejemplo: p = 18/38 = 0.474 y la probabilidad de fracaso como 1-p = 1 – 0.474 = 0.526 Determina la probabilidad de los posibles resultados a partir de tres jugadas consecutivas en dicha ruleta ( 2 3 = 8 ) (E Éxito, F Fracaso) FFF FEF EFF EEF FFE FEE EFE EEE
10. Experimento de Bernouilli Combinaciones de n elementos tomados de x en x FFF FFE EFF FEF EFE EEF FEE EEE 0 Éxito 1 Éxito 2 Éxitos 3 Éxitos
12. Funciones de Distribución y Probabilidad discretas Distribución Binomial La distribución de probabilidad binomial es la más interesante de las distribuciones discretas. Es la función de probabilidad que corresponde a una variable aleatoria definida como el número de éxitos que se pueden alcanzar en n experimentos de Bernoulli . El menor valor asumible para esta variable es el 0, en el caso que no se obtenga ningún éxito en los n experimentos de Bernoulli, siendo el valor más alto el 1 cuando se hubiesen obtenido todo éxitos en los n experimentos. Su función de probabilidad tiene la siguiente forma: n -> es el número de experimentos de Bernoulli x -> son los valores de la variable aleatoria (número de éxitos) p -> es la probabilidad de éxito en un experimento de Bernoulli q -> es la probabilidad de fracaso en un experimento de Bernoulli.
13. Funciones de Distribución y Probabilidad Discretas: Binomial De otra manera: Supongamos un experimento aleatorio consistente en realizar n pruebas independientes o ensayos. En cada ensayo la probabilidad p de aparición del suceso S (denominado "acierto") es constante y conocida. Sea la variable X el número de aciertos (apariciones del suceso S) tras los n ensayos. Evidentemente, los valores permisibles de X serán 0, 1, 2, 3,...,n. En estas condiciones, la función de probabilidad de X viene dada por: n -> Número de ensayos. x -> Número de aciertos. C n,x -> Las combinaciones de n elementos tomados de x en x. p -> La probabilidad de acierto. q=1‑p -> La probabilidad de error.
15. Probabilidad Binomial Función de Distribución del número de éxitos en una secuencia de ensayos de Bernoulli para el ejemplo de la ruleta. De donde se deduce que: Función de Distribución
16. Funciones de Distribución y Probabilidad discretas Supongamos, como ejemplo, que un estudiante contesta al azar los 20 ítems de un examen. Cada ítem tiene 5 alternativas. ¿Cuál es la probabilidad de que dicho estudiante acierte 10 preguntas al azar? El valor de n, número de ensayos, es 20; puesto que nos interesa la probabilidad de que acierte 10 preguntas, éste será el valor de x, número de aciertos; p es 0,20, porque de las 5 alternativas sólo una es correcta; finalmente, q=1‑p= 0,80.
17. Funciones de Distribución y Probabilidad discretas Supongamos ahora que realizamos un experimento de telepatía, para lo cual extraemos en cada ensayo una carta de un mazo de 50 pedimos al supuesto telépata que la adivine, anotamos el resultado y devolvemos la carta al mazo barajándolo a continuación. Si cada carta del mazo tiene uno de 5 dibujos posibles, ¿Cuál es la probabilidad de que tras 25 ensayos el sujeto acierte 5 cartas por mero azar? Evidentemente, n=25, x=5, p=(1/5)=0,2 y q=1‑0,2 = 0,8,
18. Funciones de Distribución y Probabilidad discretas Como hemos visto, en cuanto a la Función de Distribución sabemos que podemos calcularla sumando las probabilidades de cada uno de los valores de la variable iguales o menores que el dado. Así, si lo que nos interesa es saber cuál es la probabilidad de que el estudiante que respondía al azar obtenga 9 o menos respuestas correctas (es decir, suspenda) lo calcularemos como: F(9)= f(0)+f(1)+f(2)+f(3)+f(4)+f(5)+f(6)+f(7)+f(8)+f(9) Afortunadamente para nosotros, existen tablas de la función de distribución binomial que nos permiten localizar rápidamente el valor de dicha función para unos n, x y p dados
19. Tabla de Función de Distribución binomial: Cómo calcular la función de distribución a partir de las tablas Supongamos, como ejemplo, que un estudiante contesta al azar los 20 ítems de un examen. Cada ítem tiene 5 alternativas. ¿Cuál es la probabilidad de que dicho estudiante acierte 10 preguntas al azar? ¿Cuál es la probabilidad de que acierte 9 o menos preguntas correctas (es decir suspenda)? Localizamos el valor de la función de distribución binomial en las tablas: n=20, x=10, x=9; p=0,20. ,000 ,000 ,003 ,048 ,245 ,588 ,872 ,983 ,999 1,00 1,00 10 ,000 ,000 ,001 ,017 ,128 ,412 ,755 ,952 ,997 1,00 1,00 9 ,000 ,000 ,000 ,005 ,057 ,252 ,596 ,887 ,990 1,00 1,00 8 ,000 ,000 ,000 ,001 ,021 ,132 ,416 ,772 ,968 1,00 1,00 7 ,000 ,000 ,000 ,000 ,007 ,058 ,250 ,608 ,913 ,998 1,00 6 ,000 ,000 ,000 ,000 ,002 ,021 ,126 ,416 ,804 ,989 1,00 5 ,000 ,000 ,000 ,000 ,000 ,006 ,051 ,237 ,630 ,957 ,997 4 ,000 ,000 ,000 ,000 ,000 ,001 ,016 ,107 ,411 ,867 ,984 3 ,000 ,000 ,000 ,000 ,000 ,000 ,004 ,035 ,206 ,677 ,925 2 ,000 ,000 ,000 ,000 ,000 ,000 ,001 ,008 ,069 ,392 ,736 1 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,001 ,012 ,122 ,358 0 20 ,95 ,90 ,80 ,70 ,60 ,50 ,40 ,30 ,20 ,10 ,05 x n p
20. Distribución Binomial Si en el experimento de telepatía estuviésemos interesados en la probabilidad de obtener 5 o menos aciertos, localizaríamos en la tabla los valores de n, x y p, para obtener que F(x ≤ 5) = 0,617. Las tablas de la función de distribución nos permiten también hallar el valor de la función de probabilidad muy fácilmente. En el caso del examen, por ejemplo, es evidente que f(x =10)= F(x ≤ 10)‑F(x ≤ 9), con lo que, buscando ambos valores en las tablas, tendremos: En el ejemplo de las respuestas al examen f(10)=F(x ≤ 10)‑F(x ≤ 9)=0,999‑0,997=0,002 En el ejemplo del telépata, f(5)=F(x ≤ 5)‑F(x ≤ 4)=0,617‑0,421=0,196
21. Distribución Binomial Siguiendo con el ejemplo del telépata, supongamos que deseamos saber la probabilidad de que acierte, por mero azar, 11 o más cartas. Puesto que la probabilidad total es 1, se cumplirá que: P(X≥ 11)= 1‑P(X< 11)= 1‑ P(X ≤ 10)= 1‑F(10)= 1‑0,994=0,006 ¿Cuál es la probabilidad de que acierte, más de cinco y menos de doce cartas? P(5< X <12)= P(6 ≤ X ≤ 11) = f(6)+f(7)+f(8)+f(9)+f(10)+f(11)= F(X ≤11)-F(X ≤5)= 0,381
23. Distribución de Poisson Las condiciones que debe cumplir una variable aleatoria para que su función de probabilidad se ajuste a la distribución de Poisson son: 1) La probabilidad de que se dé más de un suceso en una unidad de tiempo lo suficientemente pequeña es despreciable. 2) La probabilidad de aparición de un suceso en un intervalo de longitud muy pequeña es proporcional a dicha longitud. Es decir, la probabilidad de que se produzca un suceso en un intervalo de longitud dt es λ dt, donde λ es una constante positiva. 3) El número de sucesos que se dan en un intervalo de longitud T es independiente del número de sucesos que se den en otro intervalo de idéntica longitud.
24. Distribución de Poisson Algunos ejemplos de variables cuya función de probabilidad se ajusta a la de Poisson podrían ser el número de erratas por página en un libro grande, el número de llamadas recibidas por minuto en una centralita, el número de partículas a emitidas por unidad de tiempo por un elemento radiactivo, el número de personas que cada minuto a las horas punta hacen cola en la ventanilla de un banco, etc.
25. Distribución de Poisson Bajo las mismas condiciones impuestas a la binomial: 1.- El resultado de cada ensayo puede clasificarse como éxito (ocurrencia del evento) o fracaso (no ocurrencia) 2.- Los ensayos son independientes entre si 3.- La probabilidad de éxito p se mantiene constante entre ensayo y ensayo. Si el número de ensayos tiende a infinito y la probabilidad de éxito o verificación del evento tiende a 0. La distribución binomial tiende hacia otra denominada de Poisson . donde e = 2.7182 o base de los logaritmos neperianos y
26. Distribución de Poisson Supongamos como ejemplo que en un cierto libro hay un promedio de 10 erratas cada 50 páginas. ¿Cuál es la probabilidad de encontrar 5 erratas en 5 páginas? Puesto que la unidad de trabajo son las 5 páginas, debemos pasar a dicha unidad el promedio, con lo que:
27. Distribución de Poisson Si nos interesase la probabilidad de que entrasen entre cinco y diez clientes ambos incluidos… Veamos otro ejemplo. En un determinado comercio entran por término medio 2 clientes cada hora. Calcular la probabilidad de que en una mañana concreta (en 4 horas) entren 5 clientes.
28. Distribución de Poisson Ejemplo: En una gran superficie se ha constatado que un 2% de los usuarios realizan hurtos en sus compras. ¿Cuál el la probabilidad de encontrar 3 clientes que hayan robado, si hiciésemos un seguimiento de 100 clientes elegidos al azar? Poisson Binomial
30. Distribución de Poisson Clarke (1946) intentó comprobar si las bombas volantes lanzadas por los alemanes caían sobre Londres aleatoriamente o de modo sistemático. Para ello dividió la superficie de la ciudad en 576 rectángulos de igual tamaño y observó donde cayeron 537 bombas. La siguiente tabla presenta el número de impactos registrados por área y sus probabilidades a posteriori o empíricas. (Amon, J. 1982) ¿Las bombas caían aleatoriamente o seguían un patrón sistemático? Observamos que p(x) , probabilidad de que cualquier área sea alcanzada, es muy pequeño 1/576 y n (537 lanzamientos) grande, por lo que podemos asumir que si estos fuesen aleatorios, el número de impactos por áreas seguirían la distribución de Poisson con λ = 537 x 0.0017 = 0.91 ~ 0.9
31. Distribución de Poisson Los resultados empíricos fueron los siguientes: Áreas con 5 o más impactos Áreas con 4 impactos Áreas con 3 impactos Áreas con 2 impactos Áreas con 1 impacto Áreas sin ningún impacto
33. Distribución de Poisson Tal y como podemos observar hay una coincidencia casi total entre las proporciones de impactos esperados por puro azar y las proporciones empíricas registradas. Por ello concluimos que los lanzamientos fueron realizados sin un patrón de objetivos concreto. 0.002 1- 0.998 = 0.002 Poisson 5 impactos o más 0.012 0.998 - 0.987 = 0.011 Poisson 4 impactos 0.061 0.987 - 0.937 = 0.050 Poi sson 3 impactos 0.161 0.937 - 0.772 = 0.165 Poisson 2 impactos 0.366 0.772 - 0.407 = 0.365 Poisson 1 impacto 0.398 0.407 Poisson 0 impactos Prop. de impactos Poisson P(x)