Introducción a la probabilidad
Essentially, all models are wrong, but some are useful — George E.P. Box
Ivan Meza
Significado
- Existe una probabilidad del 90% que el medicamento funcione
- Existe una probabilidad del 90% la Iliada y la Odisea fueron escritos por la misma persona
Experimento
- Un proceso con varios resultados posibles
Experimentos: ejemplos
- Juegos de azar
- Deportes
- Procesos políticos
- Probar un medicamento
- Procesos fonéticos
- Procesos fonológicos
Evento
La realización de un experimento específico
- Un volado
- Un partido de Pumas vs Toluca
- Una elección
- Tomar una píldora
- Cada vez que alguien habla
- Cada vez que alguien habla
Teoría de la probabilidad
- Espacio de muestreo $\Omega$
- Ley de la probabilidad
Espacio de muestreo: ejemplos
El conjunto de resultados posibles
- ¿Lanzar una moneda?
- ¿Pumas contra Toluca?
- ¿La elección del 2012?
- ¿Tomar una píldora?
- ¿Pronunciar el fonema a?
- ¿Pronunciar un una s aspirada?
Resultado
El resultado que se da en un evento
- Sol
- 1-3
- Gana candidato PRI
- Mejoro
- a
- s
La ley de probabilidad
- $P(A) \ge 0.0$
- $P(A \cup B) = P(A) + P(B)$ si son disjuntos
- $P(\Omega) = 1.0 $
Cada vez que alguien dice hay que ponerle $110\%$ de ganas, un hada estadística cae en coma
En resumen
- La probabilidad de un evento es mayor o igual a cero
- La probabilidad de dos eventos disjuntos es su suma
- La probabilidad del espacio de muestreo es uno
Asigna valores entre 0 y 1 al conjunto de posible resultados de un experimento
$2^\Omega \rightarrow [0..1]$
Deconstruyendo la notación
$P(X)$
- $P \rightarrow$ indica que lo que sigue es una probabilidad
- $() \rightarrow$ marcan hasta donde abarca de lo que queremos una probabilidad
- $X \rightarrow$ es el conjunto del cual queremos su probabilidad
Una moneda al aire
- $\Omega = \{A,S\}$
- $2^\Omega = \{\emptyset,\{A\},\{S\},\{A,S\}\}$
- $P(A) = $ 0.5
- $P(S) = $ 0.5
- $P(\{A,S\}) = P(A) + P(S) = 1.0$
- $P(\emptyset) = 0.0$
Pronunciar un fonema de la CDMX
- $\Omega = AFI$
- $2^\Omega = \{\emptyset,\{a,...\},\{b,...\},\{a,b,...\}\}$
$P(A \cup D) = $$P(A) + P(D)$
$P(C)$ $\ge$ $P(B) $
$P(A \cup C) = $$ P(A)+P(C)-P(A \cap C) $
Probabilidad condicional
- $P(A|B)$
- La probabilidad de que un evento ocurra dado que otro ya ocurrió
- Cambia nuestro espacio de muestreo, al espacio de
$P(A)$, $P(B)$ y $P(C)$
$P(A|B)$, $P(C|B)$
$P(A \cap B)$
$P(A \cap B)=P(A|B)P(B)$
$P(B)$$=P(A_1\cap B)+P(A_2\cap B)+P(A_3\cap B)$
$P(A \cap B)=P(A|B)P(B)$
$P(A \cap B)=P(B|A)P(A)$
$P(B|A)=\frac{P(A|B)P(B)}{P(A)}$
$P(C|E)=\frac{P(E|C)P(C)}{P(E)}$
Uso
- Dado que veo un efecto que puedo decir de la causa
Ejemplo
- $1%$ de las mujeres mayores de 40 años que se checan regularmente tienen cáncer
- $80%$ de estas mujeres recibirán un resultado positivo
- $9.6%$ de las mujeres sin cáncer también reciben un resultado positivo
Una mujer de 45 recibe un resultado positivo ¿Cuál es la probabilidad de que tenga cáncer?
Algunos datos
- $15%$ de los doctores razonan adecuadamente este problema
- Un cambio de escala sube ese número a $46%$
Re-escribiendo
- Causa: cáncer; Efecto: resultado positivo
- $\Omega = \{C+,nC+,C-,nC-\}$
- $P(C|+)$
Re-escribiendo
- $P(C)=0.01$
- $P(+|C)=0.8$
- $P(+|nC)$=0.096
Re-escribiendo
- $P(C|+)=\frac{P(+|C)P(C)}{P(+)}$
- $P(+)=P(+\cup C)+P(+ \cup nC)$
- $P(+)=P(+| C)P(C)+P(+ | nC)P(nC)$
- $P(+)=0.8*0.01+0.096*0.99=0.103$
- $P(C|+)=\frac{0.8*0.1}{0.103}=0.0769$
Fonéticamente...
- $P(E|P)$, ejemplos de esa persona
- $P(P)$, es cierta persona
- $P(E)$, el fonema
... pero no es suficiente ... más adelante regresaremos a esto
Preguntas interesantes
- ¿Qué características fonéticos son buena evidencia?
- ¿Cuantos datos son suficiente?
Representaciones
- Tablas
- Distribución de probabilidades*
Distribución normal
Distribución normal
Muestreo
- ¿Colección de grabaciones?
- ¿Cuantos datos son suficiente?
Colecciones
- De decenas hasta cientos
- Tipo de habla: monólogos, entrevistas, lecturas
Colecciones
- De decenas hasta cientos
- Elegir similares
Micrófonos
- Electrostático
- Dinámico
- Pieza eléctrico
- Magnético
- Carbón
Omnidireccional
Bidireccional
Direccional
Cardiode
Respuesta a la frecuencia