Introducción a la probabilidad

Essentially, all models are wrong, but some are useful — George E.P. Box





Ivan Meza

Significado

  • Existe una probabilidad del 90% que el medicamento funcione
  • Existe una probabilidad del 90% la Iliada y la Odisea fueron escritos por la misma persona

Incetidumbre

Experimento

  • Un proceso con varios resultados posibles

Experimentos: ejemplos

  • Juegos de azar
  • Deportes
  • Procesos políticos
  • Probar un medicamento
  • Procesos fonéticos
  • Procesos fonológicos

Evento

La realización de un experimento específico

  • Un volado
  • Un partido de Pumas vs Toluca
  • Una elección
  • Tomar una píldora
  • Cada vez que alguien habla
  • Cada vez que alguien habla

Teoría de la probabilidad

  • Espacio de muestreo $\Omega$
  • Ley de la probabilidad

Espacio de muestreo: ejemplos

El conjunto de resultados posibles

  • ¿Lanzar una moneda?
  • ¿Pumas contra Toluca?
  • ¿La elección del 2012?
  • ¿Tomar una píldora?
  • ¿Pronunciar el fonema a?
  • ¿Pronunciar un una s aspirada?

Resultado

El resultado que se da en un evento

  • Sol
  • 1-3
  • Gana candidato PRI
  • Mejoro
  • a
  • s

La ley de probabilidad

  • $P(A) \ge 0.0$
  • $P(A \cup B) = P(A) + P(B)$ si son disjuntos
  • $P(\Omega) = 1.0 $


Cada vez que alguien dice hay que ponerle $110\%$ de ganas, un hada estadística cae en coma

En resumen

  • La probabilidad de un evento es mayor o igual a cero
  • La probabilidad de dos eventos disjuntos es su suma
  • La probabilidad del espacio de muestreo es uno


Asigna valores entre 0 y 1 al conjunto de posible resultados de un experimento

$2^\Omega \rightarrow [0..1]$

Deconstruyendo la notación

$P(X)$

  • $P \rightarrow$ indica que lo que sigue es una probabilidad
  • $() \rightarrow$ marcan hasta donde abarca de lo que queremos una probabilidad
  • $X \rightarrow$ es el conjunto del cual queremos su probabilidad

Una moneda al aire

  • $\Omega = \{A,S\}$
  • $2^\Omega = \{\emptyset,\{A\},\{S\},\{A,S\}\}$
  • $P(A) = $ 0.5
  • $P(S) = $ 0.5
  • $P(\{A,S\}) = P(A) + P(S) = 1.0$
  • $P(\emptyset) = 0.0$

Pronunciar un fonema de la CDMX

  • $\Omega = AFI$
  • $2^\Omega = \{\emptyset,\{a,...\},\{b,...\},\{a,b,...\}\}$

$P(A \cup D) = $$P(A) + P(D)$

$P(C)$ $\ge$ $P(B) $

$P(A \cup C) = $$ P(A)+P(C)-P(A \cap C) $

Probabilidad condicional

Probabilidad condicional

  • $P(A|B)$
  • La probabilidad de que un evento ocurra dado que otro ya ocurrió
  • Cambia nuestro espacio de muestreo, al espacio de

$P(A)$, $P(B)$ y $P(C)$

$P(A|B)$, $P(C|B)$

$P(A \cap B)$

$P(A \cap B)=P(A|B)P(B)$

$P(B)$$=P(A_1\cap B)+P(A_2\cap B)+P(A_3\cap B)$

Teorema de Bayes

$P(A \cap B)=P(A|B)P(B)$

$P(A \cap B)=P(B|A)P(A)$

$P(B|A)P(A)=P(A|B)P(B)$

$P(B|A)=\frac{P(A|B)P(B)}{P(A)}$

$P(C|E)=\frac{P(E|C)P(C)}{P(E)}$

  • C: Causa
  • E: Evidencia

Uso

  • Dado que veo un efecto que puedo decir de la causa

Ejemplo

  • $1%$ de las mujeres mayores de 40 años que se checan regularmente tienen cáncer
  • $80%$ de estas mujeres recibirán un resultado positivo
  • $9.6%$ de las mujeres sin cáncer también reciben un resultado positivo


Una mujer de 45 recibe un resultado positivo ¿Cuál es la probabilidad de que tenga cáncer?

Algunos datos

  • $15%$ de los doctores razonan adecuadamente este problema
  • Un cambio de escala sube ese número a $46%$

Re-escribiendo

  • Causa: cáncer; Efecto: resultado positivo
  • $\Omega = \{C+,nC+,C-,nC-\}$
  • $P(C|+)$

Re-escribiendo

  • $P(C)=0.01$
  • $P(+|C)=0.8$
  • $P(+|nC)$=0.096

Re-escribiendo

  • $P(C|+)=\frac{P(+|C)P(C)}{P(+)}$
  • $P(+)=P(+\cup C)+P(+ \cup nC)$
  • $P(+)=P(+| C)P(C)+P(+ | nC)P(nC)$
  • $P(+)=0.8*0.01+0.096*0.99=0.103$
  • $P(C|+)=\frac{0.8*0.1}{0.103}=0.0769$

Fonéticamente...

  • $P(E|P)$, ejemplos de esa persona
  • $P(P)$, es cierta persona
  • $P(E)$, el fonema

... pero no es suficiente ... más adelante regresaremos a esto

Preguntas interesantes

  • ¿Qué características fonéticos son buena evidencia?
  • ¿Cuantos datos son suficiente?

Representaciones

  • Tablas
  • Distribución de probabilidades*

Distribución normal

Distribución normal

Muestreo

  • ¿Colección de grabaciones?
  • ¿Cuantos datos son suficiente?

Colecciones

  • De decenas hasta cientos
  • Tipo de habla: monólogos, entrevistas, lecturas

Colecciones

  • De decenas hasta cientos
  • Elegir similares

Micrófonos

  • Electrostático
  • Dinámico
  • Pieza eléctrico
  • Magnético
  • Carbón

Omnidireccional

Bidireccional

Direccional

Cardiode

Respuesta a la frecuencia



Dynamic vs Condenser Microphones, SM57 vs P170 de CaneMajor en YouTube.

Licencia de Creative Commons
Introducción a laprobabilidad by Ivan V. Meza Ruiz is licensed under a Creative Commons Reconocimiento 4.0 Internacional License.
Creado a partir de la obra en http://turing.iimas.unam.mx/~ivanvladimir/slides/fonologia_forense/prob.html.