Identificación de hablante
¡Aquella voz en la oscuridad era tuya! (Rosana, Cyrano de Bergerac) — Edmond Rostand
Ivan Meza
Las piezas
- Sonido
- Voz
- Aparato fonador
- Comunicación
- Fonética y fonología
- Gran incertidumbre
- Modelo probabilístico y estadístico
Sonido
- Perturbación de la presión en el aire
La voz
- Perturbaciones en el aire producidas por el humano
Aparato fonador
- La voz la producimos con nuestro aparato fonador
Comunicación
- En pricipio la voz es un vehículo para la comunicación
Fonología y fonética
- Estás realizaciones comunicativas han sido estudiadas por la fonética y fonología
Incertidumbre
- Sin embargo existe una gran incertidumbre en los fenómenos y el sonido
Probabilidad y estadística
- Nos permiten hablar de los fenómenos aún cuando sean inciertos
Hipothesis
La voz depende de la fisonomía del aparato fonador del hablante,
de tal forma que la voz identifica al hablante
Criterio biológico
$Y$ en el tiempo $t_2$ comparte la identidad con $X$ en $t_1$ si y sólo si $X$ es un organismo biológico continuo con $Y$
Shoemaker, David,(2014) The Biological Criterion, The Stanford Encyclopedia of Philosophy (Spring 2014 Edition), Edward N. Zalta (ed.)
Criterio biológico*: aparato fonador
- $Y$ en el tiempo $t_2$ comparte la identidad con $X$ en $t_1$ si y sólo si el aparato fonador de $X$ es un continuo con el de $Y$
¿Cómo demostrar que el aparato fonador es el mismo/continuo?
Asumimos nuestra hipótesis
- Identidad de voz representa identidad de aparato fonador ...
- ... y por lo tanto la identidad de la persona
En el marco legal
- Existe un conflicto entre partes
- Parte del conflicto es una grabación y la identidad una o varias voces
- Responsabilidad moral
Partes en un juicio
- Principales: acusador, órgano de la jurisdicción, acusado y su defensa,
- Eventuales: coadyuvante
- Necesarios: testigos, peritos, interpretes, órganos de representación (ejem. padres)
- Auxiliares: investigadores, policía, personal del sistema jurídico
Luna, Jose,(2014) LAS PARTES Y OTRAS PECULIARIDADES DEL SISTEMA PROCESAL PENAL ACUSATORIO MEXICANO EN SU PROCESO DE CONFORMACIÓN,Suprema Corte de Justicia
Escenario uno
Acusado, apoyado por su defensa: No soy el de la grabación
Escenario dos
Acusado, apoyado por su defensa: Soy el de la grabación
Una grabación escenario uno
- Parte acusadora, dice: es su voz en la grabación
- El acusado dice: no es mi voz en la grabación
Evidencia
Inicialmente
- La grabación de voz en cuestión
Evidencia a analizar
- La grabación de voz en cuestión
- Grabación de voz del acusado
- Grabaciones de voz de la población
Terminología
- La grabación de voz en cuestión: dubitativa
- Grabación de voz del acusado: indubitada
- Grabaciones de voz de la población: referencia
Paradoja
- Parte acusadora, dice: el acusado comparte identidad con el de la grabación
- La defensa dice: no comparto identidad con el de la grabación
Dos hipótesis
- $H_a$: Es él en la grabación dubitativa
- $H_d$: No es él en la grabación dubitativa
¿Quién está en lo correcto?
- Como fonetistas-fonólogos forenses nuestra posición es de escepticismo
Objetivo
- Analizar la evidencia para establecer una relación entre ambas hipótesis
- Con estadística podemos hablar de cosas que son y no son al mismo tiempo
Primera aproximación
Es muy tentativo
Donde, $I$ es la información del caso
No es una posición muy escéptica
- $P(H_a|I,E)$
- Donde $E$ representa la evidencia fonética-fonológica
Todavía no es suficiente...
Segunda aproximación
- $P(H_a|I,E)$
- $P(H_d|I,E)$
Terminología
- $P(H_a|I,E)$: Similaridad
- $P(H_d|I,E)$: Tipicidad
Teorema de Bayes
Teorema de Bayes
$P(C|E)=\frac{P(E|C)P(C)}{P(E)}$
Dándole la vuelta al calcetín
Versión del acusado
- $P(H_a|I,E)=\frac{P(E|H_a,I)P(H_a|I)}{P(I,E)}$
Dándole la vuelta al calcetína
Versión de la defensa
- $P(H_d|I,E)=\frac{P(E|H_d,I)P(H_d|I)}{P(I,E)}$
Radio
Pero tenemos dos hipótesis...
- $R=\frac{P(H_a|E,I)}{P(H_d|E,I)}$
- $P(H_a|I,E)=\frac{P(E|H_a,I)P(H_a|I)}{P(I,E)}$
- $P(H_d|I,E)=\frac{P(E|H_d,I)P(H_d|I)}{P(I,E)}$
$\left(\frac{P(H_a|I,E)}{P(H_d|E,I)}\right)=\left(\frac{P(E|H_a,I)}{P(E|H_d,I)}\right)\left(\frac{P(H_a|I)}{P(H_d|I)}\right)$
$\left(\frac{P(H_a|I,E)}{P(H_d|E,I)}\right)_1=\left(\frac{P(E|H_a,I)}{P(E|H_d,I)}\right)_2\left(\frac{P(H_a|I)}{P(H_d|I)}\right)_3$
- 1: Radio/relación posterior
- 3: Radio/relación prior
- 2: Radio de likelihood (likelihood radio)
Interesantemente
- $P(H_a|E,I)=\frac{LR\times Prior}{1+LR\times Prior}$
Likelihood radio
- $LR=\frac{P(E|H_a,I)}{P(E|H_d,I)}$
Evidencia de la voz
- Fenómenos fonéticos o fonológicos cortos
- Fenómenos acústicos de la voz medianos
- Fenómenos acústicos de la voz largos
Distribuciones de probabilidad
Cierto aspecto de la voz la medimos y la representamos como una distribución de probabilidad
- Distribución de probabilidad del fenómeno en dubitativa
- Distribución de probabilidad del fenómeno en indubitada
- Distribución de probabilidad del fenómeno en referencia
Mismo problema
Caso uno
Caso dos
Caso tres
Caso cuatro
Un poco de más matemáticas
- $LR=\frac{\tau}{a\sigma}
e^{\left[-\frac{(x-y)^2}{2a^2\sigma^2}\right]}
e^{\left[-\frac{(w-\mu)^2}{2\tau^2}
+\frac{(z-\mu)^2}{2\tau^2}
\right]}
$
Rose, Phil. Forensic speaker identification. CRC Press, 2003.
$LR=\frac{\tau}{a\sigma}
e^{\left[-\frac{(x-y)^2}{2a^2\sigma^2}\right]}
e^{\left[-\frac{(w-\mu)^2}{2\tau^2}
+\frac{(z-\mu)^2}{\tau^2}
\right]}
$
- $x$: Media dubitativa
- $y$: Media indubitada
- $\mu$: Media referencia
- $\sigma$: Desviación estándar de dubitativa e indubitada
- $\tau$: Desviación estándar referencia
- $z=(x+y)/2$
- $w=(mx+ny)/(m+n)$
- $m$: número de dubitativas
- $n$: número de indubitada
- $a=\sqrt{\frac1m + \frac1n}$
Analizando dos características
Es posible tener dos fenómenos $LR_1$ y $LR_2$
Procedimiento ideal
- Escuchar dubitativa
- Diseñar indubitada
- Grabar indubitada
- Escoger referencia
- Escoger fenómenos con nuestra experiencia
- Analizar fonéticamente y fonológicamente grabaciones
- Calcular LR
Referencia
- Variado
- Medio similar
- Mismo género
- Mismo rango de edad
- Mismo origen
- Mismo nivel socio-económico