Identificación de hablante

¡Aquella voz en la oscuridad era tuya! (Rosana, Cyrano de Bergerac) — Edmond Rostand





Ivan Meza

Las piezas

  • Sonido
  • Voz
  • Aparato fonador
  • Comunicación
  • Fonética y fonología
  • Gran incertidumbre
  • Modelo probabilístico y estadístico

Sonido








  • Perturbación de la presión en el aire

La voz

  • Perturbaciones en el aire producidas por el humano

Aparato fonador

  • La voz la producimos con nuestro aparato fonador

Comunicación

  • En pricipio la voz es un vehículo para la comunicación

Fonología y fonética

  • Estás realizaciones comunicativas han sido estudiadas por la fonética y fonología

Incertidumbre

  • Sin embargo existe una gran incertidumbre en los fenómenos y el sonido












Probabilidad y estadística

  • Nos permiten hablar de los fenómenos aún cuando sean inciertos

Hipothesis

La voz depende de la fisonomía del aparato fonador del hablante, de tal forma que la voz identifica al hablante

Criterio biológico

$Y$ en el tiempo $t_2$ comparte la identidad con $X$ en $t_1$ si y sólo si $X$ es un organismo biológico continuo con $Y$




Shoemaker, David,(2014) The Biological Criterion, The Stanford Encyclopedia of Philosophy (Spring 2014 Edition), Edward N. Zalta (ed.)

Criterio biológico*: aparato fonador

  • $Y$ en el tiempo $t_2$ comparte la identidad con $X$ en $t_1$ si y sólo si el aparato fonador de $X$ es un continuo con el de $Y$

¿Cómo demostrar que el aparato fonador es el mismo/continuo?

Asumimos nuestra hipótesis

  • Identidad de voz representa identidad de aparato fonador ...
  • ... y por lo tanto la identidad de la persona

En el marco legal

  • Existe un conflicto entre partes
  • Parte del conflicto es una grabación y la identidad una o varias voces
  • Responsabilidad moral

Partes en un juicio

  • Principales: acusador, órgano de la jurisdicción, acusado y su defensa,
  • Eventuales: coadyuvante
  • Necesarios: testigos, peritos, interpretes, órganos de representación (ejem. padres)
  • Auxiliares: investigadores, policía, personal del sistema jurídico


Luna, Jose,(2014) LAS PARTES Y OTRAS PECULIARIDADES DEL SISTEMA PROCESAL PENAL ACUSATORIO MEXICANO EN SU PROCESO DE CONFORMACIÓN,Suprema Corte de Justicia

Escenario uno

Acusado, apoyado por su defensa: No soy el de la grabación

Escenario dos

Acusado, apoyado por su defensa: Soy el de la grabación

Una grabación escenario uno

  • Parte acusadora, dice: es su voz en la grabación
  • El acusado dice: no es mi voz en la grabación

Evidencia

Inicialmente

  • La grabación de voz en cuestión

Evidencia a analizar

  • La grabación de voz en cuestión
  • Grabación de voz del acusado
  • Grabaciones de voz de la población

Terminología

  • La grabación de voz en cuestión: dubitativa
  • Grabación de voz del acusado: indubitada
  • Grabaciones de voz de la población: referencia

Paradoja

  • Parte acusadora, dice: el acusado comparte identidad con el de la grabación
  • La defensa dice: no comparto identidad con el de la grabación

Dos hipótesis

  • $H_a$: Es él en la grabación dubitativa
  • $H_d$: No es él en la grabación dubitativa

¿Quién está en lo correcto?

  • Como fonetistas-fonólogos forenses nuestra posición es de escepticismo

Objetivo

  • Analizar la evidencia para establecer una relación entre ambas hipótesis
  • Con estadística podemos hablar de cosas que son y no son al mismo tiempo

Primera aproximación

Es muy tentativo

  • $P(H_a|I)$

Donde, $I$ es la información del caso

No es una posición muy escéptica

  • $P(H_a|I,E)$
  • Donde $E$ representa la evidencia fonética-fonológica

Todavía no es suficiente...

Segunda aproximación

  • $P(H_a|I,E)$
  • $P(H_d|I,E)$

Terminología

  • $P(H_a|I,E)$: Similaridad
  • $P(H_d|I,E)$: Tipicidad

Teorema de Bayes

Teorema de Bayes

$P(C|E)=\frac{P(E|C)P(C)}{P(E)}$

  • C: Causa
  • E: Evidencia

Dándole la vuelta al calcetín

Versión del acusado

  • $P(H_a|I,E)=\frac{P(E|H_a,I)P(H_a|I)}{P(I,E)}$

Dándole la vuelta al calcetína

Versión de la defensa

  • $P(H_d|I,E)=\frac{P(E|H_d,I)P(H_d|I)}{P(I,E)}$

Radio

Pero tenemos dos hipótesis...

  • $R=\frac{P(H_a|E,I)}{P(H_d|E,I)}$
  • $P(H_a|I,E)=\frac{P(E|H_a,I)P(H_a|I)}{P(I,E)}$
  • $P(H_d|I,E)=\frac{P(E|H_d,I)P(H_d|I)}{P(I,E)}$

$\left(\frac{P(H_a|I,E)}{P(H_d|E,I)}\right)=\left(\frac{P(E|H_a,I)}{P(E|H_d,I)}\right)\left(\frac{P(H_a|I)}{P(H_d|I)}\right)$

$\left(\frac{P(H_a|I,E)}{P(H_d|E,I)}\right)_1=\left(\frac{P(E|H_a,I)}{P(E|H_d,I)}\right)_2\left(\frac{P(H_a|I)}{P(H_d|I)}\right)_3$

  • 1: Radio/relación posterior
  • 3: Radio/relación prior
  • 2: Radio de likelihood (likelihood radio)

Interesantemente

  • $P(H_a|E,I)=\frac{LR\times Prior}{1+LR\times Prior}$

Likelihood radio

  • $LR=\frac{P(E|H_a,I)}{P(E|H_d,I)}$

Evidencia de la voz

  • Fenómenos fonéticos o fonológicos cortos
  • Fenómenos acústicos de la voz medianos
  • Fenómenos acústicos de la voz largos

Distribuciones de probabilidad

Cierto aspecto de la voz la medimos y la representamos como una distribución de probabilidad

  • Distribución de probabilidad del fenómeno en dubitativa
  • Distribución de probabilidad del fenómeno en indubitada
  • Distribución de probabilidad del fenómeno en referencia

Mismo problema

Caso uno

Caso dos

Caso tres

Caso cuatro

Un poco de más matemáticas

  • $LR=\frac{\tau}{a\sigma} e^{\left[-\frac{(x-y)^2}{2a^2\sigma^2}\right]} e^{\left[-\frac{(w-\mu)^2}{2\tau^2} +\frac{(z-\mu)^2}{2\tau^2} \right]} $

Rose, Phil. Forensic speaker identification. CRC Press, 2003.

$LR=\frac{\tau}{a\sigma} e^{\left[-\frac{(x-y)^2}{2a^2\sigma^2}\right]} e^{\left[-\frac{(w-\mu)^2}{2\tau^2} +\frac{(z-\mu)^2}{\tau^2} \right]} $

  • $x$: Media dubitativa
  • $y$: Media indubitada
  • $\mu$: Media referencia
  • $\sigma$: Desviación estándar de dubitativa e indubitada
  • $\tau$: Desviación estándar referencia
  • $z=(x+y)/2$
  • $w=(mx+ny)/(m+n)$
  • $m$: número de dubitativas
  • $n$: número de indubitada
  • $a=\sqrt{\frac1m + \frac1n}$

Analizando dos características

Es posible tener dos fenómenos $LR_1$ y $LR_2$

  • $LR=LR_1 \times LR_2$

Procedimiento ideal

  • Escuchar dubitativa
  • Diseñar indubitada
  • Grabar indubitada
  • Escoger referencia
  • Escoger fenómenos con nuestra experiencia
  • Analizar fonéticamente y fonológicamente grabaciones
  • Calcular LR

Referencia

  • Variado
  • Medio similar
  • Mismo género
  • Mismo rango de edad
  • Mismo origen
  • Mismo nivel socio-económico
Licencia de Creative Commons
Identificación de hablante by Ivan V. Meza Ruiz is licensed under a Creative Commons Reconocimiento 4.0 Internacional License.
Creado a partir de la obra en http://turing.iimas.unam.mx/~ivanvladimir/slides/fonologia_forense/identification.html.