Untitled Document

PROCESO DE TRANSCRIPCIÓN

De manera general, la transcripción del audio en el nivel de alófonos consiste en reconocer y delimitar cada sonido de la oración emitida, por medio de la asignación de etiquetas que representan a los alófonos. Para la transcripción de las representaciones fonéticas se utilizóó el alfabeto fonético Mexbet (Uraga y Pineda, 2002; y Cuétara, 2004)

La herramienta que se utilizo para el proceso de etiquetación fue el SpeechView. Dicho programa se encuentra dentro del conjunto de herramientas de análisis de habla del CSLU-OGI (Center for Spoken Language Understanding Oregon Graduate Institute of Science and Technology).

El SpeechView es una herramienta de análisis de habla, la cual proporciona un espectrograma y un oscilograma del audio, y un espacio de etiquetas, lo que permite llevar a cabo la transcripción fonética de una manera más exacta, ya que se tiene el apoyo visual y auditivo del alófono.

SpeechView

Proceso de etiquetación

Descripción de la barra de trabajo del SpeechView.

Botón para abrir el audio
Botones para abrir los diferentes espectrogramas
Botón de barra de etiquetas
Botón de etiquetas ya hechas
Botones de audio

A continuación se muestra el proceso de etiquetación por medio de dicha herramienta.

Abrir el archivo de audio (Botón 1), con el cual también aparecerá el oscilograma.

Abrimos el espectrograma que muestra los formantes (Botón 2)

Abrimos espacio de etiquetas (Botón 3)

En el espacio de etiquetas se insertan barras de tiempo que corresponden a la duración de la emisión del alófono. Una vez identificado el alófono se le asigna su representación (Mexbet) que describe sus rasgos fonéticos.

Las etiquetas se guardan haciendo click con el botón derecho del Mouse, dentro de la misma etiqueta. Al replegarse el menú seleccionar el comando “Save this label set as”.