Proyectos

Proyectos en los que miembros del departamento participan.
  • +
    Aprendizaje Computacional y Generalización Humana

    Entender las bases computacionales del aprendizaje y la generalización humana. En particular entender cómo construimos los humanos nuestros modelos mentales del mundo (Castañón et al., 2019), y qué procesos rigen la capacidad de utilizar modelos adquiridos previamente (o partes de esos modelos) para transferirlos a un nuevo contexto y así acelerar el proceso de aprendizaje en el nuevo contexto (Castañón et al., 2021).

    El primer aspecto que tiene que ver con el tipo de inferencias que hacen los humanos en situaciones de escasez extrema de datos (Chomsky, 1957): las inferencias que hacen los humanos balancean dos procesos: i) uno que descarta hipótesis rápidamente asociado al principio de mínima entropía (Brand, 1999), mostrando un sesgo de las personas en pensar que el mundo es casi determinístico, ii) otro proceso que crea explicaciones generales que van más allá de los datos relacionado al principio de máxima entropía (Jaynes, 1982).

     El segundo aspecto es la construcción gradual de modelos mentales complejos. Los humanos somos capaces de entretener conceptos (o modelos mentales) muy complejos (Lake et al., 2015; Lake et al., 2017). Intuitivamente, podemos ver que esta capacidad de adquirir conceptos complejos requiere que nuevos conocimientos (conceptos simples) se vayan incorporando a estructuras de conocimiento preexistentes, formando incrementalmente estructuras de conocimiento más complejas. Haciendo uso de herramientas de teoría de gráficas y ecuaciones de agentes replicantes (Czégel et al., 2019), se pretende generar una explicación computacional de qué estructuras de conocimiento facilitan la incorporación de nuevos conceptos y en qué casos pueden funcionar como barreras a la adquisición de nuevo conocimiento (ej., algunas teorías de conspiración están basadas en “fortalezas” de conocimiento falso en la mente de una persona que resultan difíciles de cambiar).

    Sept. 1, 2022
  • Voz, traducción y texto

    Experimentos con voz, traducción y clasificación de textos
    Con apoyo de Plataforma de Aprendizaje Profundo para Tecnogías del Lenguaje, INAOE. (id. PAPTL 01-008).

    Jan. 6, 2020
  • +
    Análisis de Escenas Auditivas

    La escucha humana es una habilidad del cual se tiene mucho interés a emular, ya que puede beneficiar al desarrollo de teléfonos móviles, de casas inteligentes, de robots de servicios, de dispositivos de ayuda auditivas, de bioacústica, etc. Una manera simplificada de analizar la escucha humana es dividirlo en tres grandes áreas: localizar, separar y clasificar las fuentes sonoras en el ambiente. Dicha información es lo que conforma a la escena auditiva:

    Localización: esto involucra ubicar en el espacio físico a las fuentes sonoras, a partir de los datos de audio capturados con un arreglo de micrófonos con una geometría conocida. Esta localización normalmente se reduce a estimar la dirección de arribo en el plano horizontal de dichas fuentes, pero también es de interés estimar la dirección vertical y distancia de éstas.

    Separación: dado la propagación física de las ondas mecánicas proviniendo de las fuentes sonoras en conjunto, lo capturado en el arreglo de micrófonos resulta en una mezcla aditiva de dichas ondas. Esto hace dificultoso los pasos subsecuentes de reconocimiento y clasificación, ya que la gran mayoría asumen ser alimentadas la información de audio de sólo una fuente sonora. Para aliviar esto, se puede separar en línea a la fuente de interés (a partir de su dirección de arribo) y el resto de las interferencias se remueven de la mezcla.

    Clasificación: es de interés identificar cuál persona es la que está hablando. Desafortunadamente, los sistemas actuales de identificación requieren re-entrenarse cuando hay una nueva persona a identificar. Es de interés tener sistemas más responsivos a estas circunstancias, y que puedan identificar entre tipo de fuentes.

    Este proyecto ha sido apoyado por CONACYT 251319, UC MEXUS-CONACYT CN-17-154 y PAPIIT IA100120. Es actualmente apoyado por PAPIIT IA100222.

    Jan. 3, 2018
  • +
    Golem

    Se integran las tecnologías de reconocimiento de voz en español y de sistemas conversacionales en una plataforma de robótica móvil: el robot Golem. Este robot es capaz de fungir como guía de una sesión de carteles de los proyectos de investigación del Departamento de Ciencias de la Computación del IIMAS; para este efecto es capaz de sostener una conversación sencilla en la que se desplaza al cartel que se le indica y hace la explicación correspondiente en español hablado, con apoyos multimodales como textos, imágenes y videos. Actualmente se trabaja en extender sus habilidades lingüisticas así como en dotar al robot de capacidades de visión monocular y binocular (reconocimiento de objetos, de gestos y navegación con evasión de obstáculos) coordinadas con la conducta lingüistica a lo largo de la conversación.

    July 15, 2010