Diseño y Construcción de Robots de Servicio

Se integran soluciones de varias líneas de investigación (enlistadas más adelante), en un esfuerzo transdisciplinario, para el desarrollo de robots de servicio. Se han producido varias iteraciones de robots de servicio, dentro de los cuales destacan: Golem, el Módulo de Adivina la Carta (actualmente residiendo en el Museo Universum) y Golem-II+. Éste último ha tenido una trayectoria meteórica en competencias internacionales y nacionales en la liga de RoboCup@Home, la cual es un buen marco de evaluación para los productos desarrollados en el laboratorio.

Se investigan los siguientes temas:

Para más información, favor de dirigirse al sitio del Grupo Golem.

      

Proyectos Precursores:

The DIME Project

El Proyecto DIME: Diálogos Inteligentes Multimodales en Español

Se desarrollan modelos para la representación e interpretación de locuciones que ocurren en diálogos orientados hacia la solución de tareas simples entre un ser humano y un agente computacional, los llamados diálogos prácticos. En particular, se investiga el diseño e implementación de esquemas conversacionales, llamados "modelos de diálogos", así como sus sistemas intérpretes (i.e. "manejadores o sistemas de administración de diálogo). Estos modelos se utilizan actualmente en el robot Golem, el cual es capaz de sostener una conversación simple con un usuario humano. En este proyecto se creo el esquema DIME-DAMSL para el análisis de diálogos prácticos y se estudia la construcción de un sistema de administración de diálogos que siga los lineamientos de este esquema. Asimismo, se estudia la relación entre la entonación y las intenciones o tipos de actos del habla. La base empírica de esta invertigación es el Corpus DIME, recopilando también en el contexto del proyecto.
Speech Recognition in Spanish

Reconocimiento de Voz en Español

Se desarrolla una plataforma para la creación de sistemas de reconocimiento de voz enfocados principalmente al dialecto mexicano.Esta plataforma se basa en el Corpus DIMEx100, el cual consiste en una base de datos de oraciones habladas con su respectivo análisis fonético. Este corpus fue diseñado, recopilado y analizado en el contexto del proyecto y se utiliza para la creación de los modelos acústicos y los diccionarios de pronunciación utilizados por los sistemas de reconocimiento. El recurso es también útil para la realización de estudios de fonética computacional. Para la tecnología computacional propiamente se utiliza el sistema Sphinx. Los sistemas de reconocimiento de voz desarrollados en esta sublínea se utilizan en el robot Golem.
Diagrammatic Reasoning

Razonamiento Diagramático

Se investiga la representación del conocimiento geométrico a través de diagramas y prueba de teoremas geométricos, así como la síntesis y prueba de teoremas aritméticos que tienen unas representaciones diagramáticas. Se desarrollan lenguajes de representación e intérpretes para la representación de este conocimiento, así como programas de inteligencia artificial para modelar el proceso de síntesis y prueba de esta clase de conceptos. En esta sublínea se desarrolla el Proyecto Pitágoras.
raz
The Robot Golem

El Proyecto Golem

Se integran las tecnologías de reconocimiento de voz en español y de sistemas conversacionales en una plataforma de robótica móvil: el robot Golem. Este robot es capaz de fungir como guía de una sesión de carteles de los proyectos de investigación del Departamento de Ciencias de la Computación del IIMAS; para este efecto es capaz de sostener una conversación sencilla en la que se desplaza al cartel que se le indica y hace la explicación correspondiente en español hablado, con apoyos multimodales como textos, imágenes y videos. Actualmente se trabaja en extender sus habilidades lingüisticas así como en dotar al robot de capacidades de visión monocular y binocular (reconocimiento de objetos, de gestos y navegación con evasión de obstáculos) coordinadas con la conducta lingüistica a lo largo de la conversación.