Con el uso generalizado de tecnologías digitales, la proliferación de dispositivos ubicuos de bajo costo, la amplia conectividad a Internet, los servicios en línea y las redes sociales, enormes cantidades de datos son generados a todo momento. Estos datos pueden ser de gran utilidad para la planeación, toma de decisiones, diagnóstico, prevención, análisis y predicción de diversos problemas. Sin embargo, muchos métodos de minería de datos y aprendizaje automático no son escalables debido a que requieren intervención humana o algoritmos uso. En esta línea de investigación se exploran algoritmos y estructuras de datos escalables para el descubrimiento y reconocimiento de patrones en colecciones masivas de datos.