Guillermo Santamaría: Una metodología basada en Support Vector Machines para el pronóstico de la volatilidad en  Índices de Precios y Cotizaciones

En la actualidad, las bolsas de valores juegan un papel protagónico en las economías globales. En ellas miles de transacciones de compra y venta de diversos instrumentos bursátiles son hechas diariamente con la finalidad de obtener ganancias. Una de las variables más importantes para los modelos empleados por los inversionistas es la volatilidad. En esencia esta refleja el comportamiento de las fluctuaciones  de los precios de los activos, permitiendo realizar pronósticos de diferentes acciones así como medir el riesgo de los portafolios. Sin embargo la volatilidad no es directamente observable; más aún, no es constante, es dependiente del pasado y su distribución excede la normalidad gausiana. 

Existe un gran interés en incrementar la precisión de los métodos de pronóstico financieros ya que un pequeña mejora puede representar la diferencia entre la fortuna y la banca rota. Los primeros modelos consideraban la volatilidad como una constante de los datos (consideración que ha demostrado en más de una ocasión ser insuficiente). Posteriormente, en la decada de los ochentas métodos más sofisticados como los modelos autorregresivos de heteroscedasticidad condicional propuestos por Engle y generalizados por Bollerslev fueron propuestos. Éstos son considerados como el caballo de 
batalla en la industria financiera debido a su formulación intuitiva y su capacidad para explicar la volatilidad en diferentes series de tiempo bursátiles. Sin embargo entre las limitaciones más importantes de estos métodos se encuentra la estructura del modelo propuesto y otras suposiciones 
respecto al sistema como la distribución de las innovaciones. 

Otro tipo de enfoques los cuales no requieren información apriori respecto al sistema y su distribución son los métodos semi-paramétricos provenientes del área de aprendizaje supervisado. Estas técnicas son capaces de inferir y modelar relaciones no lineales utilizando únicamente una muestra de datos. Entre sus principales virtudes  se encuentra su  planteamiento como problema convexo, una formulación que  minimiza el error sobre la muestra tomando en cuenta la complejidad de la función regresora, así como el ruido en los datos. Más aún, SVM es capaz de lidiar con relaciones no lineales mediante el uso de funciones de similitud llamadas Kernels.

Sin embargo la aplicabilidad de SVM en el pronóstico de series de tiempo requiere del diseño de una metodología apropiada. Entre las principales áreas de oportunidad esta la selección de variables y sintonización de sus parámetros. Debido a que la naturaleza de las series financieras es altamente 
no-lineal, herramientas como la Reconstrucción del espacio de fase son atractivas para determinar el número de variables. Por otra parte, SVM es un algoritmo semi-paramétrico que requiere de la sintonización de sus parámetros con el fin de mejorar la calidad de la predicción así como incrementar 
la estabilidad del modelo obtenido. Usualmente ésto se lleva acabo mediante una búsqueda exhaustiva sin embargo el problema de sintonización de SVM es no lineal, más aún, este tipo de enfoque tiene un alto costo computacional. Las meta heurísticas como algoritmos genéticos (GA) tienen una alta efectividad para resolver problemas de optimización no lineales y son de bajo costo computacional. 

Es por ello que en este trabajo dos nuevos métodos basados en SVM, sintonización de parámetros mediante GA y selección de variables usando teoría del caos son propuestos:SVR_GBC y PSR-SVR_GBC. Se discuten los métodos y sus resultados respecto a un método clásico en el pronóstico de la volatilidad de dos índices  financieros latinoamericanos. 

Date: 
Tuesday, November 19, 2013 - 12:00 to 13:30