Se puede sistematizar la interpretación de cientos de noticias para predecir bolsa peruana
Asignando un valor numérico a las noticias, por ejemplo un score de sentimiento, permite incorporar esa información a un modelo predictivo con Machine Learning.
Los inversionistas retail pierden dinero porque aplican estrategias de mercados desarrollados (buy and hold) en un mercado lateral y volátil como Perú.
Esta solución propone no invertir a largo plazo (buy and hold) sino invertir con ajustando el timing de cada oportunidad de compra y venta, además apoyado en el texto de noticias relevantes.
Los algoritmos preentrenados de LLM, en especial los basados en Transformers, permiten inferir un score de sentimiento de manera rápida y precisa. Se recomienda FinBert, pre-entrenado con informes financieros publicados en la SEC hasta 2017.
Antes de correr el algoritmo de entrenamiento de ML, se debe prefiltrar la serie de tiempo, con el objetivo de eliminar ruido y reducir desbalance de clases (evitar que modelo haga predicciones cuando no se observarían movimientos en la bolsa).
Asimismo, la variable objetivo Y, el movimiento de la bolsa peruana de los próximos días, debe estructurarse con un horizonte dinámico y no fijo, con esto se le da suficiente tiempo al precio a cumplir una meta de ganancias o límite de pérdidas, simulando un entorno real de inversión.
Por último, debe separarse el entrenamiento de ML en dos bloques, entrenar los días al alza (cusum positivo), separado de los días a la baja (cusum negativo). Con esto el algoritmo de Machine Learning se especializa en cada tipo de movimiento de la bolsa.