Análisis textual, datos sintéticos y LLMs: herramientas modernas para el análisis económico


I. Análisis de texto

En este post se responde a críticas de lectores que acusan a Nada es Gratis de haberse convertido “en una basura”. El autor hace un análisis de texto comparativo de artículos de 2012, 2016, 2020 y 2024 para demostrar que, lejos de perder rigor, el blog ha evolucionado hacia una mayor convergencia con estándares académicos, manteniendo seriedad y profesionalidad. Incluye el código para replicar el análisis.

II. Machine Learning para el análisis de Política Monetaria y Mercados Financieros

  • Parsing the pulse: decomposing macroeconomic sentiment with LLMs. Los indicadores macroeconómicos proporcionan señales cuantitativas que los economistas deben analizar e interpretar. Proponemos un enfoque inverso: analizar directamente las narrativas de prensa mediante Modelos de Lenguaje Largo (LLM) para recuperar los índices de sentimiento sobre el crecimiento y la inflación. Una ventaja clave de este enfoque basado en LLM es la capacidad de descomponer el sentimiento agregado en sus factores determinantes, lo que facilita la interpretación de la dinámica macroeconómica. Nuestros índices de sentimiento siguen de cerca sus contrapartes basadas en datos fidedignos, proporcionando una imagen precisa y casi en tiempo real de la macroeconomía. Sus componentes (demanda, oferta y fuerzas estructurales más profundas) son intuitivos y coherentes con estudios previos basados ​​en modelos. La incorporación de índices de sentimiento mejora el rendimiento de los modelos estadísticos simples para la predicción, al ofrecer información que no está disponible en los datos tradicionales.
  • Harnessing artificial intelligence for monitoring financial markets. Predecir la tensión en los mercados financieros ha demostrado ser un objetivo difícil de alcanzar desde hace tiempo. Los avances en inteligencia artificial y aprendizaje automático ofrecen nuevas posibilidades para abordar este problema, gracias a su capacidad para gestionar grandes conjuntos de datos y descubrir patrones no lineales ocultos. En este artículo, desarrollamos un nuevo enfoque basado en la combinación de una red neuronal recurrente (RNN) y un modelo de lenguaje extenso. Centrándonos en las desviaciones de la paridad de arbitraje triangular (TAP) en el par euro-yen, nuestra RNN genera pronósticos diarios interpretables de disfunción del mercado con 60 días hábiles de antelación. Para abordar las limitaciones de "caja negra" de las RNN, nuestro modelo asigna ponderaciones basadas en datos y variables en el tiempo a las variables de entrada, lo que hace transparente su proceso de decisión. Estas ponderaciones tienen un doble propósito. En primer lugar, su propia evolución proporciona señales tempranas de cambios latentes en la dinámica del mercado. En segundo lugar, cuando la red pronostica una mayor probabilidad de disfunción del mercado, estas ponderaciones específicas de cada variable ayudan a identificar variables de mercado relevantes que utilizamos para impulsar un LLM a buscar información relevante sobre posibles factores de tensión del mercado.

III. Datos Sintéticos

  • Intelligence at scale: Data monetization in the age of gen AI. Al aprovechar la inteligencia artificial de última generación, las empresas pueden pasar de la venta de datos a la creación de productos de datos sólidos que brinden inteligencia procesable y liberen valor previamente sin explotar.
  • How GenAI-Powered Synthetic Data Is Reshaping Investment Workflows. Este artículo explica cómo los datos sintéticos generados por modelos GenAI (inteligencia artificial generativa) están transformando los flujos de trabajo en inversiones — por ejemplo, simulando correlaciones de activos y mejorando modelos de sentimiento cuando los datos reales son escasos.

IV. Evaluación de LLM en tareas del mundo real

Measuring the performance of our models on real-world tasks. En este artículo se presenta GDPval, una nueva evaluación que mide el desempeño del modelo en tareas reales y económicamente valiosas en 44 ocupaciones.

Hasta aquí el post del día de hoy y recuerda que puedes seguirme en X y mantenerte informado de lo último de ciencia, tecnología e innovación en el mundo de la economía y las finanzas.

¡Hasta la próxima!

Comentarios

Entradas populares de este blog

¿Qué significan los números en el triángulo de reciclaje de los plásticos?

Las 10 economías más grandes de Asia

Historia de la Banca en México III: La privatización de la banca