Entradas

Mostrando las entradas etiquetadas como Machine Learning

De visual analytics a modelos generativos: Recursos clave para la economía basada en datos

Imagen
En un mundo impulsado por los datos y la inteligencia artificial, las herramientas de visualización, el aprendizaje automático y el aprendizaje profundo están transformando industrias enteras. En este post, exploraremos recursos clave y lecturas recomendadas que abarcan desde cómo aprovechar al máximo Tableau en el análisis visual hasta aplicaciones de aprendizaje profundo que revolucionan la economía cuantitativa. Estas recomendaciones te guiarán para potenciar tus habilidades en análisis de datos, investigación económica y mucho más. I. Visual Analytics Deje que Tableau escriba su SQL por usted : aprende sobre relaciones y relaciones de múltiples hechos en Tableau . Su guía sobre las extensiones de Viz de Tableau : aprende cómo comenzar a utilizar las extensiones de Viz y profundiza en las 36 extensiones disponibles en Tableau Exchange . Dashboards del BCBS : Los dashboards permiten ahora visualizar de forma interactiva los resultados de los riesgos crediticios, de mercado, oper...

La ciencia de datos en economía y finanzas

Imagen
¿Qué significa hacer ciencia social empírica? Para muchos de nosotros, la mayor parte del tiempo, lo que significa es escribir y depurar código. ( Gentzkow y Shapiro, 2014 ) Sin duda alguna, la ciencia de datos es un campo interdisciplinario entre la economía, la estadística y la tecnología . Para algunos,  la economía es un campo de la ingeniería de software , y si no lo creen así, está claro que, al menos, la economía debería de adoptar más normas y buenas prácticas de la ingeniería de software. Reproducibilidad del código Justo el año pasado, les comentaba que había tomado un curso de actualización sobre "Investigación Reproducible" del Departamento de Evaluación de Impacto en el Desarrollo (DIME) del Banco Mundial, este curso no es otra cosa que normas y buenas prácticas en nuestros códigos y scripts, que permitan compartir y reproducir nuestros resultados, es decir, ciencia abierta basada en datos y código. Aquí les dejo un excelente artículo de LSE Impact Blog sobre ...

Explorando la transformación de la Inteligencia Artificial: Avances, desafíos y perspectivas futuras en medicina, negocios y aprendizaje automático

Imagen
Con el lanzamiento de ChatGPT el 30 de noviembre de 2022, este evento atraería la atención, en general, sobre la Inteligencia Artificial (IA) y, en particular, sobre los modelos de lenguaje de gran tamaño (LLM) y la IA generativa. Nos encontramos en 2024 y vale la pena evaluar el camino recorrido de la IA aplicada, y mi primera recomendación sería el artículo "Poniendo en perspectiva la inteligencia artificial médica" , el cual analiza el potencial y los desafíos de la inteligencia artificial (IA) en el ámbito de la salud. Explora cómo estas tecnologías pueden mejorar el diagnóstico, tratamiento y seguimiento de los pacientes, pero también señala las limitaciones actuales, como la necesidad de datos de alta calidad y la dificultad de interpretar algunas decisiones de la IA. Además, discute los aspectos éticos y regulatorios involucrados en su implementación. Puedes leer el artículo completo aquí . Por otra parte, el artículo "A data leader’s operating guide to scaling ge...

Recommended readings: Dashboards and metrics, DL with TensorFlow, PostgreSQL, Sentiment Analysis, Digital Nomad Visas

Imagen
Welcome, tech enthusiasts! This post dives into a range of exciting topics to fuel your learning and exploration. Whether you're embarking on a cloud migration journey, eager to build your first deep learning model, or curious about the latest trends in digital nomadism, we've got you covered. We'll unpack the essential dashboards and metrics for successful cloud transformations, guide you through the creation of a deep learning model using TensorFlow, and explore the power of callbacks like EarlyStopping and LiveLossPlot. We'll also unveil the hidden villain lurking within Java file operations and the PostgreSQL CopyManager API, and unveil how text analysis can predict industrial production. Finally, for the aspiring digital nomad, we've got a handy chart showcasing countries offering visas that cater to your remote work lifestyle. So, buckle up and get ready to dive into the ever-evolving world of technology! Ending the confusion in cloud transformations: The das...

Level Up Your Machine Learning Skills: 5 Must-Watch Lectures

Imagen
Machine learning (ML) is revolutionizing various fields, but it's true power lies in its ability to scale. This curated list of lectures dives deep into specific, yet valuable, areas within ML, equipping you with the knowledge to tackle complex challenges. Whether you're a seasoned data scientist or just starting your ML journey, these lectures offer something for everyone. From practical tools for anomaly detection to the ethical considerations of predicting police misconduct, you'll gain insights and techniques to elevate your skillset. 1. MLOps so AI can scale.   Most of the failures in ML development come not from developing poor models but from poor productization practices ( McKinsey ). 2. How to Detect the Trend in the Time Series Data and Detrend in Python ( Regenerative ). 3. Predicting Police Misconduct:   Whether police misconduct can be prevented depends partly on whether it can be predicted. We show police misconduct is partially predictable and that estimate...

Lecturas recomendadas en temáticas de vanguardia en el campo de la IA

Imagen
En este post, te compartiré algunas lecturas recomendadas en diversas temáticas de vanguardia en el campo de la IA. Nos preguntaremos si debemos evaluar más los algoritmos que utilizamos a diario ( Development Impact ). Aprenderás los pasos básicos para desarrollar tu propia red neuronal con PyTorch ( Regenerative ). Nabeel discute el potencial de los datos sintéticos como clave para la Inteligencia Artificial General ( Digital Spirits ).  También veremos cómo incorporar información de sensores remotos en evaluaciones aleatorias ( J-PAL ).  Para los interesados en finanzas, analizaremos la predicción de riesgo crediticio para pequeñas y medianas empresas utilizando datos de empresas adyacentes y una red de atención gráfica relacional ( Journal of Management Science and Engineering ). ¿Te intriga la posibilidad de una IA que juegue ajedrez a nivel de Gran Maestro sin necesidad de búsqueda? Averígualo aquí:  arXiv . Y para finalizar, te recomendamos un libro clave sobre ap...

Construye tu futuro en ciencia de datos: domina la reproducibilidad, explora recursos y descubre aplicaciones prácticas

Imagen
Reproducibilidad Retomando la discusión sobre la importancia de la reproducibilidad del código publicada en un post anterior . Les cuento que en 2019, la revista Management Science introdujo una política que exige a los autores que pongan a disposición sus materiales de estudio. Aprovechando esto como una oportunidad, un grupo de investigadores se dio a la tarea de evaluar el impacto de la política y el estado de la reproducibilidad de los estudios. Los autores señalan que la reproducibilidad es una característica esencial de los resultados de investigación confiables, pero no puede garantizar la replicabilidad ( LSE Impact Blog ). Recursos para aprender ciencia de datos Paul Goldsmith-Pinkham (profesor en la Escuela de Administración de Yale) comparte notas de conferencias escritas para su curso de doctorado sobre métodos empíricos aplicados. También diapositivas, preguntas de exámenes y más ( GitHub ). Árboles de decisión en python con sklearn ( Regenerative ). Graficar redes neuron...

Cómo triunfar como científico de datos: los recursos que necesitas

Imagen
Hoy en día existe mucha confusión entre el rol del analista de datos, el científico de datos y el ingeniero de datos, esto se debe fundamentalmente que muchas habilidades y competencias de estos roles se pisan entre sí. No obstante, el título de "científico" tiene algo que no tienen los otros, justamente esa capacidad de utilizar el método científico para aportar verdadero valor a las organizaciones y generar impacto. En el post del día de hoy, les traigo una serie de recursos para fortalecer el bagaje de profesionales de la ciencia de datos. El modelo es importante, pero los supuestos lo son más  La primera recomendación, es un artículo publicado por el CFA Institute (referente en el mundo de las finanzas) que hace una critica constructiva a los profesionales que se casan con las simulaciones de Monte Carlo para realizar sus pronósticos de rendimientos futuros. La recomendación: la importancia de los supuestos y considerar en sus escenarios aquellos eventos inesperados. Má...

¡De investigaciones complejas a dashboards para todos! Un viaje por el apasionante mundo de los datos

Imagen
¿Alguna vez te ha fascinado un descubrimiento científico pero te atemorizaron las ecuaciones o la jerga especializada? ¿Has deseado comprender la salud de la economía con claridad, sin perderte en un mar de estadísticas? ¿Te intriga el potencial de la inteligencia artificial para explorar fronteras matemáticas desconocidas? En este blog, abrimos las puertas a un mundo donde la complejidad se transforma en conocimiento accesible. Aquí, los datos dejan de ser números fríos y se convierten en historias vívidas que cualquiera puede comprender. Te invito a navegar en las siguientes lecturas que te ayudarán a seguir desarrollando tus conocimientos y habilidades en el mundo de los datos. Para los principiantes, Este curso desmitificará y explicará el tema del Machine Learning. En tan solo unas horas podrás comprender los conceptos y los procesos detrás de esta tecnología revolucionaria:  A Quick Introduction to Machine Learning . Para los que ya tienen más experiencia:  Anomaly ...

Artículos recomendados para científicos de datos: DataViz, aprendizaje automático, NLP, aprendizaje profundo

Imagen
1. ¿Qué hace que los datos ambientales sean útiles? Las mejoras en la tecnología y el procesamiento de datos ahora permiten que los individuos controlen los efectos de la contaminación del aire. Sin embargo, esta singularización radical plantea desafíos para una acción comunitaria de base amplia ( Impact of Social Sciences ). 2. Cómo detectar gráficos engañosos (checklist) Explora una lista de verificación (c hecklist ) completa para detectar gráficos engañosos, lo que permite una toma de decisiones informada y segura basada en: la fuente, el tipo de gráfico, los ejes y el mensaje ( Tableau Blog ). 3. Desigualdad de oportunidades educativas: Medición y resultados empíricos En este artículo se muestra que las técnicas de ML pueden superar a este enfoque tradicional en la estimación de la desigualdad de oportunidades (DOp) en el ámbito educativo. En particular, los autores encontraron que los métodos de ML proporcionan estimaciones de la DOp más altas, lo que sugiere que estos ...

Artículos recomendados sobre la gestión de riesgos climáticos

Imagen
El día de hoy, les traigo a colación una serie de artículos que tienen que ver con el riesgo climático desde diversas perspectivas. 1. Progreso en los objetivos de energía renovable para 2030 La Agencia Internacional de Energía afirma que la capacidad global instalada de energía renovable debe triplicarse para 2030 para limitar el calentamiento global a 1,5°C por encima de los niveles preindustriales. Esto hace que los próximos seis años sean críticos en la lucha climática. Actualmente, China se destaca como la única nación en camino de cumplir su objetivo para 2030. En 2022, no solo cumplió sino que superó significativamente las adiciones de capacidad requeridas para mantener el rumbo, agregando el 168% de los 101 GW requeridos. Echemos ahora un vistazo más de cerca a cómo les está yendo a cada uno de estos países, comparando cuánta capacidad eólica y solar necesitaban agregar con la que realmente hicieron en 2022. En general, Estados Unidos y la India fueron los que más se alejaron d...

Artículos recomendados para científicos de datos: DataViz, SVM, Pytorch, análisis de sentimiento

Imagen
Como es costumbre en este blog, esta semana toca compartirles una serie de artículos que serán de utilidad para tanto principiantes como practicantes de data science. I. Para los que inician su carrera de análisis de datos Para los nuevos, aquí les dejo un artículo con consejos para ser contratado como analista de datos, crear un portafolio de visualización de datos gratuito, conectarse con otros entusiastas de los datos, conseguir el trabajo de visualización de datos y más:  7 Ways to Stand Out and Secure Your Next Data Analytics Role ( Tableau ). El siguiente artículo es para aquellos que les gusta leer, aprender y encontrar inspiración para sus proyectos:  How mathematics built the modern world ( Work in Progress ). II. Análisis visual A continuación, les comparto una "infografía" sobre la recaudación en taquilla de las películas del Universo Cinematográfico de Marvel (MCU por sus siglas en inglés). Me gusta esta visualización, ya que combina dos objetos visuales (un gr...

Recursos para científicos de datos (Python, R y Tableau)

Imagen
Desde hace algunos años me dedico a la consultoría de ciencia de datos y capacito a las organizaciones en análisis de datos e inteligencia de negocios para una mejor toma de decisiones. Por lo cual, doy fe que cada día las empresas son más conscientes que tienen que actualizarse y empezar la transformación digital a un modelo más orientado al aprovechamiento de los datos. La siguiente figura es resultado de un estudio reciente que demuestra que trabajar con IA vale la pena, ya que el valor de las habilidades de IA (aumentan los salarios de los trabajadores en un 21%) es significativamente mayor que el de las habilidades promedio (Gráfico A1). Mientras que, al examinar el valor de las habilidades de IA individualmente (Gráfico B), se observa que las habilidades relacionadas con el aprendizaje automático, es decir, ML (40%), Tensor Flow (38%), Deep Learning (27%), PNL (19%), son más valiosas que las habilidades en análisis de datos (14%) y ciencia de datos (17%), seguidas de los lenguaje...

Recursos para ciencia de datos en modelos de TensorFlow y series temporales

Imagen
En el post de esta semana, les comparto una serie de artículos para los entusiastas de la ciencia de datos, interesados en modelos de TensorFlow y series temporales. Primeramente, les dejo una lista con una serie de artículos publicados en el blog Regenerative, para poner en práctica diversos modelos de TensorFlow: Basic Building Blocks of TensorFlow: Basic Operations with Tensors Introduction to GradientTape in TensorFlow TensorFlow Model Training Using GradientTape Using a Keras Tuner for Hyperparameter Tuning of a TensorFlow Model Implementation of a Siamese Network in Keras and TensorFlow Últimamente, TensorFlow está publicando los resultados de algunas colaboraciones con otras empresas del sector IT. El caso más reciente es una colaboración con Spotify, la cual se resume en el siguiente post, que lo encuentro muy recomendable para los equipos de ciencia de datos, cuando necesitan difundir y diseminar los resultados de colaboraciones como lo que está haciendo TensorFlow de Google:...

Data Science Assorted Links

Imagen
Map, Filter, and CombinePerKey Transforms in Writing Apache Beam Pipelines with Examples ( Regenerative ). Pre-processing temporal data made easier with TensorFlow Decision Forests and Temporian ( TensorFlow Blog ). gingado: a machine learning library focused on economics and finance ( BIS ). The Benefits of Using Economically Meaningful Factors in Financial Data Science ( Enterprising Investor ). How to Build a Data Community Within Your Organization ( Tableau ).

Artículos recomendados para científicos de datos

Imagen
En la visualización que abre el post del día de hoy, destaca como el nivel del poder adquisitivo del salario mínimo federal en los Estados Unidos está en su punto más bajo desde diciembre de 1949. Como buena práctica el autor nos comparte los datos y el código que utilizó para crear la figura. En este post de Google nos explica cómo v isualizar e interpretar los árboles de decisión con TensorFlow. En el blog de Tryolabs, nos enseñan en dos entregas cómo elaborar estrategias de precios. En la primera parte , nos introducen a su simulador de mercado. En la segunda parte , nos muestran la e xploración de escenarios de mercado complejos. Finalmente,  ¿Qué hacer con las tendencias paralelas cuando sólo se dispone de datos de referencia? Hasta aquí el post del día de hoy y recuerda que puedes seguirme en Twitter y mantenerte informado de lo último de ciencia, tecnología e innovación en el mundo de la economía y las finanzas. ¡Hasta la próxima!

Artículos recomendados para extender tu expertise en ciencia de datos

Imagen
Esta semana les traigo una serie de artículos para los entusiastas de la ciencia de datos. Este listado de recursos van desde lo más sencillo de implementar hasta aquellas cuestiones que serán de interés para aquellos con mayor conocimiento o experiencia: Artículo que incluye base de datos, la cual permite descargar series temporales de tasas de pérdida de créditos:  Insights into credit loss rates: a global database ( BIS ). Análisis de datos realizado con Tableau, en el cual se discuten las distintas lecturas de la tasa de actividad , bien desde la evolución temporal o en relación a la brecha de género ( Nada es Gratis ). Para los entusiastas de R, Vincent Arel-Bundock analizó 19.000 scripts de R en el Dataverse para ver qué paquetes de R son los más utilizados por los científicos . Para los interesados en mejorar su expertise en series temporales:  Desorden y predicción en series trimestrales ( Nada es Gratis ). Paper sobre el uso de Transformadores (modelos de Deep...

Artículos recomendados para cientifícos de datos: Agile, BloombergGPT, RDD, TensorFlow con MATLAB, equidad en el aprendizaje automático

Imagen
El día de hoy, te voy a compartir una serie de artículos relacionados con la ciencia de datos, para que los revises con calma este fin de semana. Mi primera recomendación, es para aquellos que no están familiarizados con las metodologías ágiles:  What is agile? ( McKinsey ). Hace un par de semana les compartía algunas de las aplicaciones de ChatGPT en economía y finanzas , para los interesados en la aplicación de los LLM (Gran Modelo Lingüístico) para las finanzas, Bloomberg ha sacado su propio BloombergGPT. Aquí un artículo de Bloomberg donde explican de qué se trata su propio modelo y acá el paper . Para los más avanzados, aquí les dejo un post con recomendaciones para graficar un Diseño de Regresión Discontinua (RDD):  How should you draw an RDD graph? ( Development Impact ). Siguiendo la línea del análisis visual, ahora les dejo un recurso para los que trabajen con Tableau:  Unlock the Power of Personalized Analytics with User Attribute Functions (UAF) . MATLAB, ...