Entradas

Mostrando las entradas etiquetadas como Machine Learning

Análisis de datos & BI en finanzas

Imagen
En el post del día de hoy, les traigo una serie de recursos que serán de utilidad para los profesionales interesados en el análisis de datos y BI aplicado a las finanzas. Ejemplos e ideas para crear dashboards Mis primeras recomendaciones vienen de la mano del banco de los bancos centrales, el Banco Internacional de Pagos (BIS): Aquí , se presenta un dashboard creado a partir de un análisis de aprendizaje automático con los discursos de los bancos centrales, esto es de utilidad para revelar patrones institucionales y destacar los cambios en los enfoques políticos a lo largo del tiempo. En esta página  se reúnen todos los dashboards publicados por el Comité de Supervisión Bancaria de Basilea (BCBS) para explorar sus datos. Identificación y clasificación de fuentes de riesgo de datos y eventos desencadenantes: Un método conceptual en dos etapas para la gobernanza de datos con enfoque en el riesgo En un entorno con gran volumen de datos, la capacidad de identificar y gestionar con pr...

Data Science Assorted Links: Building Bridges Between Data, Insight, and Impact

Imagen
In an era overflowing with information, translating raw data into meaningful action demands more than just numbers—it requires clear maps of what we know, compelling visual narratives, realistic scenario testing, and targeted predictive models. The following curated resources guide you through four essential pillars of modern data-driven work: creating intuitive knowledge frameworks, mastering visualization techniques for storytelling, leveraging solution-oriented simulations to tackle the climate crisis, and applying climate data to crop-yield forecasting. Dive in to discover how each approach transforms complexity into clarity and drives real-world impact: Why science needs better knowledge maps How to master data visualisation for impactful storytelling Solution-orientated simulations can drive real action on the climate crisis Soybean yield prediction in Argentina using climate data May these insights spark your next breakthrough. If you’re interested in more, feel free to follow ...

Data Science recommended readings: models, data quality, market stress with ML and computer vision

Imagen
In today’s rapidly evolving landscape of data science and artificial intelligence, staying informed about the latest methodologies and industry shifts is more important than ever. This week’s curated selection of readings spans a remarkable diversity of topics, each challenging conventional thinking and offering fresh insights into how we build and use technology.  The journey begins with a thought-provoking piece from Vintage Data, “Model is the Product” which repositions machine learning models from being mere tools to becoming full-fledged products, emphasizing the intricate interplay between technology and user experience. This idea is echoed and expanded upon in a timely post from the CFA Institute Investor, which argues that the success of ML systems hinges on the quality of their training data —and that the emerging generative AI solutions could hold the key to unlocking this potential. Delving deeper into the theoretical and regulatory realms, the Bank for International S...

Discovering Gems: Assorted Data Science Links for Every Enthusiast

Imagen
The world of data science is ever-evolving, with new tools, research, and insights emerging daily. For enthusiasts and professionals alike, staying updated is essential—but it can also feel overwhelming. To help you navigate this dynamic landscape, we’ve curated a selection of assorted links covering a range of topics in data science. Whether you're diving into advanced machine learning techniques, exploring best practices for data visualization, or simply seeking inspiration from successful projects, these links are sure to spark your curiosity and enhance your knowledge. Learn the Basics of Well-Structured Data . Follow these three data-structure tips to recognize the best, and smooth out the rest ( Tableau ). Introducing Wake Vision : A High-Quality, Large-Scale Dataset for TinyML Computer Vision Applications ( TensorFlow Blog ). A Tutorial on Teaching Data Analytics with Generative AI .  This tutorial addresses the challenge of incorporating large language models, such as Ch...

De visual analytics a modelos generativos: Recursos clave para la economía basada en datos

Imagen
En un mundo impulsado por los datos y la inteligencia artificial, las herramientas de visualización, el aprendizaje automático y el aprendizaje profundo están transformando industrias enteras. En este post, exploraremos recursos clave y lecturas recomendadas que abarcan desde cómo aprovechar al máximo Tableau en el análisis visual hasta aplicaciones de aprendizaje profundo que revolucionan la economía cuantitativa. Estas recomendaciones te guiarán para potenciar tus habilidades en análisis de datos, investigación económica y mucho más. I. Visual Analytics Deje que Tableau escriba su SQL por usted : aprende sobre relaciones y relaciones de múltiples hechos en Tableau . Su guía sobre las extensiones de Viz de Tableau : aprende cómo comenzar a utilizar las extensiones de Viz y profundiza en las 36 extensiones disponibles en Tableau Exchange . Dashboards del BCBS : Los dashboards permiten ahora visualizar de forma interactiva los resultados de los riesgos crediticios, de mercado, oper...

La ciencia de datos en economía y finanzas

Imagen
¿Qué significa hacer ciencia social empírica? Para muchos de nosotros, la mayor parte del tiempo, lo que significa es escribir y depurar código. ( Gentzkow y Shapiro, 2014 ) Sin duda alguna, la ciencia de datos es un campo interdisciplinario entre la economía, la estadística y la tecnología . Para algunos,  la economía es un campo de la ingeniería de software , y si no lo creen así, está claro que, al menos, la economía debería de adoptar más normas y buenas prácticas de la ingeniería de software. Reproducibilidad del código Justo el año pasado, les comentaba que había tomado un curso de actualización sobre "Investigación Reproducible" del Departamento de Evaluación de Impacto en el Desarrollo (DIME) del Banco Mundial, este curso no es otra cosa que normas y buenas prácticas en nuestros códigos y scripts, que permitan compartir y reproducir nuestros resultados, es decir, ciencia abierta basada en datos y código. Aquí les dejo un excelente artículo de LSE Impact Blog sobre ...

Explorando la transformación de la Inteligencia Artificial: Avances, desafíos y perspectivas futuras en medicina, negocios y aprendizaje automático

Imagen
Con el lanzamiento de ChatGPT el 30 de noviembre de 2022, este evento atraería la atención, en general, sobre la Inteligencia Artificial (IA) y, en particular, sobre los modelos de lenguaje de gran tamaño (LLM) y la IA generativa. Nos encontramos en 2024 y vale la pena evaluar el camino recorrido de la IA aplicada, y mi primera recomendación sería el artículo "Poniendo en perspectiva la inteligencia artificial médica" , el cual analiza el potencial y los desafíos de la inteligencia artificial (IA) en el ámbito de la salud. Explora cómo estas tecnologías pueden mejorar el diagnóstico, tratamiento y seguimiento de los pacientes, pero también señala las limitaciones actuales, como la necesidad de datos de alta calidad y la dificultad de interpretar algunas decisiones de la IA. Además, discute los aspectos éticos y regulatorios involucrados en su implementación. Puedes leer el artículo completo aquí . Por otra parte, el artículo "A data leader’s operating guide to scaling ge...

Recommended readings: Dashboards and metrics, DL with TensorFlow, PostgreSQL, Sentiment Analysis, Digital Nomad Visas

Imagen
Welcome, tech enthusiasts! This post dives into a range of exciting topics to fuel your learning and exploration. Whether you're embarking on a cloud migration journey, eager to build your first deep learning model, or curious about the latest trends in digital nomadism, we've got you covered. We'll unpack the essential dashboards and metrics for successful cloud transformations, guide you through the creation of a deep learning model using TensorFlow, and explore the power of callbacks like EarlyStopping and LiveLossPlot. We'll also unveil the hidden villain lurking within Java file operations and the PostgreSQL CopyManager API, and unveil how text analysis can predict industrial production. Finally, for the aspiring digital nomad, we've got a handy chart showcasing countries offering visas that cater to your remote work lifestyle. So, buckle up and get ready to dive into the ever-evolving world of technology! Ending the confusion in cloud transformations: The das...

Level Up Your Machine Learning Skills: 5 Must-Watch Lectures

Imagen
Machine learning (ML) is revolutionizing various fields, but it's true power lies in its ability to scale. This curated list of lectures dives deep into specific, yet valuable, areas within ML, equipping you with the knowledge to tackle complex challenges. Whether you're a seasoned data scientist or just starting your ML journey, these lectures offer something for everyone. From practical tools for anomaly detection to the ethical considerations of predicting police misconduct, you'll gain insights and techniques to elevate your skillset. 1. MLOps so AI can scale.   Most of the failures in ML development come not from developing poor models but from poor productization practices ( McKinsey ). 2. How to Detect the Trend in the Time Series Data and Detrend in Python ( Regenerative ). 3. Predicting Police Misconduct:   Whether police misconduct can be prevented depends partly on whether it can be predicted. We show police misconduct is partially predictable and that estimate...

Lecturas recomendadas en temáticas de vanguardia en el campo de la IA

Imagen
En este post, te compartiré algunas lecturas recomendadas en diversas temáticas de vanguardia en el campo de la IA. Nos preguntaremos si debemos evaluar más los algoritmos que utilizamos a diario ( Development Impact ). Aprenderás los pasos básicos para desarrollar tu propia red neuronal con PyTorch ( Regenerative ). Nabeel discute el potencial de los datos sintéticos como clave para la Inteligencia Artificial General ( Digital Spirits ).  También veremos cómo incorporar información de sensores remotos en evaluaciones aleatorias ( J-PAL ).  Para los interesados en finanzas, analizaremos la predicción de riesgo crediticio para pequeñas y medianas empresas utilizando datos de empresas adyacentes y una red de atención gráfica relacional ( Journal of Management Science and Engineering ). ¿Te intriga la posibilidad de una IA que juegue ajedrez a nivel de Gran Maestro sin necesidad de búsqueda? Averígualo aquí:  arXiv . Y para finalizar, te recomendamos un libro clave sobre ap...

Construye tu futuro en ciencia de datos: domina la reproducibilidad, explora recursos y descubre aplicaciones prácticas

Imagen
Reproducibilidad Retomando la discusión sobre la importancia de la reproducibilidad del código publicada en un post anterior . Les cuento que en 2019, la revista Management Science introdujo una política que exige a los autores que pongan a disposición sus materiales de estudio. Aprovechando esto como una oportunidad, un grupo de investigadores se dio a la tarea de evaluar el impacto de la política y el estado de la reproducibilidad de los estudios. Los autores señalan que la reproducibilidad es una característica esencial de los resultados de investigación confiables, pero no puede garantizar la replicabilidad ( LSE Impact Blog ). Recursos para aprender ciencia de datos Paul Goldsmith-Pinkham (profesor en la Escuela de Administración de Yale) comparte notas de conferencias escritas para su curso de doctorado sobre métodos empíricos aplicados. También diapositivas, preguntas de exámenes y más ( GitHub ). Árboles de decisión en python con sklearn ( Regenerative ). Graficar redes neuron...

Cómo triunfar como científico de datos: los recursos que necesitas

Imagen
Hoy en día existe mucha confusión entre el rol del analista de datos, el científico de datos y el ingeniero de datos, esto se debe fundamentalmente que muchas habilidades y competencias de estos roles se pisan entre sí. No obstante, el título de "científico" tiene algo que no tienen los otros, justamente esa capacidad de utilizar el método científico para aportar verdadero valor a las organizaciones y generar impacto. En el post del día de hoy, les traigo una serie de recursos para fortalecer el bagaje de profesionales de la ciencia de datos. El modelo es importante, pero los supuestos lo son más  La primera recomendación, es un artículo publicado por el CFA Institute (referente en el mundo de las finanzas) que hace una critica constructiva a los profesionales que se casan con las simulaciones de Monte Carlo para realizar sus pronósticos de rendimientos futuros. La recomendación: la importancia de los supuestos y considerar en sus escenarios aquellos eventos inesperados. Má...

¡De investigaciones complejas a dashboards para todos! Un viaje por el apasionante mundo de los datos

Imagen
¿Alguna vez te ha fascinado un descubrimiento científico pero te atemorizaron las ecuaciones o la jerga especializada? ¿Has deseado comprender la salud de la economía con claridad, sin perderte en un mar de estadísticas? ¿Te intriga el potencial de la inteligencia artificial para explorar fronteras matemáticas desconocidas? En este blog, abrimos las puertas a un mundo donde la complejidad se transforma en conocimiento accesible. Aquí, los datos dejan de ser números fríos y se convierten en historias vívidas que cualquiera puede comprender. Te invito a navegar en las siguientes lecturas que te ayudarán a seguir desarrollando tus conocimientos y habilidades en el mundo de los datos. Para los principiantes, Este curso desmitificará y explicará el tema del Machine Learning. En tan solo unas horas podrás comprender los conceptos y los procesos detrás de esta tecnología revolucionaria:  A Quick Introduction to Machine Learning . Para los que ya tienen más experiencia:  Anomaly ...

Artículos recomendados para científicos de datos: DataViz, aprendizaje automático, NLP, aprendizaje profundo

Imagen
1. ¿Qué hace que los datos ambientales sean útiles? Las mejoras en la tecnología y el procesamiento de datos ahora permiten que los individuos controlen los efectos de la contaminación del aire. Sin embargo, esta singularización radical plantea desafíos para una acción comunitaria de base amplia ( Impact of Social Sciences ). 2. Cómo detectar gráficos engañosos (checklist) Explora una lista de verificación (c hecklist ) completa para detectar gráficos engañosos, lo que permite una toma de decisiones informada y segura basada en: la fuente, el tipo de gráfico, los ejes y el mensaje ( Tableau Blog ). 3. Desigualdad de oportunidades educativas: Medición y resultados empíricos En este artículo se muestra que las técnicas de ML pueden superar a este enfoque tradicional en la estimación de la desigualdad de oportunidades (DOp) en el ámbito educativo. En particular, los autores encontraron que los métodos de ML proporcionan estimaciones de la DOp más altas, lo que sugiere que estos ...

Artículos recomendados sobre la gestión de riesgos climáticos

Imagen
El día de hoy, les traigo a colación una serie de artículos que tienen que ver con el riesgo climático desde diversas perspectivas. 1. Progreso en los objetivos de energía renovable para 2030 La Agencia Internacional de Energía afirma que la capacidad global instalada de energía renovable debe triplicarse para 2030 para limitar el calentamiento global a 1,5°C por encima de los niveles preindustriales. Esto hace que los próximos seis años sean críticos en la lucha climática. Actualmente, China se destaca como la única nación en camino de cumplir su objetivo para 2030. En 2022, no solo cumplió sino que superó significativamente las adiciones de capacidad requeridas para mantener el rumbo, agregando el 168% de los 101 GW requeridos. Echemos ahora un vistazo más de cerca a cómo les está yendo a cada uno de estos países, comparando cuánta capacidad eólica y solar necesitaban agregar con la que realmente hicieron en 2022. En general, Estados Unidos y la India fueron los que más se alejaron d...

Artículos recomendados para científicos de datos: DataViz, SVM, Pytorch, análisis de sentimiento

Imagen
Como es costumbre en este blog, esta semana toca compartirles una serie de artículos que serán de utilidad para tanto principiantes como practicantes de data science. I. Para los que inician su carrera de análisis de datos Para los nuevos, aquí les dejo un artículo con consejos para ser contratado como analista de datos, crear un portafolio de visualización de datos gratuito, conectarse con otros entusiastas de los datos, conseguir el trabajo de visualización de datos y más:  7 Ways to Stand Out and Secure Your Next Data Analytics Role ( Tableau ). El siguiente artículo es para aquellos que les gusta leer, aprender y encontrar inspiración para sus proyectos:  How mathematics built the modern world ( Work in Progress ). II. Análisis visual A continuación, les comparto una "infografía" sobre la recaudación en taquilla de las películas del Universo Cinematográfico de Marvel (MCU por sus siglas en inglés). Me gusta esta visualización, ya que combina dos objetos visuales (un gr...

Recursos para científicos de datos (Python, R y Tableau)

Imagen
Desde hace algunos años me dedico a la consultoría de ciencia de datos y capacito a las organizaciones en análisis de datos e inteligencia de negocios para una mejor toma de decisiones. Por lo cual, doy fe que cada día las empresas son más conscientes que tienen que actualizarse y empezar la transformación digital a un modelo más orientado al aprovechamiento de los datos. La siguiente figura es resultado de un estudio reciente que demuestra que trabajar con IA vale la pena, ya que el valor de las habilidades de IA (aumentan los salarios de los trabajadores en un 21%) es significativamente mayor que el de las habilidades promedio (Gráfico A1). Mientras que, al examinar el valor de las habilidades de IA individualmente (Gráfico B), se observa que las habilidades relacionadas con el aprendizaje automático, es decir, ML (40%), Tensor Flow (38%), Deep Learning (27%), PNL (19%), son más valiosas que las habilidades en análisis de datos (14%) y ciencia de datos (17%), seguidas de los lenguaje...