Entradas

Mostrando las entradas etiquetadas como Machine Learning

Lecturas recomendadas en temáticas de vanguardia en el campo de la IA

Imagen
En este post, te compartiré algunas lecturas recomendadas en diversas temáticas de vanguardia en el campo de la IA. Nos preguntaremos si debemos evaluar más los algoritmos que utilizamos a diario ( Development Impact ). Aprenderás los pasos básicos para desarrollar tu propia red neuronal con PyTorch ( Regenerative ). Nabeel discute el potencial de los datos sintéticos como clave para la Inteligencia Artificial General ( Digital Spirits ).  También veremos cómo incorporar información de sensores remotos en evaluaciones aleatorias ( J-PAL ).  Para los interesados en finanzas, analizaremos la predicción de riesgo crediticio para pequeñas y medianas empresas utilizando datos de empresas adyacentes y una red de atención gráfica relacional ( Journal of Management Science and Engineering ). ¿Te intriga la posibilidad de una IA que juegue ajedrez a nivel de Gran Maestro sin necesidad de búsqueda? Averígualo aquí:  arXiv . Y para finalizar, te recomendamos un libro clave sobre aprendizaje auto

Construye tu futuro en ciencia de datos: domina la reproducibilidad, explora recursos y descubre aplicaciones prácticas

Imagen
Reproducibilidad Retomando la discusión sobre la importancia de la reproducibilidad del código publicada en un post anterior . Les cuento que en 2019, la revista Management Science introdujo una política que exige a los autores que pongan a disposición sus materiales de estudio. Aprovechando esto como una oportunidad, un grupo de investigadores se dio a la tarea de evaluar el impacto de la política y el estado de la reproducibilidad de los estudios. Los autores señalan que la reproducibilidad es una característica esencial de los resultados de investigación confiables, pero no puede garantizar la replicabilidad ( LSE Impact Blog ). Recursos para aprender ciencia de datos Paul Goldsmith-Pinkham (profesor en la Escuela de Administración de Yale) comparte notas de conferencias escritas para su curso de doctorado sobre métodos empíricos aplicados. También diapositivas, preguntas de exámenes y más ( GitHub ). Árboles de decisión en python con sklearn ( Regenerative ). Graficar redes neuron

Cómo triunfar como científico de datos: los recursos que necesitas

Imagen
Hoy en día existe mucha confusión entre el rol del analista de datos, el científico de datos y el ingeniero de datos, esto se debe fundamentalmente que muchas habilidades y competencias de estos roles se pisan entre sí. No obstante, el título de "científico" tiene algo que no tienen los otros, justamente esa capacidad de utilizar el método científico para aportar verdadero valor a las organizaciones y generar impacto. En el post del día de hoy, les traigo una serie de recursos para fortalecer el bagaje de profesionales de la ciencia de datos. El modelo es importante, pero los supuestos lo son más  La primera recomendación, es un artículo publicado por el CFA Institute (referente en el mundo de las finanzas) que hace una critica constructiva a los profesionales que se casan con las simulaciones de Monte Carlo para realizar sus pronósticos de rendimientos futuros. La recomendación: la importancia de los supuestos y considerar en sus escenarios aquellos eventos inesperados. Má

¡De investigaciones complejas a dashboards para todos! Un viaje por el apasionante mundo de los datos

Imagen
¿Alguna vez te ha fascinado un descubrimiento científico pero te atemorizaron las ecuaciones o la jerga especializada? ¿Has deseado comprender la salud de la economía con claridad, sin perderte en un mar de estadísticas? ¿Te intriga el potencial de la inteligencia artificial para explorar fronteras matemáticas desconocidas? En este blog, abrimos las puertas a un mundo donde la complejidad se transforma en conocimiento accesible. Aquí, los datos dejan de ser números fríos y se convierten en historias vívidas que cualquiera puede comprender. Te invito a navegar en las siguientes lecturas que te ayudarán a seguir desarrollando tus conocimientos y habilidades en el mundo de los datos. Para los principiantes, Este curso desmitificará y explicará el tema del Machine Learning. En tan solo unas horas podrás comprender los conceptos y los procesos detrás de esta tecnología revolucionaria:  A Quick Introduction to Machine Learning . Para los que ya tienen más experiencia:  Anomaly Detection in T

Artículos recomendados para científicos de datos: DataViz, aprendizaje automático, NLP, aprendizaje profundo

Imagen
1. ¿Qué hace que los datos ambientales sean útiles? Las mejoras en la tecnología y el procesamiento de datos ahora permiten que los individuos controlen los efectos de la contaminación del aire. Sin embargo, esta singularización radical plantea desafíos para una acción comunitaria de base amplia ( Impact of Social Sciences ). 2. Cómo detectar gráficos engañosos (checklist) Explora una lista de verificación (c hecklist ) completa para detectar gráficos engañosos, lo que permite una toma de decisiones informada y segura basada en: la fuente, el tipo de gráfico, los ejes y el mensaje ( Tableau Blog ). 3. Desigualdad de oportunidades educativas: Medición y resultados empíricos En este artículo se muestra que las técnicas de ML pueden superar a este enfoque tradicional en la estimación de la desigualdad de oportunidades (DOp) en el ámbito educativo. En particular, los autores encontraron que los métodos de ML proporcionan estimaciones de la DOp más altas, lo que sugiere que estos métodos p

Artículos recomendados sobre la gestión de riesgos climáticos

Imagen
El día de hoy, les traigo a colación una serie de artículos que tienen que ver con el riesgo climático desde diversas perspectivas. 1. Progreso en los objetivos de energía renovable para 2030 La Agencia Internacional de Energía afirma que la capacidad global instalada de energía renovable debe triplicarse para 2030 para limitar el calentamiento global a 1,5°C por encima de los niveles preindustriales. Esto hace que los próximos seis años sean críticos en la lucha climática. Actualmente, China se destaca como la única nación en camino de cumplir su objetivo para 2030. En 2022, no solo cumplió sino que superó significativamente las adiciones de capacidad requeridas para mantener el rumbo, agregando el 168% de los 101 GW requeridos. Echemos ahora un vistazo más de cerca a cómo les está yendo a cada uno de estos países, comparando cuánta capacidad eólica y solar necesitaban agregar con la que realmente hicieron en 2022. En general, Estados Unidos y la India fueron los que más se alejaron d

Artículos recomendados para científicos de datos: DataViz, SVM, Pytorch, análisis de sentimiento

Imagen
Como es costumbre en este blog, esta semana toca compartirles una serie de artículos que serán de utilidad para tanto principiantes como practicantes de data science. I. Para los que inician su carrera de análisis de datos Para los nuevos, aquí les dejo un artículo con consejos para ser contratado como analista de datos, crear un portafolio de visualización de datos gratuito, conectarse con otros entusiastas de los datos, conseguir el trabajo de visualización de datos y más:  7 Ways to Stand Out and Secure Your Next Data Analytics Role ( Tableau ). El siguiente artículo es para aquellos que les gusta leer, aprender y encontrar inspiración para sus proyectos:  How mathematics built the modern world ( Work in Progress ). II. Análisis visual A continuación, les comparto una "infografía" sobre la recaudación en taquilla de las películas del Universo Cinematográfico de Marvel (MCU por sus siglas en inglés). Me gusta esta visualización, ya que combina dos objetos visuales (un gr

Recursos para científicos de datos (Python, R y Tableau)

Imagen
Desde hace algunos años me dedico a la consultoría de ciencia de datos y capacito a las organizaciones en análisis de datos e inteligencia de negocios para una mejor toma de decisiones. Por lo cual, doy fe que cada día las empresas son más conscientes que tienen que actualizarse y empezar la transformación digital a un modelo más orientado al aprovechamiento de los datos. La siguiente figura es resultado de un estudio reciente que demuestra que trabajar con IA vale la pena, ya que el valor de las habilidades de IA (aumentan los salarios de los trabajadores en un 21%) es significativamente mayor que el de las habilidades promedio (Gráfico A1). Mientras que, al examinar el valor de las habilidades de IA individualmente (Gráfico B), se observa que las habilidades relacionadas con el aprendizaje automático, es decir, ML (40%), Tensor Flow (38%), Deep Learning (27%), PNL (19%), son más valiosas que las habilidades en análisis de datos (14%) y ciencia de datos (17%), seguidas de los lenguaje

Recursos para ciencia de datos en modelos de TensorFlow y series temporales

Imagen
En el post de esta semana, les comparto una serie de artículos para los entusiastas de la ciencia de datos, interesados en modelos de TensorFlow y series temporales. Primeramente, les dejo una lista con una serie de artículos publicados en el blog Regenerative, para poner en práctica diversos modelos de TensorFlow: Basic Building Blocks of TensorFlow: Basic Operations with Tensors Introduction to GradientTape in TensorFlow TensorFlow Model Training Using GradientTape Using a Keras Tuner for Hyperparameter Tuning of a TensorFlow Model Implementation of a Siamese Network in Keras and TensorFlow Últimamente, TensorFlow está publicando los resultados de algunas colaboraciones con otras empresas del sector IT. El caso más reciente es una colaboración con Spotify, la cual se resume en el siguiente post, que lo encuentro muy recomendable para los equipos de ciencia de datos, cuando necesitan difundir y diseminar los resultados de colaboraciones como lo que está haciendo TensorFlow de Google:

Data Science Assorted Links

Imagen
Map, Filter, and CombinePerKey Transforms in Writing Apache Beam Pipelines with Examples ( Regenerative ). Pre-processing temporal data made easier with TensorFlow Decision Forests and Temporian ( TensorFlow Blog ). gingado: a machine learning library focused on economics and finance ( BIS ). The Benefits of Using Economically Meaningful Factors in Financial Data Science ( Enterprising Investor ). How to Build a Data Community Within Your Organization ( Tableau ).

Artículos recomendados para científicos de datos

Imagen
En la visualización que abre el post del día de hoy, destaca como el nivel del poder adquisitivo del salario mínimo federal en los Estados Unidos está en su punto más bajo desde diciembre de 1949. Como buena práctica el autor nos comparte los datos y el código que utilizó para crear la figura. En este post de Google nos explica cómo v isualizar e interpretar los árboles de decisión con TensorFlow. En el blog de Tryolabs, nos enseñan en dos entregas cómo elaborar estrategias de precios. En la primera parte , nos introducen a su simulador de mercado. En la segunda parte , nos muestran la e xploración de escenarios de mercado complejos. Finalmente,  ¿Qué hacer con las tendencias paralelas cuando sólo se dispone de datos de referencia? Hasta aquí el post del día de hoy y recuerda que puedes seguirme en Twitter y mantenerte informado de lo último de ciencia, tecnología e innovación en el mundo de la economía y las finanzas. ¡Hasta la próxima!

Artículos recomendados para extender tu expertise en ciencia de datos

Imagen
Esta semana les traigo una serie de artículos para los entusiastas de la ciencia de datos. Este listado de recursos van desde lo más sencillo de implementar hasta aquellas cuestiones que serán de interés para aquellos con mayor conocimiento o experiencia: Artículo que incluye base de datos, la cual permite descargar series temporales de tasas de pérdida de créditos:  Insights into credit loss rates: a global database ( BIS ). Análisis de datos realizado con Tableau, en el cual se discuten las distintas lecturas de la tasa de actividad , bien desde la evolución temporal o en relación a la brecha de género ( Nada es Gratis ). Para los entusiastas de R, Vincent Arel-Bundock analizó 19.000 scripts de R en el Dataverse para ver qué paquetes de R son los más utilizados por los científicos . Para los interesados en mejorar su expertise en series temporales:  Desorden y predicción en series trimestrales ( Nada es Gratis ). Paper sobre el uso de Transformadores (modelos de Deep Learning) apl

Artículos recomendados para cientifícos de datos: Agile, BloombergGPT, RDD, TensorFlow con MATLAB, equidad en el aprendizaje automático

Imagen
El día de hoy, te voy a compartir una serie de artículos relacionados con la ciencia de datos, para que los revises con calma este fin de semana. Mi primera recomendación, es para aquellos que no están familiarizados con las metodologías ágiles:  What is agile? ( McKinsey ). Hace un par de semana les compartía algunas de las aplicaciones de ChatGPT en economía y finanzas , para los interesados en la aplicación de los LLM (Gran Modelo Lingüístico) para las finanzas, Bloomberg ha sacado su propio BloombergGPT. Aquí un artículo de Bloomberg donde explican de qué se trata su propio modelo y acá el paper . Para los más avanzados, aquí les dejo un post con recomendaciones para graficar un Diseño de Regresión Discontinua (RDD):  How should you draw an RDD graph? ( Development Impact ). Siguiendo la línea del análisis visual, ahora les dejo un recurso para los que trabajen con Tableau:  Unlock the Power of Personalized Analytics with User Attribute Functions (UAF) . MATLAB, es un software

Artículos recomendados para científicos de datos (31 de marzo de 2023)

Imagen
Se acerca el fin de semana, y para los entusiastas que nunca paran de aprender sobre el fascinante mundo de la ciencia de datos, aquí les dejo algunos recursos para revisarlos con calma: Por qué necesitamos datos precisos sobre sexo biológico para el análisis económico ( Nada es Gratis ). Stata linter produces Stata code that sparks joy ( Development Impact ). How Vodafone Uses TensorFlow Data Validation in their Data Contracts to Elevate Data Governance at Scale ( TensorFlow Blog ). Easy Method of Edge Detection in OpenCV Python ( Regenerative ). Feature Platforms: A New Paradigm in Machine Learning Operations (MLOps) ( IBM Data Science in Practice ). Hasta aquí el post del día de hoy y recuerda que puedes seguirme en Twitter y mantenerte informado de lo último de ciencia, tecnología e innovación en el mundo de la economía y las finanzas. ¡Hasta la próxima!

Aplicaciones de ChatGPT en economía y finanzas

Imagen
Fuente: Our World in Data El 30 de noviembre de 2022, se lanzó de manera gratuita el ChatGPT, un chatbot de inteligencia artificial de red neuronal de aprendizaje profundo desarrollado por OpenAI , pertenece a la familia de modelos lingüísticos del Transformador Generativo Preentrenado (GPT por sus siglas en inglés). Desde su lanzamiento, las redes sociales y los medios, no han dejado de realizar consultas, pruebas y experimentos con el chatbot. El post del día de hoy, les comparto una serie de lecturas que nos pueden dar una clara idea (comprobada) de lo que puede hacer actualmente este tipo de tecnología en economía y finanzas. El Instituto CFA (un referente para los profesionales en finanzas) no se ha querido quedar atrás en el tema y ha publicado un artículo que discute sobre los orígenes, el revuelo, y la oportunidad que supone el famoso ChatGPT. Otro artículo bastante interesante es el que nos trae el economista experto en inferencia causal y econometría,  Scott Cunningham ,

Data science assorted links (datasets, methodologies, practice, dataviz good practices)

Imagen
Data Overcoming original sin: insights from a new dataset ( BIS ). LLaMA: Open and Efficient Foundation Language Models ( Meta ). Methodology Expanding the usability of remote sensing data in development ( Development Impact ). Practice How to Perform Image Segmentation with Thresholding Using OpenCV ( Regenerative ). Just for AI Titans — Autonomous & Continuous AI Training - MLOPS on steroids ( IBM Data Science in Practice ). DataViz & BI Good Practices Macro Snapshot / St. Louis Fed ( The Big Picture ). What is the Most Successful Hollywood Movie of All Time? ( Information is beautiful ). Feel free to follow me on Twitter

Enlaces recomendados para científicos de datos: cursos gratuitos, novedades y la visualización de la semana

Imagen
El día de hoy, les comparto algunas novedades enfocadas a las tecnologías (Tableau, IBM y Google) que un científico de datos debe de manejar día a día, tres recursos para realizar cursos gratuitos. Finalmente, la visualización de la semana realizada con Python. Novedades DataFam Roundup: February 6 - 10, 2023 . Un blog semanal de Tableau que reúne las tendencias de la comunidad en una sola entrada. Updates: TensorFlow Decision Forests is production ready . En este post, te muestra todas las novedades que trae la librería  TensorFlow Decision Forests . Cloud Pak for Data 4.6 Code Experience with VS Code Integration . Este artículo ofrece una visión general de la experiencia de código para los científicos de datos en Watson Studio en Cloud Pak for Data 4.6 de IBM. Cubre la nueva integración mejorada de VS Code Desktop y la integración de JupyterLab y RStudio . La integración de escritorio de VS Code permite a los científicos de datos utilizar un IDE familiar para ejecutar y depurar c

Recursos para cientifícos de datos (1º semana de febrero de 2023)

Imagen
Pues esta semana les traigo algunos recursos para los interesados en la ciencia de datos. Recuerden que no todo es saber código. Como bien señala nuestro primer artículo recomendado de la revista de negocios de la London School of Economics:  Los modelos matemáticos son simplificaciones. Ningún modelo es capaz de integrar todos los numerosos equilibrios políticos, económicos y sociales que intervienen en la toma de decisiones de política pública. Las soluciones son tanto técnicas como sociales. Por ello, necesitamos más trabajo sobre el contexto social y el contenido social de los modelos matemáticos, y un pensamiento crítico sobre cómo estos modelos interactúan con la toma de decisiones y el desarrollo de políticas ( LSE Business Review ) y ojo que esto también aplica para las empresas. El siguiente artículo , parte de un "estudio" para evaluar si el aumento del IVA de bebidas azucaradas redujo realmente el consumo. Lo interesante, es que los autores del post llevan a cabo

Recursos en ciencia de datos: análisis de texto, prevención del fraude, cripto trading y detección de anomalías con deep learning

Imagen
Esta semana les traigo una serie de recursos que creo serán muy útiles para los interesados en practicar la ciencia de datos. El primer bloque, son varios artículos para el análisis de texto: How to make causal inferences using texts Speech To Text (STT) using the Watson Speech Library Hierarchical Topic Modeling Using Watson NLP Para los interesados en crear soluciones para una mejor prevención del fraude, aquí les dejo un artículo con cuatro capacidades clave para reforzar un sistema de gestión del fraude . Por otra parte, en el siguiente artículo se hace un análisis sobre el cripto trading y el Bitcoin , incluye base datos para aquellos interesados en realizar sus propios análisis.  Finalmente, aquí les dejo un curso gratuito que utiliza Keras y TensorFlow para crear una red neuronal de aprendizaje profundo para la detección de anomalías en datos de series temporales:  Developing cognitive IoT solutions for anomaly detection using deep learning . Hasta aquí el post del día de hoy y

Assorted data science links

Imagen
Today, I am sharing with you a series of resources from IBM Data Science in Practice: einsum — An Easy/Intuitive way to write Tensor Operation How to Build an in-database Linear Regression Model with IBM Db2 Train Better with NLU Classifications An enterprise design pattern for MLOps & DataOps on unified data and AI platforms Explainability and Trust in Machine Learning Developing cognitive IoT solutions for anomaly detection using deep learning For more data science resources feel free to follow me on Twitter Have a nice day