Entradas

Mostrando las entradas etiquetadas como Data Science

Lecturas recomendadas en temáticas de vanguardia en el campo de la IA

Imagen
En este post, te compartiré algunas lecturas recomendadas en diversas temáticas de vanguardia en el campo de la IA. Nos preguntaremos si debemos evaluar más los algoritmos que utilizamos a diario ( Development Impact ). Aprenderás los pasos básicos para desarrollar tu propia red neuronal con PyTorch ( Regenerative ). Nabeel discute el potencial de los datos sintéticos como clave para la Inteligencia Artificial General ( Digital Spirits ).  También veremos cómo incorporar información de sensores remotos en evaluaciones aleatorias ( J-PAL ).  Para los interesados en finanzas, analizaremos la predicción de riesgo crediticio para pequeñas y medianas empresas utilizando datos de empresas adyacentes y una red de atención gráfica relacional ( Journal of Management Science and Engineering ). ¿Te intriga la posibilidad de una IA que juegue ajedrez a nivel de Gran Maestro sin necesidad de búsqueda? Averígualo aquí:  arXiv . Y para finalizar, te recomendamos un libro clave sobre aprendizaje auto

A 20 años del artículo seminal: Las etapas del empresario y la empresa moderna

Imagen
¡20 años ya! Parece mentira que fue ayer cuando publiqué mi primer artículo en Internet, titulado Las etapas del empresario y la empresa moderna . Publicado en  Gestiopolis  (en realidad sería una segunda versión revisada de un artículo publicado varios meses atrás en un website de consultoría de negocios en Chile) este texto no solo tuvo una gran acogida, sino que marcó el inicio de un camino lleno de aprendizaje y crecimiento profesional. Aquel primer artículo, nacido de la experiencia y la reflexión, fue solo el comienzo. Invitaciones a publicar en otros espacios digitales, como la  Revista Contribuciones a la Economía , se multiplicaron, impulsando la difusión de ideas y conocimientos. Más de 30 publicaciones científicas ( ORCiD ) avalan una trayectoria dedicada a la investigación y a la publicación de  artículos de divulgación . Cada artículo, cada línea escrita, refleja el compromiso con el aprendizaje continuo y la búsqueda de respuestas a los desafíos del mundo empresarial act

Construye tu futuro en ciencia de datos: domina la reproducibilidad, explora recursos y descubre aplicaciones prácticas

Imagen
Reproducibilidad Retomando la discusión sobre la importancia de la reproducibilidad del código publicada en un post anterior . Les cuento que en 2019, la revista Management Science introdujo una política que exige a los autores que pongan a disposición sus materiales de estudio. Aprovechando esto como una oportunidad, un grupo de investigadores se dio a la tarea de evaluar el impacto de la política y el estado de la reproducibilidad de los estudios. Los autores señalan que la reproducibilidad es una característica esencial de los resultados de investigación confiables, pero no puede garantizar la replicabilidad ( LSE Impact Blog ). Recursos para aprender ciencia de datos Paul Goldsmith-Pinkham (profesor en la Escuela de Administración de Yale) comparte notas de conferencias escritas para su curso de doctorado sobre métodos empíricos aplicados. También diapositivas, preguntas de exámenes y más ( GitHub ). Árboles de decisión en python con sklearn ( Regenerative ). Graficar redes neuron

Cómo triunfar como científico de datos: los recursos que necesitas

Imagen
Hoy en día existe mucha confusión entre el rol del analista de datos, el científico de datos y el ingeniero de datos, esto se debe fundamentalmente que muchas habilidades y competencias de estos roles se pisan entre sí. No obstante, el título de "científico" tiene algo que no tienen los otros, justamente esa capacidad de utilizar el método científico para aportar verdadero valor a las organizaciones y generar impacto. En el post del día de hoy, les traigo una serie de recursos para fortalecer el bagaje de profesionales de la ciencia de datos. El modelo es importante, pero los supuestos lo son más  La primera recomendación, es un artículo publicado por el CFA Institute (referente en el mundo de las finanzas) que hace una critica constructiva a los profesionales que se casan con las simulaciones de Monte Carlo para realizar sus pronósticos de rendimientos futuros. La recomendación: la importancia de los supuestos y considerar en sus escenarios aquellos eventos inesperados. Má

¡De investigaciones complejas a dashboards para todos! Un viaje por el apasionante mundo de los datos

Imagen
¿Alguna vez te ha fascinado un descubrimiento científico pero te atemorizaron las ecuaciones o la jerga especializada? ¿Has deseado comprender la salud de la economía con claridad, sin perderte en un mar de estadísticas? ¿Te intriga el potencial de la inteligencia artificial para explorar fronteras matemáticas desconocidas? En este blog, abrimos las puertas a un mundo donde la complejidad se transforma en conocimiento accesible. Aquí, los datos dejan de ser números fríos y se convierten en historias vívidas que cualquiera puede comprender. Te invito a navegar en las siguientes lecturas que te ayudarán a seguir desarrollando tus conocimientos y habilidades en el mundo de los datos. Para los principiantes, Este curso desmitificará y explicará el tema del Machine Learning. En tan solo unas horas podrás comprender los conceptos y los procesos detrás de esta tecnología revolucionaria:  A Quick Introduction to Machine Learning . Para los que ya tienen más experiencia:  Anomaly Detection in T

Resumen de actividades 2023

Imagen
En 2021 inicié una tradición en este blog: dedicar un post al final del año para hacer un resumen de mis actividades extracurriculares de consultoría en ciencia de datos. El objetivo es compartir mis conocimientos y experiencias con los lectores, y este año no es la excepción. Así que, sin más preámbulos, ¡vamos a comenzar! 1. Contribuidor en la traducción de R a Python de la librería IDBSocialData del BID Artículo: IDBSocialData: código abierto para analizar temas sectoriales en América Latina y el Caribe Librería: idbsocialdata 2. Conferencia: “Las Tendencias Fintech” En el marco del programa institucional “Transferencia de Conocimientos” de la Red Global MX Capítulo España a la Universidad Politécnica del Bicentenario, que se llevó a cabo en Silao de la Victoria, Guanajuato, el 22 de febrero de 2023. 3. Miembro del Comité organizador y Maestro de Ceremonias Del Simposio Red Global MX Japón 2023: “El espacio desde la perspectiva de las personas mexicanas en el exterior” , celebrad

Artículos recomendados para científicos de datos: DataViz, aprendizaje automático, NLP, aprendizaje profundo

Imagen
1. ¿Qué hace que los datos ambientales sean útiles? Las mejoras en la tecnología y el procesamiento de datos ahora permiten que los individuos controlen los efectos de la contaminación del aire. Sin embargo, esta singularización radical plantea desafíos para una acción comunitaria de base amplia ( Impact of Social Sciences ). 2. Cómo detectar gráficos engañosos (checklist) Explora una lista de verificación (c hecklist ) completa para detectar gráficos engañosos, lo que permite una toma de decisiones informada y segura basada en: la fuente, el tipo de gráfico, los ejes y el mensaje ( Tableau Blog ). 3. Desigualdad de oportunidades educativas: Medición y resultados empíricos En este artículo se muestra que las técnicas de ML pueden superar a este enfoque tradicional en la estimación de la desigualdad de oportunidades (DOp) en el ámbito educativo. En particular, los autores encontraron que los métodos de ML proporcionan estimaciones de la DOp más altas, lo que sugiere que estos métodos p

Artículos recomendados para científicos de datos: DataViz, SVM, Pytorch, análisis de sentimiento

Imagen
Como es costumbre en este blog, esta semana toca compartirles una serie de artículos que serán de utilidad para tanto principiantes como practicantes de data science. I. Para los que inician su carrera de análisis de datos Para los nuevos, aquí les dejo un artículo con consejos para ser contratado como analista de datos, crear un portafolio de visualización de datos gratuito, conectarse con otros entusiastas de los datos, conseguir el trabajo de visualización de datos y más:  7 Ways to Stand Out and Secure Your Next Data Analytics Role ( Tableau ). El siguiente artículo es para aquellos que les gusta leer, aprender y encontrar inspiración para sus proyectos:  How mathematics built the modern world ( Work in Progress ). II. Análisis visual A continuación, les comparto una "infografía" sobre la recaudación en taquilla de las películas del Universo Cinematográfico de Marvel (MCU por sus siglas en inglés). Me gusta esta visualización, ya que combina dos objetos visuales (un gr

Recursos para científicos de datos (Python, R y Tableau)

Imagen
Desde hace algunos años me dedico a la consultoría de ciencia de datos y capacito a las organizaciones en análisis de datos e inteligencia de negocios para una mejor toma de decisiones. Por lo cual, doy fe que cada día las empresas son más conscientes que tienen que actualizarse y empezar la transformación digital a un modelo más orientado al aprovechamiento de los datos. La siguiente figura es resultado de un estudio reciente que demuestra que trabajar con IA vale la pena, ya que el valor de las habilidades de IA (aumentan los salarios de los trabajadores en un 21%) es significativamente mayor que el de las habilidades promedio (Gráfico A1). Mientras que, al examinar el valor de las habilidades de IA individualmente (Gráfico B), se observa que las habilidades relacionadas con el aprendizaje automático, es decir, ML (40%), Tensor Flow (38%), Deep Learning (27%), PNL (19%), son más valiosas que las habilidades en análisis de datos (14%) y ciencia de datos (17%), seguidas de los lenguaje

Recursos para ciencia de datos en modelos de TensorFlow y series temporales

Imagen
En el post de esta semana, les comparto una serie de artículos para los entusiastas de la ciencia de datos, interesados en modelos de TensorFlow y series temporales. Primeramente, les dejo una lista con una serie de artículos publicados en el blog Regenerative, para poner en práctica diversos modelos de TensorFlow: Basic Building Blocks of TensorFlow: Basic Operations with Tensors Introduction to GradientTape in TensorFlow TensorFlow Model Training Using GradientTape Using a Keras Tuner for Hyperparameter Tuning of a TensorFlow Model Implementation of a Siamese Network in Keras and TensorFlow Últimamente, TensorFlow está publicando los resultados de algunas colaboraciones con otras empresas del sector IT. El caso más reciente es una colaboración con Spotify, la cual se resume en el siguiente post, que lo encuentro muy recomendable para los equipos de ciencia de datos, cuando necesitan difundir y diseminar los resultados de colaboraciones como lo que está haciendo TensorFlow de Google:

Data Science Assorted Links

Imagen
Map, Filter, and CombinePerKey Transforms in Writing Apache Beam Pipelines with Examples ( Regenerative ). Pre-processing temporal data made easier with TensorFlow Decision Forests and Temporian ( TensorFlow Blog ). gingado: a machine learning library focused on economics and finance ( BIS ). The Benefits of Using Economically Meaningful Factors in Financial Data Science ( Enterprising Investor ). How to Build a Data Community Within Your Organization ( Tableau ).

La ciencia de datos: un campo interdisciplinario entre la economía, la estadística y la tecnología

Imagen
Vamos a iniciar el post del día de hoy, con una historia sobre cómo nació la ciencia de datos como la conocemos ahora... Hace 20 años empresas como Google, se dieron cuenta que tenían muchísimos datos y que necesitaban analizarlos. Para ello, Google en 2002 contrató al famoso economista Hal Varian como consultor para lo que sería en un inicio Google Trends (es experto en áreas como: diseño de las subastas de publicidad (lo que hace el Ad Sense ), econometría, finanzas, estrategia corporativa y políticas públicas). Desde entonces es el economista en jefe de Google. Así, en un principio tanto Google como las empresas tecnológicas en Silicon Valley y Seattle empezaron a contratar a economistas en sus filas para que hicieran análisis de información y visualizaciones. Con el aumento de la demanda, se creo la oferta de científico de datos como profesional (especialización, grado y posgrado). Algo curioso, es que en el camino, muchas veces las empresas no quieren al científico para que dise

Lecturas recomendadas de la semana: ciencia, tecnología, innovación y negocios

Imagen
Como cada semana, estoy muy emocionado de compartir con ustedes mis lecturas recomendadas de la semana. Estos son algunos de los artículos que más me han gustado y que creo que les encantarán. Aquí les dejo la lista: Menos startups y más campeones ocultos ( Sintetia ). Shift the Focus: From Asset to Model Management ( IBM Data Science in Practice ). Using a Quantum Annealer to Solve a Real Business Cycle Model ( Marginal Revolution ). Mentalidad de suma cero ( Nada es Gratis ). New Behavioral Economics Guide 2023 ( Behavioral Economics ). Artificial Intelligence: The Journey to a Thinking Machine ( Visual Capitalist ). Espero que les gusten estas recomendaciones y que las disfruten tanto como yo. ¡Hasta la próxima!

Artículos recomendados para extender tu expertise en ciencia de datos

Imagen
Esta semana les traigo una serie de artículos para los entusiastas de la ciencia de datos. Este listado de recursos van desde lo más sencillo de implementar hasta aquellas cuestiones que serán de interés para aquellos con mayor conocimiento o experiencia: Artículo que incluye base de datos, la cual permite descargar series temporales de tasas de pérdida de créditos:  Insights into credit loss rates: a global database ( BIS ). Análisis de datos realizado con Tableau, en el cual se discuten las distintas lecturas de la tasa de actividad , bien desde la evolución temporal o en relación a la brecha de género ( Nada es Gratis ). Para los entusiastas de R, Vincent Arel-Bundock analizó 19.000 scripts de R en el Dataverse para ver qué paquetes de R son los más utilizados por los científicos . Para los interesados en mejorar su expertise en series temporales:  Desorden y predicción en series trimestrales ( Nada es Gratis ). Paper sobre el uso de Transformadores (modelos de Deep Learning) apl

Data Science Assorted Links (18 may 2023)

Imagen
Here are assorted links for data scientist enthusiasts: The art of data: Empowering art institutions with data and analytics.   A data-driven view of key metrics can help art organizations articulate value, reshape strategy, build resilience, and achieve operational excellence  ( McKinsey ). How Tableau GPT and Tableau Pulse are reimagining the data experience:   The future of analytics is personalized, contextual, and smart ( Tableau ). Data Engineer's Guide to Python on Snowflake. In this guide, discuss Snowpark and best practices for using Python within the Snowflake Data Cloud. You will learn how: 1) Snowflake supports data engineering with Snowpark, its main benefits, and use cases. 2) Snowpark supports Python and other programming languages, in addition to SQL. 3) Data engineers can use Python efficiently and with impact within the Snowflake platform. 4) Snowpark fits into the larger Snowflake data engineering ecosystem ( Snowflake ). Serving With TF and GKE: Stable Diffu

Assorted Links: Data Science and AI Governance

Imagen
Here some data science good readings to start the week: Missing values of baseline covariates in RCTs How to make user-written Stata commands really reproducible Qualitative Analysis with Representative Samples Counterfactual Logit Pairing Furthermore, for those interested in learning more about the AI Governance. This is a series of blogs on IBM AI Governance: Part 1:  The Need for AI Governance Part 2:  3 Key Areas of AI Governance Part 3:  Top 4 Applications of AI Governance Feel free to follow me on Twitter

Artículos recomendados para cientifícos de datos: Agile, BloombergGPT, RDD, TensorFlow con MATLAB, equidad en el aprendizaje automático

Imagen
El día de hoy, te voy a compartir una serie de artículos relacionados con la ciencia de datos, para que los revises con calma este fin de semana. Mi primera recomendación, es para aquellos que no están familiarizados con las metodologías ágiles:  What is agile? ( McKinsey ). Hace un par de semana les compartía algunas de las aplicaciones de ChatGPT en economía y finanzas , para los interesados en la aplicación de los LLM (Gran Modelo Lingüístico) para las finanzas, Bloomberg ha sacado su propio BloombergGPT. Aquí un artículo de Bloomberg donde explican de qué se trata su propio modelo y acá el paper . Para los más avanzados, aquí les dejo un post con recomendaciones para graficar un Diseño de Regresión Discontinua (RDD):  How should you draw an RDD graph? ( Development Impact ). Siguiendo la línea del análisis visual, ahora les dejo un recurso para los que trabajen con Tableau:  Unlock the Power of Personalized Analytics with User Attribute Functions (UAF) . MATLAB, es un software

Artículos recomendados para científicos de datos (31 de marzo de 2023)

Imagen
Se acerca el fin de semana, y para los entusiastas que nunca paran de aprender sobre el fascinante mundo de la ciencia de datos, aquí les dejo algunos recursos para revisarlos con calma: Por qué necesitamos datos precisos sobre sexo biológico para el análisis económico ( Nada es Gratis ). Stata linter produces Stata code that sparks joy ( Development Impact ). How Vodafone Uses TensorFlow Data Validation in their Data Contracts to Elevate Data Governance at Scale ( TensorFlow Blog ). Easy Method of Edge Detection in OpenCV Python ( Regenerative ). Feature Platforms: A New Paradigm in Machine Learning Operations (MLOps) ( IBM Data Science in Practice ). Hasta aquí el post del día de hoy y recuerda que puedes seguirme en Twitter y mantenerte informado de lo último de ciencia, tecnología e innovación en el mundo de la economía y las finanzas. ¡Hasta la próxima!