Entradas

Mostrando las entradas etiquetadas como Análisis de Datos

A 20 años del artículo seminal: Las etapas del empresario y la empresa moderna

Imagen
¡20 años ya! Parece mentira que fue ayer cuando publiqué mi primer artículo en Internet, titulado Las etapas del empresario y la empresa moderna . Publicado en  Gestiopolis  (en realidad sería una segunda versión revisada de un artículo publicado varios meses atrás en un website de consultoría de negocios en Chile) este texto no solo tuvo una gran acogida, sino que marcó el inicio de un camino lleno de aprendizaje y crecimiento profesional. Aquel primer artículo, nacido de la experiencia y la reflexión, fue solo el comienzo. Invitaciones a publicar en otros espacios digitales, como la  Revista Contribuciones a la Economía , se multiplicaron, impulsando la difusión de ideas y conocimientos. Más de 30 publicaciones científicas ( ORCiD ) avalan una trayectoria dedicada a la investigación y a la publicación de  artículos de divulgación . Cada artículo, cada línea escrita, refleja el compromiso con el aprendizaje continuo y la búsqueda de respuestas a los desafíos del mundo empresarial act

Construye tu futuro en ciencia de datos: domina la reproducibilidad, explora recursos y descubre aplicaciones prácticas

Imagen
Reproducibilidad Retomando la discusión sobre la importancia de la reproducibilidad del código publicada en un post anterior . Les cuento que en 2019, la revista Management Science introdujo una política que exige a los autores que pongan a disposición sus materiales de estudio. Aprovechando esto como una oportunidad, un grupo de investigadores se dio a la tarea de evaluar el impacto de la política y el estado de la reproducibilidad de los estudios. Los autores señalan que la reproducibilidad es una característica esencial de los resultados de investigación confiables, pero no puede garantizar la replicabilidad ( LSE Impact Blog ). Recursos para aprender ciencia de datos Paul Goldsmith-Pinkham (profesor en la Escuela de Administración de Yale) comparte notas de conferencias escritas para su curso de doctorado sobre métodos empíricos aplicados. También diapositivas, preguntas de exámenes y más ( GitHub ). Árboles de decisión en python con sklearn ( Regenerative ). Graficar redes neuron

Cómo triunfar como científico de datos: los recursos que necesitas

Imagen
Hoy en día existe mucha confusión entre el rol del analista de datos, el científico de datos y el ingeniero de datos, esto se debe fundamentalmente que muchas habilidades y competencias de estos roles se pisan entre sí. No obstante, el título de "científico" tiene algo que no tienen los otros, justamente esa capacidad de utilizar el método científico para aportar verdadero valor a las organizaciones y generar impacto. En el post del día de hoy, les traigo una serie de recursos para fortalecer el bagaje de profesionales de la ciencia de datos. El modelo es importante, pero los supuestos lo son más  La primera recomendación, es un artículo publicado por el CFA Institute (referente en el mundo de las finanzas) que hace una critica constructiva a los profesionales que se casan con las simulaciones de Monte Carlo para realizar sus pronósticos de rendimientos futuros. La recomendación: la importancia de los supuestos y considerar en sus escenarios aquellos eventos inesperados. Má

¡De investigaciones complejas a dashboards para todos! Un viaje por el apasionante mundo de los datos

Imagen
¿Alguna vez te ha fascinado un descubrimiento científico pero te atemorizaron las ecuaciones o la jerga especializada? ¿Has deseado comprender la salud de la economía con claridad, sin perderte en un mar de estadísticas? ¿Te intriga el potencial de la inteligencia artificial para explorar fronteras matemáticas desconocidas? En este blog, abrimos las puertas a un mundo donde la complejidad se transforma en conocimiento accesible. Aquí, los datos dejan de ser números fríos y se convierten en historias vívidas que cualquiera puede comprender. Te invito a navegar en las siguientes lecturas que te ayudarán a seguir desarrollando tus conocimientos y habilidades en el mundo de los datos. Para los principiantes, Este curso desmitificará y explicará el tema del Machine Learning. En tan solo unas horas podrás comprender los conceptos y los procesos detrás de esta tecnología revolucionaria:  A Quick Introduction to Machine Learning . Para los que ya tienen más experiencia:  Anomaly Detection in T

Artículos recomendados para científicos de datos: DataViz, aprendizaje automático, NLP, aprendizaje profundo

Imagen
1. ¿Qué hace que los datos ambientales sean útiles? Las mejoras en la tecnología y el procesamiento de datos ahora permiten que los individuos controlen los efectos de la contaminación del aire. Sin embargo, esta singularización radical plantea desafíos para una acción comunitaria de base amplia ( Impact of Social Sciences ). 2. Cómo detectar gráficos engañosos (checklist) Explora una lista de verificación (c hecklist ) completa para detectar gráficos engañosos, lo que permite una toma de decisiones informada y segura basada en: la fuente, el tipo de gráfico, los ejes y el mensaje ( Tableau Blog ). 3. Desigualdad de oportunidades educativas: Medición y resultados empíricos En este artículo se muestra que las técnicas de ML pueden superar a este enfoque tradicional en la estimación de la desigualdad de oportunidades (DOp) en el ámbito educativo. En particular, los autores encontraron que los métodos de ML proporcionan estimaciones de la DOp más altas, lo que sugiere que estos métodos p

Artículos recomendados para científicos de datos: DataViz, SVM, Pytorch, análisis de sentimiento

Imagen
Como es costumbre en este blog, esta semana toca compartirles una serie de artículos que serán de utilidad para tanto principiantes como practicantes de data science. I. Para los que inician su carrera de análisis de datos Para los nuevos, aquí les dejo un artículo con consejos para ser contratado como analista de datos, crear un portafolio de visualización de datos gratuito, conectarse con otros entusiastas de los datos, conseguir el trabajo de visualización de datos y más:  7 Ways to Stand Out and Secure Your Next Data Analytics Role ( Tableau ). El siguiente artículo es para aquellos que les gusta leer, aprender y encontrar inspiración para sus proyectos:  How mathematics built the modern world ( Work in Progress ). II. Análisis visual A continuación, les comparto una "infografía" sobre la recaudación en taquilla de las películas del Universo Cinematográfico de Marvel (MCU por sus siglas en inglés). Me gusta esta visualización, ya que combina dos objetos visuales (un gr

Recursos para científicos de datos (Python, R y Tableau)

Imagen
Desde hace algunos años me dedico a la consultoría de ciencia de datos y capacito a las organizaciones en análisis de datos e inteligencia de negocios para una mejor toma de decisiones. Por lo cual, doy fe que cada día las empresas son más conscientes que tienen que actualizarse y empezar la transformación digital a un modelo más orientado al aprovechamiento de los datos. La siguiente figura es resultado de un estudio reciente que demuestra que trabajar con IA vale la pena, ya que el valor de las habilidades de IA (aumentan los salarios de los trabajadores en un 21%) es significativamente mayor que el de las habilidades promedio (Gráfico A1). Mientras que, al examinar el valor de las habilidades de IA individualmente (Gráfico B), se observa que las habilidades relacionadas con el aprendizaje automático, es decir, ML (40%), Tensor Flow (38%), Deep Learning (27%), PNL (19%), son más valiosas que las habilidades en análisis de datos (14%) y ciencia de datos (17%), seguidas de los lenguaje

La ciencia de datos: un campo interdisciplinario entre la economía, la estadística y la tecnología

Imagen
Vamos a iniciar el post del día de hoy, con una historia sobre cómo nació la ciencia de datos como la conocemos ahora... Hace 20 años empresas como Google, se dieron cuenta que tenían muchísimos datos y que necesitaban analizarlos. Para ello, Google en 2002 contrató al famoso economista Hal Varian como consultor para lo que sería en un inicio Google Trends (es experto en áreas como: diseño de las subastas de publicidad (lo que hace el Ad Sense ), econometría, finanzas, estrategia corporativa y políticas públicas). Desde entonces es el economista en jefe de Google. Así, en un principio tanto Google como las empresas tecnológicas en Silicon Valley y Seattle empezaron a contratar a economistas en sus filas para que hicieran análisis de información y visualizaciones. Con el aumento de la demanda, se creo la oferta de científico de datos como profesional (especialización, grado y posgrado). Algo curioso, es que en el camino, muchas veces las empresas no quieren al científico para que dise

Lecturas económicas de la primera semana de julio de 2023: mercados laborales, objetivo de inflación, políticas comercio exterior y pymes basadas en datos

Imagen
1. Análisis comparado de mercados laborales Viví años en España y me tocó la crisis financiera internacional del 2007/2008 y este blog se convirtió en una bitácora durante mucho tiempo del desarrollo de la crisis española, por lo que un análisis de cómo terminó la historia (si se puede decir que ha terminado) es interesante. Recientemente, el artículo  Grecia vs España. Crónica de dos recuperaciones: demografía y empleo , analiza las diferencias entre Grecia y España en cuanto al mercado laboral y la recuperación económica tras la crisis financiera de 2008.  2. Objetivo de inflación Hablar de inflación es hablar de un tema complejo, la idea es que una inflación buena sería por debajo del 2 %, mientras que los niveles de inflación por debajo del 4 % se consideran aceptables. Desde hace algunos años vivo en Uruguay, un país que su objetivo de inflación es el 7 % y les puedo asegurar que ese objetivo hace terriblemente costosa y difícil el nivel de vida en este país. A principios de este

Artículos recomendados para científicos de datos

Imagen
En la visualización que abre el post del día de hoy, destaca como el nivel del poder adquisitivo del salario mínimo federal en los Estados Unidos está en su punto más bajo desde diciembre de 1949. Como buena práctica el autor nos comparte los datos y el código que utilizó para crear la figura. En este post de Google nos explica cómo v isualizar e interpretar los árboles de decisión con TensorFlow. En el blog de Tryolabs, nos enseñan en dos entregas cómo elaborar estrategias de precios. En la primera parte , nos introducen a su simulador de mercado. En la segunda parte , nos muestran la e xploración de escenarios de mercado complejos. Finalmente,  ¿Qué hacer con las tendencias paralelas cuando sólo se dispone de datos de referencia? Hasta aquí el post del día de hoy y recuerda que puedes seguirme en Twitter y mantenerte informado de lo último de ciencia, tecnología e innovación en el mundo de la economía y las finanzas. ¡Hasta la próxima!

Assorted Links: Data Science and AI Governance

Imagen
Here some data science good readings to start the week: Missing values of baseline covariates in RCTs How to make user-written Stata commands really reproducible Qualitative Analysis with Representative Samples Counterfactual Logit Pairing Furthermore, for those interested in learning more about the AI Governance. This is a series of blogs on IBM AI Governance: Part 1:  The Need for AI Governance Part 2:  3 Key Areas of AI Governance Part 3:  Top 4 Applications of AI Governance Feel free to follow me on Twitter

Artículos recomendados para cientifícos de datos: Agile, BloombergGPT, RDD, TensorFlow con MATLAB, equidad en el aprendizaje automático

Imagen
El día de hoy, te voy a compartir una serie de artículos relacionados con la ciencia de datos, para que los revises con calma este fin de semana. Mi primera recomendación, es para aquellos que no están familiarizados con las metodologías ágiles:  What is agile? ( McKinsey ). Hace un par de semana les compartía algunas de las aplicaciones de ChatGPT en economía y finanzas , para los interesados en la aplicación de los LLM (Gran Modelo Lingüístico) para las finanzas, Bloomberg ha sacado su propio BloombergGPT. Aquí un artículo de Bloomberg donde explican de qué se trata su propio modelo y acá el paper . Para los más avanzados, aquí les dejo un post con recomendaciones para graficar un Diseño de Regresión Discontinua (RDD):  How should you draw an RDD graph? ( Development Impact ). Siguiendo la línea del análisis visual, ahora les dejo un recurso para los que trabajen con Tableau:  Unlock the Power of Personalized Analytics with User Attribute Functions (UAF) . MATLAB, es un software

Artículos recomendados para científicos de datos (31 de marzo de 2023)

Imagen
Se acerca el fin de semana, y para los entusiastas que nunca paran de aprender sobre el fascinante mundo de la ciencia de datos, aquí les dejo algunos recursos para revisarlos con calma: Por qué necesitamos datos precisos sobre sexo biológico para el análisis económico ( Nada es Gratis ). Stata linter produces Stata code that sparks joy ( Development Impact ). How Vodafone Uses TensorFlow Data Validation in their Data Contracts to Elevate Data Governance at Scale ( TensorFlow Blog ). Easy Method of Edge Detection in OpenCV Python ( Regenerative ). Feature Platforms: A New Paradigm in Machine Learning Operations (MLOps) ( IBM Data Science in Practice ). Hasta aquí el post del día de hoy y recuerda que puedes seguirme en Twitter y mantenerte informado de lo último de ciencia, tecnología e innovación en el mundo de la economía y las finanzas. ¡Hasta la próxima!

Data science assorted links (datasets, methodologies, practice, dataviz good practices)

Imagen
Data Overcoming original sin: insights from a new dataset ( BIS ). LLaMA: Open and Efficient Foundation Language Models ( Meta ). Methodology Expanding the usability of remote sensing data in development ( Development Impact ). Practice How to Perform Image Segmentation with Thresholding Using OpenCV ( Regenerative ). Just for AI Titans — Autonomous & Continuous AI Training - MLOPS on steroids ( IBM Data Science in Practice ). DataViz & BI Good Practices Macro Snapshot / St. Louis Fed ( The Big Picture ). What is the Most Successful Hollywood Movie of All Time? ( Information is beautiful ). Feel free to follow me on Twitter

Enlaces recomendados para científicos de datos: cursos gratuitos, novedades y la visualización de la semana

Imagen
El día de hoy, les comparto algunas novedades enfocadas a las tecnologías (Tableau, IBM y Google) que un científico de datos debe de manejar día a día, tres recursos para realizar cursos gratuitos. Finalmente, la visualización de la semana realizada con Python. Novedades DataFam Roundup: February 6 - 10, 2023 . Un blog semanal de Tableau que reúne las tendencias de la comunidad en una sola entrada. Updates: TensorFlow Decision Forests is production ready . En este post, te muestra todas las novedades que trae la librería  TensorFlow Decision Forests . Cloud Pak for Data 4.6 Code Experience with VS Code Integration . Este artículo ofrece una visión general de la experiencia de código para los científicos de datos en Watson Studio en Cloud Pak for Data 4.6 de IBM. Cubre la nueva integración mejorada de VS Code Desktop y la integración de JupyterLab y RStudio . La integración de escritorio de VS Code permite a los científicos de datos utilizar un IDE familiar para ejecutar y depurar c

Data Science assorted links

Imagen
How open source software shapes AI .  Paper here . Infographic: Generative AI Explained by AI (Visual Capitalist). Clearing data-quality roadblocks: Unlocking AI in manufacturing (McKinsey). Predict building energy consumption using AutoAI (IBM). What is Tableau Public’s Viz of the Day?   (How) Should I stratify when randomizing at the group level?  (World Bank). Feel free to follow me on Twitter

Los precios de los discos de vinilo de colección: un experimento empírico

Imagen
Ventas de discos de vinilo en los EE.UU. desde 1973 hasta 2021 (millones de unidades) 1. Una breve línea de tiempo de los formatos musicales En 1948, Columbia Records introdujo los discos de vinilo . En 1979, se lanza el Walkman de Sony que alcanza una popularidad como formato musical durante la década de los años ochentas. El disco compacto de audio digital, comúnmente conocido como CD, se inventó en 1979 como un proyecto de desarrollo conjunto de Sony y Philips. No obstante, su lanzamiento público se produjo en 1982, cuando "The Visitors" de la agrupación Abba hizo historia como el primer disco editado en este formato. Cabe destacar que por cuestiones de precios, dicho formato no alcanzaría su popularidad hasta finales de los 80s. Desarrollado a principios de los 80s como un trabajo posdoctoral en los laboratorios Bell de AT&T, el MP3 amplió los códecs preexistentes para comprimir audio. Sin embargo, el MP3 no se generalizó su uso  en Internet hasta 1992. Pero no se