Entradas

Mostrando las entradas etiquetadas como Econometría

La ciencia de datos en economía y finanzas

Imagen
¿Qué significa hacer ciencia social empírica? Para muchos de nosotros, la mayor parte del tiempo, lo que significa es escribir y depurar código. ( Gentzkow y Shapiro, 2014 ) Sin duda alguna, la ciencia de datos es un campo interdisciplinario entre la economía, la estadística y la tecnología . Para algunos,  la economía es un campo de la ingeniería de software , y si no lo creen así, está claro que, al menos, la economía debería de adoptar más normas y buenas prácticas de la ingeniería de software. Reproducibilidad del código Justo el año pasado, les comentaba que había tomado un curso de actualización sobre "Investigación Reproducible" del Departamento de Evaluación de Impacto en el Desarrollo (DIME) del Banco Mundial, este curso no es otra cosa que normas y buenas prácticas en nuestros códigos y scripts, que permitan compartir y reproducir nuestros resultados, es decir, ciencia abierta basada en datos y código. Aquí les dejo un excelente artículo de LSE Impact Blog sobre ...

Data Science recommended lectures: Data literacy, hierarchical clustering, TensorFlow, Keras, Python, Bayesian statistics

Imagen
Data science is a field that stands at the crossroads of statistics, computer science, and domain expertise, offering insights and solutions that are transforming industries across the globe. Whether you're a seasoned data professional or just starting out, the journey of learning never truly ends. This blog post aims to introduce a curated list of lectures that cater to a wide range of learners, from those seeking to grasp the basics of data literacy to advanced practitioners looking to fine-tune their models with the latest techniques. Data Literacy Basics Everyone Should Know ( Tableau Blog ). For Beginners: Start your AI learning journey with IBM Learning for free here . Implement hierarchical clustering in Python ( IBM ). EarlyStopping and LiveLossPlot Callbacks in TensorFlow, Keras, and Python ( Regenerative ). Convolutional Neural Network in TensorFlow and Python - Keras Tuner For Hyperparameter Tuning ( Regenerative ). Which books, papers, and blogs are in the Bayesian...

Recommended data science assorted links (data governance, data mentor, multi-fact analysis, TensorFlow and Time Series)

Imagen
Diving into the world of data science can feel like navigating through a vast ocean of information. Each day, new tools, techniques, and discoveries emerge, making it an exciting yet overwhelming field to keep up with. In this blog post, we're curating a collection of assorted links that will serve as your compass, guiding you through the latest trends, insightful articles, and must-read resources in the realm of data science. Whether you're a seasoned data scientist looking to sharpen your skills or a newcomer eager to explore the field, these carefully selected links will provide you with a wealth of knowledge and a fresh perspective on the ever-evolving landscape of data-driven insights. Join us as we embark on a journey to uncover the treasures of data science, one link at a time. Are Your Data Governance and Management Practices Keeping Pace with the AI Boom? 5 Tips from a Data Career Mentor When and How to Use Multi-fact Relationships in Tableau A Complete Regression Mod...

Artículos recomendados de la semana

Imagen
En el post de esta semana, les traigo una serie de artículos que dan seguimiento a varios temas tratados en este blog (inversiones financieras, superpronosticadores e inversión en I+D). Pero eso no será todo, también les comparto al final de esta entrada otras lecturas de interés para investigadores, hacedores de políticas y tomadores de decisiones. I. Inversión Aquí te dejo una infografía que reúne los 10 errores más comunes al momento de invertir, el cual complementa muy bien con mi post con algunas ideas y consejos para invertir . II. Pronosticadores Desde hace un tiempo he traído a colación el tema de los llamados "superpronosticadores": Cómo sería un superpronosticador , Cómo convertirte en un superpronosticador y, ¿Qué tan buenos son los superpronosticadores? El siguiente artículo trata de dar respuesta a la pregunta:  ¿Quién es mejor pronosticador: los humanos o la IA generativa? . Spoiler, la respuesta va en esta dirección:  En la actualidad el reto es ser más creat...

Recursos para ciencia de datos en modelos de TensorFlow y series temporales

Imagen
En el post de esta semana, les comparto una serie de artículos para los entusiastas de la ciencia de datos, interesados en modelos de TensorFlow y series temporales. Primeramente, les dejo una lista con una serie de artículos publicados en el blog Regenerative, para poner en práctica diversos modelos de TensorFlow: Basic Building Blocks of TensorFlow: Basic Operations with Tensors Introduction to GradientTape in TensorFlow TensorFlow Model Training Using GradientTape Using a Keras Tuner for Hyperparameter Tuning of a TensorFlow Model Implementation of a Siamese Network in Keras and TensorFlow Últimamente, TensorFlow está publicando los resultados de algunas colaboraciones con otras empresas del sector IT. El caso más reciente es una colaboración con Spotify, la cual se resume en el siguiente post, que lo encuentro muy recomendable para los equipos de ciencia de datos, cuando necesitan difundir y diseminar los resultados de colaboraciones como lo que está haciendo TensorFlow de Google:...

Recursos para realizar evaluaciones de impacto

Imagen
Para aquellos que no estén familiarizados con la evaluación de impacto, ésta evalúa los cambios que se pueden atribuir a una intervención en particular, como un proyecto, programa o política pública. Así, una evaluación de impacto proporciona información sobre los cambios observados o 'impactos' producidos por una intervención. Estos cambios observados pueden ser positivos y negativos, intencionados y no intencionados, directos e indirectos. Una evaluación de impacto debe establecer la causa de los cambios observados ( Better Evaluation ). Un buen ejemplo de evaluación de impacto, es este artículo que realiza un análisis de la política del Ingreso Mínimo Vital en España: ¿Qué impacto ha tenido el Ingreso Mínimo Vital sobre la situación económica de los hogares? ( Nada es Gratis ). El día de hoy, les voy a dejar una buena serie de recursos que les serán de ayuda para fortalecer sus conocimientos y herramientas metodológicas para económetras, científicos de datos y evaluadores ...

Artículos recomendados para científicos de datos

Imagen
En la visualización que abre el post del día de hoy, destaca como el nivel del poder adquisitivo del salario mínimo federal en los Estados Unidos está en su punto más bajo desde diciembre de 1949. Como buena práctica el autor nos comparte los datos y el código que utilizó para crear la figura. En este post de Google nos explica cómo v isualizar e interpretar los árboles de decisión con TensorFlow. En el blog de Tryolabs, nos enseñan en dos entregas cómo elaborar estrategias de precios. En la primera parte , nos introducen a su simulador de mercado. En la segunda parte , nos muestran la e xploración de escenarios de mercado complejos. Finalmente,  ¿Qué hacer con las tendencias paralelas cuando sólo se dispone de datos de referencia? Hasta aquí el post del día de hoy y recuerda que puedes seguirme en Twitter y mantenerte informado de lo último de ciencia, tecnología e innovación en el mundo de la economía y las finanzas. ¡Hasta la próxima!

Artículos recomendados para extender tu expertise en ciencia de datos

Imagen
Esta semana les traigo una serie de artículos para los entusiastas de la ciencia de datos. Este listado de recursos van desde lo más sencillo de implementar hasta aquellas cuestiones que serán de interés para aquellos con mayor conocimiento o experiencia: Artículo que incluye base de datos, la cual permite descargar series temporales de tasas de pérdida de créditos:  Insights into credit loss rates: a global database ( BIS ). Análisis de datos realizado con Tableau, en el cual se discuten las distintas lecturas de la tasa de actividad , bien desde la evolución temporal o en relación a la brecha de género ( Nada es Gratis ). Para los entusiastas de R, Vincent Arel-Bundock analizó 19.000 scripts de R en el Dataverse para ver qué paquetes de R son los más utilizados por los científicos . Para los interesados en mejorar su expertise en series temporales:  Desorden y predicción en series trimestrales ( Nada es Gratis ). Paper sobre el uso de Transformadores (modelos de Deep...

Data Science Assorted Links (18 may 2023)

Imagen
Here are assorted links for data scientist enthusiasts: The art of data: Empowering art institutions with data and analytics.   A data-driven view of key metrics can help art organizations articulate value, reshape strategy, build resilience, and achieve operational excellence  ( McKinsey ). How Tableau GPT and Tableau Pulse are reimagining the data experience:   The future of analytics is personalized, contextual, and smart ( Tableau ). Data Engineer's Guide to Python on Snowflake. In this guide, discuss Snowpark and best practices for using Python within the Snowflake Data Cloud. You will learn how: 1) Snowflake supports data engineering with Snowpark, its main benefits, and use cases. 2) Snowpark supports Python and other programming languages, in addition to SQL. 3) Data engineers can use Python efficiently and with impact within the Snowflake platform. 4) Snowpark fits into the larger Snowflake data engineering ecosystem ( Snowflake ). Serving With TF and GKE: St...

Assorted Links: Data Science and AI Governance

Imagen
Here some data science good readings to start the week: Missing values of baseline covariates in RCTs How to make user-written Stata commands really reproducible Qualitative Analysis with Representative Samples Counterfactual Logit Pairing Furthermore, for those interested in learning more about the AI Governance. This is a series of blogs on IBM AI Governance: Part 1:  The Need for AI Governance Part 2:  3 Key Areas of AI Governance Part 3:  Top 4 Applications of AI Governance Feel free to follow me on Twitter

Aplicaciones de ChatGPT en economía y finanzas

Imagen
Fuente: Our World in Data El 30 de noviembre de 2022, se lanzó de manera gratuita el ChatGPT, un chatbot de inteligencia artificial de red neuronal de aprendizaje profundo desarrollado por OpenAI , pertenece a la familia de modelos lingüísticos del Transformador Generativo Preentrenado (GPT por sus siglas en inglés). Desde su lanzamiento, las redes sociales y los medios, no han dejado de realizar consultas, pruebas y experimentos con el chatbot. El post del día de hoy, les comparto una serie de lecturas que nos pueden dar una clara idea (comprobada) de lo que puede hacer actualmente este tipo de tecnología en economía y finanzas. El Instituto CFA (un referente para los profesionales en finanzas) no se ha querido quedar atrás en el tema y ha publicado un artículo que discute sobre los orígenes, el revuelo, y la oportunidad que supone el famoso ChatGPT. Otro artículo bastante interesante es el que nos trae el economista experto en inferencia causal y econometría,  Scott...

Lecturas recomendadas de la semana: incertidumbre y estanflación; innovación y tecnologías disruptivas; Premio Nobel de Economía 2021

Imagen
Esta semana les traigo tres temas a colación. El primero, sobre las voces que alarman sobre la estanflación o al extremo del relato de aquellos que ven venir una crisis. En nuestro segundo bloque, les comparto evidencia de el valor que aporta tanto a las empresas como a la economía invertir en innovación. Por último pero no menos importante, para aquellos que no lo saben ya, hablarles un poco sobre los laureados con el Premio Nobel en Economía de este año. Dicho todo esto, comenzamos... Para nuestro primer punto a tratar el día de hoy, les comparto dos entradas de blog pertenecientes al FMI y al BID. El primero de ellos, trata el tema de la incertidumbre que se apodera de los mercados mientras el optimismo se desvanece . Por su parte, el segundo (de donde extraje la primera imagen del post de hoy) se centra más en el tema de la inflación y sus repercusiones sobre los pobres en la era de la COVID-19 . Como analista de datos, no puedo evitar señalar que una imagen vale más que mil palab...

Recommended Readings and Resources for Social Data Scientists (weekly links June 10)

Imagen
The Use of Data Using Data Analytics as a Source for Change  ( Knowledge@Wharton ). Regulating personal data : Linking different models to digital services trade  ( VoxEU ). The Importance of Statistics On Thinking Machines, Machine Learning, And How AI Took Over Statistics ( Forbes ). Spot the Logical Fallacy : some useful errors that might also apply to other fields ( The Big Picture ). Statistics (Philosophy) Quiz: See If You Really Know What You’re Doing Using Tests ( William M. Briggs ). Learning Resources Exploratory Data Analysis, Visualization, Prediction Model in Python ( Regenerative ). Text Files Processing, Cleaning, and Classification of Documents in R ( Regenerative ). Dissecting 1-Way ANOVA and ANCOVA with Examples in R ( Regenerative ). Data and Analytics  resources from Development Impact Evaluation (DIME) of the World Bank.  Feel free to follow me on Twitter Have a nice weekend!

Some Data Science assorted links: Business Intelligence, Data Visualization, Image Classification, Diff-in-Diff, Artificial Intelligence, and Natural Language Processing

Imagen
My recommended readings for this weekend: What is Tableau Business Science? ( Tableau ). How To Effectively Utilize Data Visualization ( Rootstrap ). A Complete Image Classification Project Using Logistic Regression Algorithm ( Regenerative ). An Adversarial or “Long and Squiggly” Test of the Plausibility of Parallel Trends in Difference-in-Differences Analysis ( Development Impact ). AI-powered decision making for the bank of the future ( McKinsey ). The 7 big myths about AI in traditional businesses ( Tryolabs ). Sensemaking and Lens-Shaping: Identifying Citizen Contributions to Foresight through Comparative Topic Modelling ( Futures ). Feel free to follow me on Twitter

Recommended articles for Data Scientists: ANOVA, Statistical Inference, Seaborn, Heat Maps with STATA and Text-Based Analysis in Finance

Imagen
Details of Simple Linear Regression, Assessment, and Inference using ANOVA ( Regenerative ). What do you need to do to make a matching estimator convincing? Rhetorical vs statistical checks ( Development Impact ). Solutions For Common Problems in Data Science ( Rootstrap ). An Ultimate Cheat Sheet for Stylish Data Visualization in Python's Seaborn Library ( Regenerative ). COVID-19 visualizations with Stata Part 4: Maps ( Medium ). Fraud and Deception Detection: Text-Based Analysis ( CFA Institute ). Feel free to follow me on Twitter

Recommended Articles: Data Science and Machine Learning applied to Finance

Imagen
Article: Applying machine learning in capital markets: Pricing, valuation adjustments, and market risk ( McKinsey ). Report: FX execution algorithms and market functioning ( BIS ). Study:   Central bank digital currencies: Drivers, approaches, and technologies ( VoxEU ). Impact Evaluation methodologies and techniques: New visual libraries for R and Stata users Different-sized baskets of fruit: How unequally-sized clusters can lead your power calculations and analysis astray When your difference-in-differences has too many differences Last but not least:  Data Science Virtual Salon: Retail & E-Commerce ( Tryolabs ).

7 días, 7 lecturas recomendadas para la semana

Imagen
Fig. 1 Nuestra primera lectura recomendada de la semana, está relacionada con la Fig. 1. y un interesante artículo de actualidad, que nos presenta 5 lecciones del seguimiento de la economía mundial de la pandemia ( VoxEU ). En este blog ya hemos hablado sobre la importancia de que la banca se digitalice. Con la actual pandemia, esta necesidad se ha hecho prioritaria. Aquí, un artículo con recomendaciones de cómo transformar la banca latinoamericana ( McKinsey ). El siguiente artículo, resulta de interés para los que trabajamos con la visualización de los datos y las buenas prácticas. Concretamente, nos relata lo que hay que saber sobre los datos de la violencia policial ( Tableau ). Justo la semana pasada, les recomendaba un artículo sobre la suscripción on-line como modelo de negocio en la industria de los videojuegos . Pues hoy, estamos de suerte y aquí les dejo una infografía sobre los juegos en línea y el auge de una industria multimillonaria ( Visual Capit...

Recommended articles: Impact Evaluation, Data Visualization and Advanced Analytics

Imagen
For today, we have 3x3 recommended links in impact evaluation, data visualization, and advanced analytics. Enjoy! Impact Evaluation: An overview of multiple hypothesis testing commands in Stata Difference-in-differences in practice: The case of mobile phones and farmers’ productivity A round-up of recent questions from my mailbox: verifying randomization, balance tests, treatment heterogeneity, and multiple testing in DiD Data Visualization: Really nice collection of analytics and charts at How We Reopen Safely How to viz responsibly as you work with data on systemic racism in the U.S. Become a Metrics Jedi: 10 tips and tricks for creating Metrics Advanced Analytics: The investigator-centered approach to financial crime: Doing what matters How artificial intelligence can improve resilience in mineral processing during uncertain times Using analytics to get European rail maintenance on track

Una introducción al Análisis de Datos

Imagen
La rápida evolución de las TICs en los últimos años, ha permitido a la sociedad de hoy en día, la capacidad de generar, recolectar, almacenar y procesar inmensas cantidades de datos. En términos generales, al proceso de análisis de grandes volúmenes de datos ( Big Data ) se le conoce como Business Intelligence (BI). En el post de hoy, les hablare sobre unos conceptos y definiciones básicos del análisis de datos o BI. Primeramente, podemos partir de que el análisis de Big Data, requiere de equipos multidisciplinares de profesionales especializados en sus distintas etapas: Definir los objetivos y el problema de negocio. Traducir el problema en un proyecto basado en datos con una pregunta de investigación. Seleccionar datos y desarrollar el modelo. Obtener, explorar, limpiar y transformar datos. Analizar los datos y resultados. Traducir los resultados en alternativas de decisión y acciones. Concretamente, según un artículo de HBR , los perfiles profesionales vincul...

Data Analytics with Tableau: The Trend Lines Models

Imagen
Abstract: Tableau is a Business Intelligence and analytics software that helps data scientists and researcher analyze data. The main objective is to show how works the trend lines models in Tableau. We compare the results between the models and give some recommendation to choose the best trend model based on their data and know how to best interpret the statistical summary of their regression models. The database contains the Market Risk Premium (MRP) from seven Latin America countries from 2012 to 2018. We execute all trend Line models available in Tableau with his respective visual and data analysis. We find that all estimated models have good fit measures. In this case, the best model is the linear trend model. Finally, the visual analysis shows a constant tendency in the region and the exceptions that, we expected to up or down from the average for the rest of the region. Keywords: Market Risk Premium, Trend Lines, Visual Analytics, Latin America, Tableau. Zorrilla...