La ciencia y el conocimiento detrás de la toma de decisiones basada en datos

En la entrada del día de hoy, les hablaré sobre dos aspectos fundamentales de la ciencia de datos. Por una parte, por qué es tan importante promover la alfabetización y la cultura de los datos en las organizaciones. Por la otra, la relevancia de aplicar el método científico para el tratamiento de los datos.

La alfabetización y cultura de los datos

El año pasado, me dí a la tarea de impartir webinars con el objetivo de la alfabetización de los datos (ver vídeos), ya que la alfabetización en datos es la clave para tomar mejores decisiones, innovar y crear organizaciones basadas en datos (Tableau). Así como, sin una alfabetización universal en Inteligencia Artificial, ésta nos fallará (WEF). También te podría interesar: The Economics of Data Businesses (Pivotal).

El método científico para el tratamiento de los datos

Una de las grandes confusiones en el análisis de datos y en el data science, es la ansiedad de los jóvenes en programar sin saber estadística y matemática. Aunado, que en las economías menos desarrolladas, los empleadores y los tomadores de decisiones, no distinguen la diferencia entre lo que puede y lo que no es capaz de hacer, un analista con maestría y un científico de datos con doctorado.

Por lo anterior, es importante aprender técnicas para el análisis de causalidad, que aplican por igual en otras áreas (Enterprising Investor). Además, algunas consideraciones cuando trabajamos con Variables Instrumentales y posibles diseños en la industria (Causal Inference: the Remix).

Pero no todo es teoría, también podemos ver como aplicar la metodología de investigación al análisis de texto: Eliciting people's first-order concerns: Text analysis of open-ended survey questions (VoxEU).

Para los que ya saben Python aquí dos recursos que podrían ser de su interés:
  • Chi-Square Test for Correlation Test in Details: Manual and Python Implementation (Regenerative).
  • (NICHeD)ata Science Solutions: Classifying Pregnancy Morbidity Risk using Health Metric Deltas with IBM CloudPak for Data (IBM Data Science in Practice).
Hasta aquí el post del día de hoy y recuerda que puedes seguirme en Twitter y mantenerte informado de lo último de ciencia, tecnología e innovación en el mundo de la economía y las finanzas o también puedes usar Feedly para guardar y organizar tus lecturas favoritas de Internet.

¡Hasta la próxima semana!


Comentarios

Entradas populares de este blog

¿Qué significan los números en el triángulo de reciclaje de los plásticos?

Metallica versus Megadeth ¿quien es mejor? la estadística nos da la respuesta

Los programas más usados por economistas