Artículos recomendados para practicar ciencia de datos: Data Literacy, Python, ML, TensorFlow, BigQuery & herramientas de código abierto
La transformación digital, en sentido amplio, es la integración de las tecnologías digitales en todas las áreas de una empresa, mejorando los procesos operativos actuales y creando otros nuevos, y aportando más valor a los clientes. Representa un cambio cultural hacia formas más ágiles e inteligentes de hacer negocios, impulsadas por tecnologías como la analítica avanzada y la Inteligencia Artificial (Statista).
Con esta definición sobre la transformación digital, arrancamos el post del día de hoy, dedicado a compartirles recursos, tanto para los interesados en aprender ciencia de datos, como para aquellos que desean seguir practicando con herramientas más avanzadas.
Índice de Calidad de Vida Digital 2021
Antes que nada me gustaría compartirles un Índice que mide el nivel de Calidad de Vida Digital en 2021. Se trata de una investigación global sobre la calidad de bienestar digital en 110 países (90% de la población mundial). Este estudio rankea a los países atendiendo a cinco pilares fundamentales que definen la calidad de vida digital: asequibilidad de internet, calidad de internet, e-infraestructura, e-seguridad, e-gobierno. En la siguiente figura se muestra los 8 países con mejor nivel de calidad digital. Acá puedes consultar el índice al completo y averigua en qué lugar se encuentra tu país.
1. Data Literacy
A pesar de que los conocimientos sobre datos son los más demandados en el mercado laboral actual (y futuro), sigue habiendo una brecha en los conocimientos sobre datos. Si eres nuevo en el mundo de los datos, lo primero que tienes que hacer es desarrollar tus habilidades en lo que se conoce como 'alfabetización en datos' (Data Literacy). Para ello, aquí te dejo el siguiente artículo que te explicará cómo empezar a construir tu alfabetización en datos: Build Your Data Skills with the Data Literacy Trail on Trailhead (Tableau).
2. Python Intermedio
Para los practicantes en Python, aquí les dejo un tutorial sobre los modelos de regresión lineal en Python (Regenerative).
En el siguiente vídeo, se explica cómo la simulación de Montecarlo puede ser lo más parecido a una máquina del tiempo, o más sencillamente, cómo puede ser una forma de mirar al futuro para tomar decisiones empresariales: What is Monte Carlo Simulation? (IBM Technology).
3. Machine Learning
Seguimos con los recursos avanzados con Python, y ahora es el turno para llevar a cabo un entrenamiento de modelos basados en árboles con TensorFlow en unas pocas líneas de código (TensorFlow Blog).
Para la gente que trabaje con el ecosistema de aprendizaje automático en la nube de Google, aquí les traigo BigQuery ML para realizar ML con SQL (Medium).
4. Herramientas open-source
Para que le eches un vistazo, te cuento que recientemente se ha lanzado inFairness, la primera biblioteca Python de código abierto para la equidad individual (Individual Fairness) en la Inteligencia Artificial (IA).
Te presento a MAIIA, un algoritmo que permite mapear de forma automatizada la ubicación de asentamientos urbanos informales mediante el análisis de imágenes satelitales. El algoritmo fue desarrollado con énfasis en su facilidad de implementación, para bajar las barreras de acceso a herramientas de inteligencia artificial (IA) y permitir que agencias de gobierno, investigadores y otros actores interesados puedan aplicarlo a sus propios casos de uso.
Por último, pero no por ello menos importante, se ha llevado a cabo el lanzamiento de Deep Search for Scientific Discovery, un conjunto de herramientas de código abierto para la investigación científica y las empresas, planea hacer que Deep Search sea aún más versátil y accesible.
Espero que estos recursos te sean de ayuda para seguir avanzando en tu carrera como científico de datos. Si te gustó el post, no te olvides de compartir y recuerda que puedes seguirme en Twitter y mantenerte informado de lo último de ciencia, tecnología e innovación en el mundo de la economía y las finanzas.
Comentarios