Una introducción al Análisis de Datos


La rápida evolución de las TICs en los últimos años, ha permitido a la sociedad de hoy en día, la capacidad de generar, recolectar, almacenar y procesar inmensas cantidades de datos. En términos generales, al proceso de análisis de grandes volúmenes de datos (Big Data) se le conoce como Business Intelligence (BI). En el post de hoy, les hablare sobre unos conceptos y definiciones básicos del análisis de datos o BI.

Primeramente, podemos partir de que el análisis de Big Data, requiere de equipos multidisciplinares de profesionales especializados en sus distintas etapas:
  1. Definir los objetivos y el problema de negocio.
  2. Traducir el problema en un proyecto basado en datos con una pregunta de investigación.
  3. Seleccionar datos y desarrollar el modelo.
  4. Obtener, explorar, limpiar y transformar datos.
  5. Analizar los datos y resultados.
  6. Traducir los resultados en alternativas de decisión y acciones.

Concretamente, según un artículo de HBR, los perfiles profesionales vinculados con estos proyectos pueden resumirse en tres (con competencias y roles complementarios):
  1. Ingenieros/Arquitectos de datos: obtener, explorar, limpiar y transformar datos
  2. Científico de datos: selección y modelado, análisis de datos
  3. Traductor o analista de datos: traducción de requerimientos del negocio en un proyecto de analítica, traducción de resultados en alternativas para la toma de decisiones de estrategia de negocios.

Fuente: Does your team need a data curator?

Si hablamos del valor de los datos para mejorar el rendimiento, es decir, lograr y demostrar el éxito de las prioridades establecidas, esto requiere pasar de la recopilación de datos a la comprensión de los mismos, concretamente:
  • Establecimiento de estándares de desempeño de línea de base.
  • Determinar qué impulsa los resultados.
  • Evaluar los impactos de los esfuerzos de corrección de rumbo (en relación con: programas, servicios, cambios de políticas) y acciones que se correlacionan con los principios de la analítica de negocios moderna.

A menudo esto se describe como un viaje de la analítica descriptiva y diagnóstica a la analítica predictiva y prescriptiva. El glosario de TI de Gartner define estos tipos de análisis de la siguiente manera:

El Análisis Descriptivo: es el examen de datos o contenido, generalmente realizado manualmente, para responder a la pregunta ¿Qué pasó? o ¿Qué está sucediendo?, caracterizado por la inteligencia de negocios (BI) tradicional y visualizaciones tales como gráficos circulares, gráficos de barras, gráficos de líneas, tablas o narrativas generadas.

El Análisis de Diagnóstico: es una forma de análisis avanzado que examina los datos o el contenido para responder a la pregunta ¿Por qué ha ocurrido?.

El análisis predictivo: describe cualquier enfoque de la minería de datos con cuatro atributos:
  • Énfasis en la predicción (más que en la descripción, clasificación o agrupación).
  • Análisis rápido medido en horas o días (en lugar de los meses estereotipados de la minería de datos tradicional).
  • Énfasis en la relevancia comercial de los conocimientos resultantes.
  • Énfasis en la facilidad de uso, haciendo que las herramientas sean accesibles a los usuarios empresariales.
La analítica prescriptiva es una forma de análisis avanzado que examina los datos o el contenido para responder a la pregunta ¿Qué se debe hacer? o ¿Qué podemos hacer para que ocurra?

Me gustaría destacar que los análisis descriptivos, de diagnóstico y predictivo, aplica perfectamente tanto al sector público como el privado y que uso de la analitica de datos no debe de considerarse exclusivo de los "negocios" por llamarse inicialmente Inteligencia de Negocios (BI por sus siglas en inglés).

Antes de terminar con el post de hoy,me gustaría compartirles algunos enlaces que podrían ser d interés y utilidad si queremos seguir navegando en el análisis de datos, desde algo tan sencillo como saber la diferencia entre un gráfico y una visualización gráfica.

Aquí, para los que les interesa trabajar con el diseño de aplicaciones de análisis avanzados con Tableau (Análisis de correlación de series de tiempo, aplicación del análisis de conglomerados a la detección de valores atípicos y comparación de distribuciones a través de rangos de percentiles). Finalmente, lo mejor del Tableau en la web: Nuevos bloggers y lo último en consejos para la manipulación de datos.

Comentarios

Entradas populares de este blog

¿Qué significan los números en el triángulo de reciclaje de los plásticos?

Metallica versus Megadeth ¿quien es mejor? la estadística nos da la respuesta

Los programas más usados por economistas