Categorías
Comunidad Formación

Inteligencia de datos para todos los públicos

José Manuel Uría nos presenta en Cristasa los conceptos esenciales del análisis de datos y su utilidad para el desarrollo de proyectos

Lo prometido es deuda, así que seguimos poniéndoos al día de los talleres y seminarios impartidos desde la Conunidad Cristasa dentro del programa AYCH (Atlantic Youth Creative Hubs) que Gijón Impulsa está organizando como colaborador del socio de este proyecto europeo, el Ayuntamiento de Gijón.

Hace unas semanas, José Manuel Uría, que es Licenciado en Física Fundamental y Doctor por la Universidad de Oviedo, impartió el taller online Datos para todos los públicos, cuyo objetivo general era presentar una introducción a los conceptos esenciales de la inteligencia de datos y su utilidad para el desarrollo de proyectos. 

La presentación se desarrolló teniendo en cuenta la perspectiva de usuarios de ciencia de datos, las personas que deciden sobre su proyecto o negocio considerando los resultados de análisis obtenidos por científicos de datos. La razón es que este enfoque se adapta mejor al perfil de jóvenes que quieran adquirir aptitudes necesarias para el desarrollo de proyectos.

Inteligencia de datos para extraer valor

La primera sesión, con un carácter más teórico, se centró en la explicación del concepto de inteligencia de datos y las técnicas fundamentales que se emplean para extraer valor. Se explicaron las clases de algoritmos de aprendizaje automático que se emplean para el análisis de datos. Para cada una de las familias de modelos de agrupamiento, regresión y clasificación se presentaron los métodos de visualización gráfica que permiten determinar el éxito obtenido por los algoritmos en obtener patrones de los conjuntos de datos. Se explicó con detalle cómo es el proceso de análisis y cuáles son los apartados que deberían de estar presentes en un buen informe de inteligencia de datos sobre un proyecto o negocio.

La segunda sesión, con un carácter mucho más práctico y mucho más visual, consistió en una exposición detallada con ejemplos concretos de diferentes métodos para la visualización de datos. Se mostraron ejemplos de tablas, gráficos y mapas. También se incluyeron ejemplos específicos de muestras de tablas de correlación y nubes de palabras para su empleo en minería de textos y análisis de sentimientos.

Visualización de datos para todos los públicos Comunidad Cristasa José Manuel Uría Gijón Impulsa
Ejemplo de mapa de bolas.

Para ello se emplearon conjuntos de datos diseñados para la visualización, pero también procedentes del mundo real, considerando diferentes ámbitos de aplicación, con una especial atención a las fuentes con origen en plataformas de datos abiertos de instituciones y empresas. Se mostraron visualizaciones de datos de empadronamiento, contaminación atmosférica, encuestas turísticas, reseñas de webs de cervezas y catas de vinos

«La inteligencia de datos se puede aplicar en empresas pequeñas»

Hoy, José Manuel, que además es miembro de la Comunidad Cristasa y residente del Espacio Cowork, donde desarrolla su faceta profesional como consultor en análisis de datos y simulación numérica, nos cuenta un poco más sobre todo ello.

Hola, Jose, ¿cómo se te ocurrió la idea de realizar una presentación de la inteligencia de datos para todos los públicos?

La inteligencia de datos es el conjunto de procedimientos que son necesarios para el análisis de grandes volúmenes de datos, que presentan una gran variedad, y deben ser procesados a gran velocidad. El foco mediático se centra en las aplicaciones de los macrodatos en la obtención de inteligencia de negocio para grandes empresas, gobiernos o complejos programas de investigación científica, pero ¡también se puede aplicar a proyectos mucho más modestos!

A partir de la explicación de cómo los algoritmos de aprendizaje automático aprenden patrones de los datos se puede obtener una visión de conjunto de una parte muy importante de las técnicas de la inteligencia de datos. ¿No es así? Al menos eso creímos entender después de asistir a tus talleres…

Por supuesto. Y para extraer la información se emplean tres grandes familias de algoritmos de análisis: la primera incluye aquellos que estiman la aglomeración de los datos en torno a los valores de las variables generando un agrupamiento; en la segunda se encuentran los algoritmos que muestran qué variables son las más relevantes para realizar las predicciones; y por último, la tercera engloba a los algoritmos que predicen las características de una variable objetivo a partir del resto del conjunto de variables. 

Tablas, mapas y gráficos combinados para una buena visualización de datos

Y todo eso… ¿cómo lo podemos visualizar?

La presentación de resultados de algoritmos de aprendizaje automático es compleja, pero también es un gran reto. En la práctica se emplean tablas, mapas y gráficos pero una buena visualización debería considerar una combinación de todos estos elementos.

¿Nos pones un ejemplo?

Los mapas de bolas muestran información posicionada en un mapa dibujando una bola en cada ubicación en donde el tamaño y el color de cada bola viene dado por dos variables. Una cuantitativa determina su tamaño, otra cualitativa puede hacer referencia a una leyenda. 

Los gráficos de barras y sectores deben tener más peso en la presentación porque son más fáciles de interpretar. A la hora de mostrar gráficos de dispersión de puntos, estos deben tener una interpretación intuitiva. Para presentar datos tabulados una opción muy utilizada por parte de la comunidad de la ciencia de datos es la inclusión de mapas de calor para asociar los valores en las tablas con colores. Esto facilita la comprensión de los resultados obtenidos.

No obstante, a la hora de presentar el conjunto de la información obtenida lo más eficiente es el desarrollo de un contexto narrativo en el cual la explicación de todo el proceso de análisis se comprende en su totalidad. 

Tenemos entendido que de narrativa también sabes un poco…

(Sonríe). Bueno, mi experiencia como autor de libros de divulgación de conceptos científicos y de crítica literaria es que el enfoque narrativo permite una mejor comprensión de los conceptos abstractos… 

Para ti es fácil decirlo, recientemente hemos disfrutado de tu último libro, La física del Universo Cinematográfico Marvel, en el que unes tus dos pasiones: la cosmología y el cómic de superhéroes. ¿Pero para la gente de a pie? ¿Algún truco que no pase por la escritura?

¡Claro que sí! Un modo eficiente para combinar la presentación narrativa y la visualización rigurosa de datos es la elaboración de infografías, por ejemplo.

Responder

Introduce tus datos o haz clic en un icono para iniciar sesión:

Logo de WordPress.com

Estás comentando usando tu cuenta de WordPress.com. Cerrar sesión /  Cambiar )

Google photo

Estás comentando usando tu cuenta de Google. Cerrar sesión /  Cambiar )

Imagen de Twitter

Estás comentando usando tu cuenta de Twitter. Cerrar sesión /  Cambiar )

Foto de Facebook

Estás comentando usando tu cuenta de Facebook. Cerrar sesión /  Cambiar )

Conectando a %s