Categorías
Zona Cristasa

Inteligencia de datos de la cerveza artesana

José Manuel Uría, físico y consultor en Business Analytics, destripa los gustos de los consumidores de esta bebida de moda

José Manuel Uría*, físico y consultor en Business Analytics, destripa los gustos de los consumidores de esta bebida de moda

El Big Data y la cerveza artesana están de moda. Son tendencias en las redes sociales y aparecen en muchas conversaciones. Aunque puede parecer que ambos ámbitos no tienen mucho que ver entre sí, no es el caso.

Las técnicas de inteligencia de datos que se aplican en Big Data también resultan útiles en el análisis del fascinante universo de la cerveza. Por ejemplo, se pueden emplear las técnicas estándar de análisis de redes sociales para determinar los gustos de los consumidores.

Mi objetivo aquí es más modesto: trataré de analizar un conjunto de datos procedente de una web de reseñas de cervezas para obtener información sobre los gustos de un conjunto de consumidores. Haré una aplicación sencilla de métodos de inteligencia de datos para mostrar cómo se obtiene información útil para los negocios, en este caso para el mercado de la cerveza artesana.

Beer data inteligencia de datos en el mundo de la cerveza José Manuel Uría Cristasa Gijón

Reseñas de la web de cerveza ‘Beer Advocate’

El conjunto de datos procede de un grupo de reseñas recogidas en la web estadounidense Beer Advocate en el periodo 1996-2012. Incluye un número elevado de reseñas, con más de un millón de entradas en la tabla de datos, pero el conjunto de variables tiene poca complejidad.

En ese conjunto hay datos para la clasificación de los usuarios, la fecha de la reseña, los datos sobre la marca fabricante y la referencia de cerveza. Lo más interesante para este estudio es un conjunto de variables sobre aspectos de la cata, que son porcentaje de concentración alcohólica (ABV), aspecto, aroma, paladar, gusto y puntuación global de cada referencia de cerveza.

Como aficionado al mundo de la cerveza artesana considero que puede ser interesante para los productores determinar la calificación de los consumidores para los diferentes aspectos de la cata de una referencia de cerveza. Los resultados obtenidos de este análisis se aplican a la muestra vinculada con el conjunto de datos.

O lo que es lo mismo, los resultados obtenidos con respecto a los consumidores de cerveza artesana en los Estados Unidos en 2012 no tienen por qué coincidir con las preferencias de los consumidores de cerveza comercial en España en 2019. Pero incluso así podemos obtener información valiosa sobre preferencias generales de los consumidores de cerveza artesana en un contexto geográfico y cultural concreto, el de la muestra poblacional considerada. Aunque no exista la posibilidad de extrapolar los resultados, la metodología de trabajo sería la misma para otra población. 

Estilos de cerveza más valorados

En primer lugar hay que aplicar las técnicas más básicas de minería de datos: examinar el conjunto de datos y plantear preguntas que podamos responder a partir de una visualización de las propiedades generales de los datos, del proceso de consulta y de la agregación de los datos. Lo que esto significa es que se seleccionan subconjuntos de los datos en función de los valores que adoptan las variables, realizando algunas operaciones sencillas sobre ellos.

Para establecer cuáles son los estilos de cerveza más valorados, cuantificando las preferencias de los consumidores, podemos contar el número de reseñas totales para cada estilo de cerveza. Así observamos qué estilos han dispuesto de más referencias y han sido consumidos con más frecuencia. Además, se trata de aquellos estilos en los cuales los consumidores han considerado que es importante dejar constancia de su valoración, sea esta positiva o negativa.

Pero hay que cuantificar también la valoración global de esos estilos. Lo que propongo es considerar como variable el valor promedio de las puntuaciones sobre todas las referencias de ese estilo. Considerando los estilos con mayor número de reseñas, tales puntuaciones muestran una tendencia consistente. Una vez hecho esto hay que ordenar los datos por orden decreciente de reseñas, mostrando la valoración promedio de cada estilo. Es lo que se muestra en la Figura 1:

Estilo reseñas y puntos de cervezas artesanas 2019
Figura 1: valoración promedio de cada estilo de cerveza

El resultado más significativo es la preferencia de los consumidores por los estilos “americanos”, lo que se interpreta como una particularidad de los consumidores estadounidenses. Pero es interesante el hecho de que estos mismos estilos se encuentran también entre los más valorados por los consumidores de cerveza artesana en España en la actualidad. Esto se explica porque el desarrollo de la cerveza artesana en nuestro país ha seguido las tendencias desarrolladas en Estados Unidos. 

Gustos de los consumidores de cerveza

Un vez establecidos los estilos mejor valorados, la pregunta es si podemos obtener más información sobre los gustos de los consumidores. Teniendo en cuenta la estructura del conjunto de datos, lo que se puede plantear es un análisis estadístico general de las variables numéricas más relevantes. Para ello se puede calcular el grado de correlación que se produce entre ellas.

La correlación muestra el grado de dependencia de las variables, aunque no puede establecer la causalidad entre ellas. Pero podemos emplear este procedimiento para establecer en primer lugar cómo se relacionan las puntuaciones entre ellas. Por ejemplo: ¿Hay alguna relación entre los valores de la puntuación de aspecto y aroma o son completamente independientes? Los resultados se muestran con una matriz donde el grado de correlación aparece en las casillas y varía desde 0 para la mínima correlación a 1 para la máxima correlación. Esta matriz se muestra en la Figura 2:

Puntos cata cervezas artesanas 2019 por tipo
Figura 2: grado de correlación entre las variables

La conclusión más significativa es que el porcentaje de concentración alcohólica tiene baja correlación con el resto de variables. Esto indica que parece tener poca importancia en la puntuación global y por lo tanto tiene poca influencia en las opiniones de los usuarios sobre una cerveza.

Pero entre el resto de variables y la puntuación global existe una alta correlación. Esto se explica teniendo en cuenta que un conjunto de puntuaciones elevadas en gusto, paladar o aroma, por ejemplo, se vinculará con una valoración global positiva. Sin embargo, esto no implica que la puntuación global sea un promedio de las puntuaciones para los aspectos específicos. Por lo tanto, el análisis basado en la correlación es insuficiente.

Cinco variables de cata de cerveza

Para analizar cómo las cinco variables de cata determinan la puntuación global hay que realizar un análisis de regresión. Se trata de calcular las variables de la variable predicha (Puntos) en función de las variables predictoras (ABV, Aspecto,  Aroma,  Paladar, Gusto). Una vez obtenido un modelo para los datos, se predicen las puntuaciones globales dado un conjunto de valores de las variables predictoras.

Pero al aplicar el algoritmo de regresión también se obtiene información sobre el peso relativo que tiene cada variable en la predicción, lo que permite realizar una selección de las variables más relevantes. Este procedimiento permite determinar qué aspectos de la cata tienen más influencia en la puntuación global de la cerveza e inferir hipótesis sobre los gustos de los consumidores de cerveza artesana. En la Figura 3 se muestra el peso de cada una de las variables para los cuatro estilos de cerveza más valorados:

Cata cervezas artesanas aromas 2019
Figura 3: peso de las variables según estilos

La distribución de los pesos de las variables varía de un caso a otro, y también lo puede hacer como resultado de las características del algoritmo de cálculo, pero se observa una tendencia global. Esto muestra que las preferencias de los consumidores pueden variar de un estilo a otro, pero esta variación no es determinante.

La variable que más peso tiene es el gusto, seguida del paladar. Por el contrario, tanto el aspecto como el aroma tienen una contribución poco significativa a la hora de determinar la puntuación global. Esto demuestra que la característica más valorada son las propiedades gustativas de la cerveza, asociadas con el gusto y el paladar, resultando secundaria la atención al aspecto de la cerveza.

Este resultado es importante para un fabricante porque le permite averiguar qué aspectos de la cerveza resultan ser los más importantes para su valoración positiva. El hecho de que el sabor tenga mucho más peso que aspectos como la turbieza o el color, asociados con el aspecto, implica unos procesos de elaboración con un menor grado de requerimientos. Y también una mayor dificultad para destacar sobre los competidores.

Beer data inteligencia de datos en el mundo de la cerveza José Manuel Uría Cristasa Gijón 2

La espuma de la cerveza o el amargor

Para obtener información más precisa sobre los gustos de los consumidores hay que añadir variables adicionales que puedan ser relevantes en la calificación de una cerveza. Por ejemplo, las propiedades de la espuma, que se relacionan tanto con el aspecto como con el paladar, variables que tienen un peso relativo muy diferente en el caso del conjunto de datos que he analizado. Pero también el amargor, ya que algunos fabricantes aportan un parámetro numérico que intenta cuantificar este atributo de una cerveza (que sin embargo está sujeto a percepciones subjetivas).

Por eso puede ser interesante, tanto desde el punto de vista de los productores como del de las webs dedicadas a la calificación de cervezas, establecer qué aspectos deben ser los que se puntúen para obtener una representación adecuada de las características de las cervezas y de los gustos de los consumidores. Porque el procedimiento de análisis incremental y cuantitativo es un aspecto esencial en Business Analytics.


* José Manuel Uría González, Ph.D., es Consultor en Business Analytics y Física Computacional, además de ensayista.

Responder

Introduce tus datos o haz clic en un icono para iniciar sesión:

Logo de WordPress.com

Estás comentando usando tu cuenta de WordPress.com. Salir /  Cambiar )

Google photo

Estás comentando usando tu cuenta de Google. Salir /  Cambiar )

Imagen de Twitter

Estás comentando usando tu cuenta de Twitter. Salir /  Cambiar )

Foto de Facebook

Estás comentando usando tu cuenta de Facebook. Salir /  Cambiar )

Conectando a %s