Como comenté en el artículo sobre el ciclo de análisis de datos en las empresas del sector de medios de comunicación, uno de los componentes que las empresas necesitan para poder extraer el valor de los datos que generan con sus actividades cotidianas es una plataforma analítica en la que poder centralizar la información relevante para la compañía y para construir el conocimiento que pueda ayudarle a tomar mejores decisiones. En otra pieza, hablé sobre el software de tipo DMP, ya que es una de las opciones por la que muchas empresas del sector están apostando para construir su plataforma analítica.
Otra de las opciones disponibles para las compañías y que en mi opinión es la que permite un mayor aprovechamiento de los datos, es la construcción de un Lago de datos o Datalake.
La concepción que en Prensa Ibérica tenemos de un Datalake es una combinación de elementos hardware y software que proporcionan un entorno en el que poder almacenar datos y posteriormente procesarlos con lógicas tan complejas como sea necesario para convertirlos en conocimiento útil y en servicios que faciliten su aprovechamiento. Por aterrizar el concepto, nosotros entendemos que un Datalake es un servidor (o varios servidores integrados en un “cluster”) con disco duro para poder guardar los datos y en el que poder instalar todas las aplicaciones de software necesarias para soportar las necesidades del ciclo de análisis de datos y activación del conocimiento.
El listado de casos de uso que un medio de comunicación puede implementar gracias a disponer de un Datalake es extenso. Algunos de los más relevantes son:
- Desarrollar un repositorio centralizado de datos con fines analíticos en el que disponer de los datos desagregados provenientes de cualquier fuente interna o externa y que sea la base sobre la que se construya cualquier tipo de conocimiento útil para la compañía.
- Generar una taxonomía de segmentos de intereses que enriquezca el conocimiento que la empresa tiene sobre cada uno de sus lectores y que posibilite la segmentación del público objetivo de las campañas de publicidad digital (y en general de cualquier acción de comunicación utilizando cualquier canal de contacto), incrementando así el rendimiento de las mismas.
- Construir una segmentación estratégica de lectores que permita entender cuál es la composición de la audiencia de cada cabecera y elaborar planes estratégicos de desarrollo adaptados a las características de cada uno de los segmentos.
- Realizar uno o varios mecanismos de identificación de los lectores que se adapten a la situación del medio de comunicación y que permita trazar a lo largo del tiempo y de forma fidedigna las interacciones que cada lector ha tenido con sus propiedades digitales.
- Preparar servicios de activación de segmentos que posibiliten que estos lleguen a todos los canales (Website, APP, Email, Notificaciones push, Ad Server, DSP, RRSS,…) en los que el lector pueda interactuar con la cabecera, facilitando la personalización de la experiencia de usuario.
- Diseñar e implementar una capa de reporting que facilite que todos los empleados de la compañía tengan acceso al conocimiento que pueda resultarles útil en sus procesos de toma de decisiones y proporcione una visión integral de todo lo que acontece en el entorno competitivo en el que empresa desarrolla su actividad.
- Desarrollar un sistema de recomendación de contenidos que incremente el número de contenidos que cada lector consume en sus visitas, aumentando así el tiempo que pasa con nosotros y con ello también las posibilidades de monetizar esas visitas.
- Construir una herramienta de Content Scoring que retroalimente a los redactores con el rendimiento de cada uno de los contenidos publicados y que les permita entender el nivel de aceptación que han tenido en los diferentes estamentos que conforman la audiencia de la cabecera.
- Generar un sistema automático de etiquetado y clasificación de los contenidos que, gracias a las técnicas de Programación del Lenguaje Natural, facilite la incorporación de tags a los contenidos por parte de los redactores, y que sea la base sobre la que se construyan servicios de publicidad contextual y de Brand Safety.
- Preparar una herramienta de SEO Scoring que puedan utilizar los redactores antes de publicar cada contenido para estimar el impacto que este tendrá en el ecosistema de Google (Search y Discover principalmente) y que les avise de posibles alternativas de configuración del contenido que podrían hacer aumentar ese rendimiento.
- Entrenar con técnicas de machine learning un modelo de propensión al abandono que identifique de forma temprana a los clientes con mayor posibilidad de solicitar la baja de su servicio y ayude a disminuir la tasa de abandono.
En mi opinión, las principales diferencias que existen entre un DMP y un Datalake son la mayor flexibilidad y potencial que proporciona el segundo. Los DMP’s de mercado suelen ofrecer funcionalidades genéricas para que puedan ser aprovechadas por empresas de diferentes sectores y hay ocasiones en las que no encajan con las necesidades particulares de un sector de actividad específico o con las de una empresa concreta. Además, la mayor parte de las veces esas funcionalidades operan en modo “caja negra” y por tanto no es posible saber qué es lo que está haciendo el software exactamente.
Por poner un ejemplo, la mayor parte de los DMP’s de mercado aportan funcionalidad para construir segmentos “Look Alike”, es decir, partiendo de un segmento que tenga algún interés particular, hacer una extensión de audiencia buscando otros individuos que sean “parecidos” a los que forman el segmento. La idea que suele subyacer tras ese “parecidos” es encontrar un volumen mayor de audiencia que a priori debería tener un rendimiento similar al segmento de origen.
Si estás lanzando una campaña de publicidad digital y un segmento concreto tiene un rendimiento excelente, puedes utilizar esa funcionalidad “Look Alike” para obtener un segmento mayor o mucho mayor con el que aumentar el alcance de tu campaña. Si una vez esté disponible el segmento “Look Alike”, lo utilizas en la campaña y no consigue el rendimiento esperado, no puedes hacer nada por mejorar, ya que ni sabes de qué forma ha creado el segmento ni dispones de herramientas para hacerlo de otra forma en el caso de que lo supieses. En un Datalake podrías elegir el mecanismo que prefieras entre los muchos existentes para obtener segmentos “Look Alike” y además configurarlo de la forma que consideres oportuna. Y en caso de que al utilizarlo en la campaña el rendimiento no sea el esperado, puedes modificar la configuración o directamente optar por otro mecanismo de construcción.
Y con el resto de funcionalidades de los DMP ocurre lo mismo, o no son suficientes para poder implementar el caso de uso o existe el riesgo de que no proporcionen el resultado esperado y la empresa no tenga ni criterio ni herramientas para hacer cambios con los que mejorar el rendimiento.