Recientemente se ha publicado lo que viene a ser el primer estudio del impacto de la Inteligencia Artificial en los medios de comunicación en España. El estudio de la Universidad de Valladolid recoge información de hasta 45 profesionales de compañías que desarrollan sistemas de IA aplicables a medios.
El uso de la IA en el sector de los medios de comunicación puede ir desde acelerar el proceso de recopilación de información y fuentes, generación de contenidos basado en NLP (Natural Language Processing) hasta la rentabilidad económica directa en el sistema publicitario.
El estudio clasifica estas tecnologías en tres procesos:
🔷 Fase 1. Automatización de recogida y documentación de información (reporting). Búsqueda de documentación, contexto y datos, extracción, clasificación y verificación de contenido previo a la elaboración de información
🔷 Fase 2. Producción automatizada de contenido-información (production). Redacción de información y generación de contenido en diferentes formatos y plataformas
🔷 Fase 3. Distribución de información y relación con la audiencia (distribution). Difusión de información y contenido automatizado para potenciar la personalización en la recomendación y el análisis de recepción en plataformas y redes
Las tres ideas mayoritarias que las empresas tecnológicas atribuyen al sector: «lentitud», «desconfianza» y «desconocimiento». Aunque estas tecnologías están penetrando poco a poco, sobre todo en los grandes medios, es destacable que de las tres fases, la menos integrada en los procesos de los medios claramente es la fase 2, la que históricamente tiene más que ver con el alma del periodismo, la confección de la noticia.
A mi modo de ver existen dos grandes factores que afectan a esta lentitud a la hora de integrar estas herramientas en el ámbito de trabajo. Una sería los problemas económicos a los que se enfrenta el sector y otra, que incide con la primera, es la falta de talento tecnológico dentro de las casas que ayuden a perder el miedo a un agente transformador como la IA que está actuando de manera transversal en todos los sectores.
La tecnología sólo es un medio para conseguir un fin, no un fín en sí mismo. Tenemos que utilizarla para resolver problemas que tenga el ser humano y en ese punto, el periodista debe poder manejar dichas herramientas en las tres fases para dedicarse a tareas de alto valor, tareas que probablemente no estarán vinculadas con la generación de noticias si no en identificar dónde se encuentra dicha noticia.
Podéis acceder al estudio completo aquí.
El director general de Data y Tecnología de Prensa Ibérica ha sido entrevistado por la revista especializada en Data, BigData Magazine.
En este episodio del podcast Territorio Big Data llevó a hablar de datos y medios de comunicación. La entrevista se adentró el uso de los datos para mejorar el negocio de la prensa, en cómo convertir dichos datos en un activo empresarial y cómo conseguir que penetre la filosofía del gobierno del dato en la compañía.
Al igual que ocurre en cualquier empresa de cualquier sector, a medida que los medios de comunicación desarrollan sus actividades cotidianas se van generando una serie de datos relacionados con dichas acciones.
Por ejemplo, cada vez que un lector accede a consumir una noticia publicada en la web de un periódico están presentes datos de diferente naturaleza:
· Datos sobre el lector que está consumiendo el contenido, inherentes a él como sus datos sociodemográficos y también relativos a su comportamiento histórico (qué suele leer, cada cuánto suele leer, desde dónde suele leer, etc..)
· Datos relativos al modo en el que el lector ha accedido al contenido, incluyendo los del dispositivo y el browser que ha utilizado para conectarse, los del proveedor de su servicio de acceso a internet y el tipo de conexión (Fibra óptica, 4G, xDSL,…), el canal usado para llegar hasta el contenido (Acceso directo, SEO, Notificación Push,…), la plataforma en la que se ha llevado a cabo la lectura (AMP, Website o APP), si el lector se ha identificado (login) o si está navegando de forma anónima, …
· Datos relacionados con la propia acción de lectura, como el instante en el que se inicia a leer, el tiempo que se ha dedicado a la lectura, el máximo nivel de scroll alcanzado en la página, posibles interacciones con elementos de la noticia,…
· También el contenido leído aporta datos a esta acción cotidiana, como el titular, el cuerpo de la noticia, el número de palabras que contiene, la temática sobre la que trata (que puede ser representada por una serie de palabras clave o tags), quién es el autor y cuál ha sido su trayectoria, el lugar geográfico en el ocurren las acciones descritas en el artículo, el momento en el que el contenido ha sido publicado…
· Y como en cada página suele haber posiciones destinadas a mostrar anuncios, aparecen datos vinculados a esa actividad publicitaria, tales como las campañas presentadas al lector, si las impresiones han sido renderizadas en pantalla o no (viewability), si el lector ha hecho click en ellas, quién es el anunciante que ha pagado por servir cada campaña y el sector en el que desarrolla su actividad,….
· …
Y ocurre algo parecido con cualquier otra actividad que la empresa realice habitualmente, como cuando un redactor escribe una noticia, cuando el equipo de redacción configura la portada de la cabecera, cuando un anunciante contrata una campaña de publicidad, cuando una persona compra una suscripción para leer los contenidos que forman parte de la oferta “premium” del medio, cada vez que configuramos una Newsletter y la enviamos por email,…
Todos esos datos pueden convertirse en un activo importante de la empresa y proporcionarle ventajas competitivas en el caso de que sean tratados de manera adecuada. Para lograr ese objetivo las compañías deberán prepararse en tres aspectos fundamentales:
· Datos: Como hemos comentado anteriormente los datos se van generando con cada actividad y generalmente la empresa dispone de sistemas de información transaccionales u operacionales que dan soporte funcional a esas acciones, como el propio website del medio, el Content Management System (CMS), la aplicación de registro, el Customer Relationship Management (CRM) o el Servidor de publicidad digital (Ad Manager), por poner algunos ejemplos. Por ese motivo la compañía debe esforzarse en recoger con esos sistemas de información la mayor cantidad posible de los datos que se crean en cada una de esas transacciones y además hacerlo de forma que representen fidedignamente la situación real que los ha generado.
· Plataforma analítica: Los datos inicialmente serán capturados por los sistemas transaccionales y cada uno de ellos tendrá una visión parcial de lo que ocurre en el entorno de la empresa. Además, la misión principal de cada uno de esos sistemas de información es dar soporte a un proceso de negocio concreto y no están especializados en el análisis de datos. Si la compañía quiere construir una visión 360 sobre lo que ocurre en su entorno competitivo es imprescindible que centralice todos esos datos en una plataforma analítica donde pueda disponer de toda la información y cruzarla de la forma que más valor pueda aportar. El mismo lector visita contenidos, recibe publicidad digital, se registra, compra suscripciones, abre incidencias en el centro de atención al cliente, paga por sus productos, etc… así que si queremos conocer a ese lector es necesario que podamos disponer de toda esa información en el mismo repositorio. Esa plataforma estará compuesta de elementos hardware que permitan almacenar y procesar los grandes volúmenes de datos que generan los medios de comunicación y de elementos software que den soporte a las diferentes tareas que componen el ciclo de análisis de datos (almacenamiento, limpieza y calidad, agregaciones, filtros y conteos, aplicación de técnicas analíticas avanzadas, visualización gráfica y generación de informes,…)
· Personas: Para poder construir y operar la plataforma analítica y ser capaz de convertir los datos captados en conocimiento que pueda ser incorporado a los procesos de toma de decisión de la empresa, es esencial que esta cuente con perfiles profesionales especializados en esas tareas.
Cuando la empresa esté lista irán surgiendo oportunidades de aprovechamiento de sus datos. Algunas veces serán propuestas que realizarán las área de negocio porque hayan identificado puntos de mejora en la operativa actual y otras veces serán los analistas de datos quienes, en base a su conocimiento de la información que maneja la empresa y del potencial de las técnicas analíticas avanzadas, sugieran distintas opciones.
Cada vez que una iniciativa analítica finalice la empresa dispondrá de conocimiento adicional que desencadenará formas de realizar las cosas diferentes a las que la compañía utilizaba hasta ese momento. Esos nuevos mecanismos generarán nuevos datos que alimentarán una nueva iteración del ciclo de análisis de datos en la que la entidad tendrá que esforzarse en capturarlos con sus sistemas de información transaccionales, en incorporarlos al repositorio centralizado de la plataforma analítica y en convertirlos en conocimiento que pueda ayudar a mejorar los procesos de negocio.
¿Estáis utilizando un enfoque similar para sacar partido a los datos en vuestras empresas?
¿Alguna sugerencia sobre cómo mejorar el rendimiento del análisis de #bigdata?
Debido a la progresiva digitalización de los procesos de negocio por parte de las empresas y a la proliferación del uso de sensores en las máquinas para recuperar información sobre el funcionamiento de las mismas (Internet of Things), las compañías disponen de grandes volúmenes de datos que en el caso de ser bien utilizados pueden convertirse en un activo adicional y proporcionarles ventajas competitivas.
¿Cómo pueden las empresas recoger todos esos datos y ponerlos en valor? Una opción muy utilizada hoy en día en el mercado para resolver parte de esa problemática consiste en la contratación de un software de tipo Data Management Platform o también conocido por las siglas DMP.
Las cuatro funcionalidades básicas que aporta un DMP a las empresas que lo usan son:
· Huella digital o tracking de la actividad de los usuarios de un website y/o de una APP móvil: Como parte del proceso de implementación del DMP es necesario que se configure el website y/o la APP móvil de la compañía para que cada vez que un usuario visite una página de la misma se ejecute un pequeño trozo de código (script) que el proveedor del software proporciona a sus clientes. Ese código se ejecuta en el dispositivo que está realizando la navegación y recopila información relativa a quién es el visitante, a qué contenido está accediendo, en qué momento lo está haciendo, cuánto tiempo pasa en esa página, en qué lugar geográfico se encuentra, qué tipo de dispositivo y de browser está utilizando para navegar, etc… Una vez obtenida toda esa información relevante se realiza una llamada al servidor del DMP enviándole los datos para que estén disponibles para el resto de utilidades del sistema. Esta primera funcionalidad es muy parecida a la que ofrecen las herramientas de analítica web del estilo de Google Analytics.
· Identificación de los navegadores: Para poder comprender los intereses de cada persona es imprescindible que seamos capaces de identificarla cada vez que visite nuestras propiedades digitales, es decir, saber que la persona que hace tres días estuvo en la url x es la misma que hoy ha venido a la url y. Con ese objetivo los DMP’s asignan una matrícula o identificador a cada navegador la primera vez que visitan una página web de la compañía y en la medida de lo posible siguen asociando ese mismo identificador a todas las páginas web que el usuario siga visitando a lo largo de su vida. Los mecanismos nativos de identificación de este tipo de software suelen estar basados en cookies y por tanto sufren los problemas de persistencia habituales de dichos engranajes. En el caso de que la empresa disponga de otro mecanismo de identificación más persistente, por ejemplo la dirección de correo electrónico del visitante, estos sistemas de software suelen estar preparados para poder recoger también ese identificador y utilizarlo posteriormente tanto en la creación como en la activación de los segmentos.
· Creación de segmentos: Una de las formas habituales de que las empresas pongan en valor los datos de los que disponen es agrupar a diferentes personas que tengan intereses comunes en un segmento y posteriormente utilizarlo para hacerles llegar propuestas adecuadas a sus necesidades. Por ejemplo, para un medio de comunicación puede ser interesante agrupar a los lectores que están interesados en sostenibilidad para recomendarles artículos de esa temática y aumentar así el tiempo que pasan en la cabecera. Los DMP’s aportan funcionalidad a las compañías para definir el criterio que deben cumplir los navegadores para poder formar parte de un segmento, y para ello aprovechan que son capaces de identificar a cada navegador en cada interacción que tiene en las propiedades digitales de la empresa y toda la información que recupera con la funcionalidad de Huella Digital (qué contenido, en qué momento, cuánto tiempo pasa en esa página, en qué lugar, qué tipo de dispositivo, etc…). El criterio de pertenencia a un segmento que suele ser más habitual es del tipo “Navegadores que han visitado más de X páginas de la temática Y en los últimos Z días” y el software va comprobando cada cierto tiempo (normalmente una vez al día) quiénes son los navegadores que cumplen esos requisitos y les etiqueta como miembros del segmento.
· Activación de los segmentos: Por último, para que la empresa pueda utilizar los segmentos en sus acciones de comunicación es imprescindible que estén disponibles en los canales de contacto que la compañía tiene abiertos con sus clientes.
- Por un lado las aplicaciones de tipo DMP suelen descargar en el dispositivo de los navegadores el listado de segmentos a los que ese navegador pertenece, de forma que el propio website o la APP móvil de la empresa pueda utilizar ese conocimiento para personalizar la experiencia de navegación del visitante o para enviar desde allí sus intereses a otros canales de comunicación. Este mecanismo se conoce como Activación On-Site.
- También es habitual que el software de esta categoría tenga conectores predefinidos con otros tipos de programas informáticos para poder transferir en bloque a todos los miembros de un segmento. Como uno de los usos principales que se hace de estos segmentos digitales es la compra de publicidad digital los DMP’s suelen facilitar la conexión con otros actores del ecosistema programático, tales como Ad Servers, Suply Side Platforms (SSP), Demand Side Platforms (DSP), otros DMP’s, etc… Esta funcionalidad también es llamada Activación Server to Server, y posibilitaría a una empresa la transferencia completa del segmento Sostenibilidad (por poner un ejemplo) al DSP con el que suela trabajar en la compra de publicidad programática y utilizarlo para definir el público objetivo de una campaña.
Además de estas funcionalidades básicas, las diferentes propuestas que los fabricantes de software ponen a disposición del mercado pueden estar acompañados de otras funcionalidades más específicas que complementan a las principales:
- Extensión de audiencias o “Look alike”
- Recomendación de contenidos
- Reporting analítico
- Incorporación de datos del CRM
- Adquisición de segmentos proporcionados por Data Providers
- Market Place para la monetización de los segmentos vendiéndoselos a otras empresas que trabajen con el mismo DMP
- …
Algunos de DMP’s que tienen más presencia en el mercado español son Salesforce DMP, Piano DMP, Permutive, Citiservi Media, Oracle Bluekai, Lotame o Adobe Audience Manager. En la mayoría de ellos el precio del paquete base es proporcional al volumen de tráfico de las propiedades digitales del cliente. Los proveedores de estos programas informáticos suelen tener establecidos unos rangos anuales de “Server calls” o número de veces que se va a llamar al script del DMP desde el website o la APP del cliente, y cada uno de esos rangos tienen asociado un precio.
¿Estáis utilizando tecnología DMP en vuestras empresas? ¿Echáis de menos alguna funcionalidad que no haya mencionado en el artículo?