Você está lendo:
Numerólogos: a primeira matéria escrita por um robô na Globo

Image

Numerólogos: a primeira matéria escrita por um robô na Globo

Thiago Frensch
8 de maio de 2018

Para uma notícia atingir seu apogeu, esta precisa de muito dinamismo para ser liberada, assim como confiabilidade da informação contida e imparcialidade. Com a velocidade que fatos acontecem, se torna difícil possuir número suficiente de jornalistas para ficarem atentos a todos os fatos, para sua rápida conversão em matérias para publicação. Muito conteúdo acaba se perdendo neste processo devido ao alto custo de recurso humano disponível para atendê-lo.

Como exemplo deste fato, a Globo possui uma mina de ouro em dados de esporte. E um grande destaque de sucesso no uso desses dados é o jogo de fantasy football Cartola. Já para uso de forma jornalística, esses dados se encontram em um formato bruto, do qual demandam muito esforço para serem convertidos em matérias pelos próprios jornalistas. 

Neste contexto surge o Data Storytelling, uma abordagem moderna para comunicação de conhecimento e insights através de dados, recursos visuais e narrativa. Então, no início do ano, a equipe de P&D criou uma força-tarefa para encarar um novo desafio: contar automaticamente novas histórias a partir de dados usando técnicas de IA.

O desafio foi direcionado para reproduzir e enriquecer um blog publicado a cada rodada do campeonato brasileiro chamado Numerólogos, contendo um resumo objetivo dos principais destaques estatísticos de cada rodada.

Para atingir esse objetivo ambicioso, criamos uma variedade de tecnologias e sistemas inovadores. A próxima seção detalha como essas ferramentas constituem uma verdadeira plataforma de inovação para criação de novas histórias na Globo.

Numerólogos: a primeira matéria escrita por um robô na Globo

Em uma hackathon interna, surgiu a ideia de criar um sistema para gerar automaticamente um resumo sobre os principais eventos de um torneio de futebol. A prova de conceito foi um sucesso e despertou o interesse da área do Globo Esporte que hospeda o blog Numerólogos.

O blog era focado em contar a história dos números de cada rodada do Brasileirão, abordando algumas das principais estatísticas calculadas manualmente pelo jornalista. Ao serem apresentados a iniciativa, os jornalistas do Globo Esporte foram capazes de identificar o grande potencial e novos horizontes que se abririam ao apoiarem a iniciativa para enriquecer o blog e futuramente gerar novos conteúdos diferenciados ao integrar técnicas de data storytelling ao portal do GE.com.

Nossa fonte principal de informação foi a base de dados SDE. A base, que também alimenta o Cartola, possui diversas informações sobre eventos da partida, como finalizações, passes errados e faltas sofridas. A primeira tarefa desenvolvida foi extrair, organizar e consolidar os dados em um banco interno para dar suporte às nossas consultas.

Para a operação do sistema, foi criada uma interface web contendo cada destaque estatístico da rodada em forma de cards para fácil entendimento do jornalista e para serem publicados em forma de grafismo em conjunto com a matéria. Nesta interface, escolhem-se quais estatísticas devem ser publicadas em formato de texto e quais devem ser publicadas de forma gráfica.

Somando as estatísticas de jogadores, times e da rodada como um todo, temos cerca de 60 tipos de cards diferentes a disposição do usuário. Então um novo desafio foi encontrado: como sugerir de forma automática quais estatísticas são mais relevantes em cada rodada. Para superar tal desafio, criamos um sistema de modelagem de probabilidade para que cada evento possa ocorrer em uma partida de futebol. Este sistema é capaz de destacar as estatísticas mais relevantes baseando-se na baixa probabilidade desta estatística ser atingida e sugerir seu uso para a criação automática de texto.

O próximo passo foi desenvolver uma tecnologia capaz de criar o principal elemento de qualquer história: a narrativa em texto. Uma tecnologia data-to-text criada utilizando técnicas de IA para construir automaticamente a melhor maneira de descrever os dados com uma quantidade rica de expressões que criam a ilusão de um texto escrito por uma pessoa real.

Conclusão

Desde sua estreia, na primeira rodada do Campeonato Brasileiro de 2017, os textos gerados serviram como base para a publicação de conteúdo no blog Numerólogos em todas as rodadas do campeonato brasileiro. Sendo assim, é o primeiro caso que de um robô jornalista esportivo na Globo.

A plataforma criada para atender o blog Numerólogos foi planejada de forma dissociada do contexto de futebol. Tal liberdade de contexto a torna uma poderosa ferramenta capaz de ser evoluída para gerar conteúdo para o jornalismo, para o entretenimento, e também pode ser integrado a chatbots, twitter e outra plataformas de publicação de texto.

Esta iniciativa foi capaz de estimular a criação de novos projetos relacionados a detecção relevância de dados esportivos e escrita automático em contextos fora do âmbito esportivo. Um exemplo de projeto derivado do Numerólogos, é uma iniciativa capaz de detectar e notificar insights a um comentarista em tempo real durante uma partida de futebol.



0 comentários

Deixe uma resposta

Posts relacionados

16 de junho de 2020

MediaTech Lab na edição “Somos Remotos” do TECHDAY

TDC
28 de agosto de 2020

MediaTech Lab em peso na TDC Online 2020

Arrow-up