Algoritmo desenvolvido por israelense reconhece humor em textos



É possível treinar um algoritmo para analisar um texto e dizer quão engraçado ele é? O cientista de dados Josh Friedlander, do PerceptiveAI, resolveu aceitar o desafio. Depois de aprender sobre os fundamentos teóricos e a prática de muitos aspectos do Machine Learning, o pesquisador passou à criação de um projeto de ponta a ponta: da manipulação de dados à exploração, da engenharia de recursos à modelagem, e tudo mais.

Usando a base de dados do próprio concurso de legendas do New Yorker, que desde 2005 premia semanalmente a legenda mais divertida enviada por leitores para a charge estampada na última página de cada edição, a ideia inicial era substituir a “torre de marfim” dos julgamentos dos editores de charge por uma pontuação científica, quantificável e replicável.

Após inúmeras tentativas e diferentes testes de formulação, Friedlander observou que, usando apenas o conhecimento humano das palavras de uma legenda, o algoritmo foi capaz de prever uma pontuação agregada com uma taxa de erro razoavelmente pequena. Também foi possível usá-lo para testar ideias próprias de legenda, a fim de ter uma ideia antecipada de como elas seriam recebidas pela comunidade de usuários que classificam as legendas do New Yorker on-line.