Folha de S. Paulo


Estudantes criam algoritmo que detecta possíveis pedófilos na web

Um grupo de estudantes de ciência da computação criou um sistema que identifica potenciais abusadores de crianças ao analisar textos de conversas na web. Com taxa de 85% de acerto, o mecanismo é único no mundo, segundo os autores, orientados pelo professor Rodrigo Filev Maia.

A tecnologia seria útil para pais que quisessem analisar conversas feitas a partir do computador ou do celular dos filhos, diz o docente do centro universitário FEI, em São Bernardo do Campo (Grande São Paulo), em que foi desenvolvido o projeto.

"Como você pode proteger seus filhos quando navegam na internet? É impensável falar em isolá-los digitalmente", diz Maia, que buscou alunos dispostos a trabalhar no tema após ficar aflito sobre a segurança on-line dos filhos, que têm quatro e sete anos.

O algoritmo, criado inicialmente para funcionar em inglês e que será adaptado para o português na segunda fase do desenvolvimento, capta padrões geralmente usados pelos "predadores" que procuram atrair crianças.

Palavras de cunho sexual, termos como "garoto" ou "garota", "querido" e algumas sequências específicas podem identificar o interlocutor como potencial agressor, explica um dos estudantes que desenvolveu o sistema, Gabriel Lett Viviani, 22.

"O método mapeia as conversas em forma de rede e, depois, analisa essa rede", diz Viviani. "A métrica que usamos dá pontos para quantificar a relevância de cada palavra dentro da conversa."

TEMPO REAL

O algoritmo difere dos atuais sistemas de varredura por funcionar em tempo real —em vez de ler o que já foi postado—, de acordo com o professor Maia, que tem a intenção de aplicá-lo tanto em PCs como em smartphones.

Viviani diz que um problema que o projeto apresenta atualmente é a alta taxa de falsos positivos —casos em que conversas de não agressores são apontadas como problemáticas. "Mas nesse caso é muito melhor detectar um inocente que deixar passar um agressor", afirma.

O projeto usou como base 5.000 conversas verdadeiras em inglês e de diversos teores (propagandas, conversas em grupo e bate-papo sensual entre adultos), que foram coletadas por uma universidade alemã, a Bauhaus-Universität Weimar, para estudos do tipo. O banco foi liberado para os brasileiros desenvolverem sua ferramenta.

Levando em conta todo o banco, entre 500 e 600 registros "inocentes", foram tomados como de potenciais agressores, conta Viviani. Em ambiente real, esses falsos positivos, conta, deveriam ser analisados por uma pessoa, que teria a palavra final.

O programa foi feito como trabalho de conclusão dele e de outros três alunos.

Já formados, ele e os demais —Gabriel Dias, 22, Gabriel Martinez, 21, e Ítalo Ferreira, 24— serão mentores de estudantes que levarão o projeto para suas próximas fases, junto com o professor Filev Maia, que acredita que até 2016 o algoritmo deve ser aplicado na prática.

-

PC VS PREDADOR

Como funciona o algoritmo de detecção de abusadores infantis criado por estudantes

  1. A conversa passa por um programa que "quebra" os diálogos em partes
  2. Um banco de dados armazena os termos e compara a conversas "culpadas" e "inocentes"
  3. O software dá notas para os textos oriundos dos chats e acusa positivo ou negativo

.


Endereço da página: