Folha de S. Paulo


Fortaleza expugnada

SÃO PAULO - Clichê. Meu dicionário Houaiss eletrônico define o termo como "frase frequentemente rebuscada que se banaliza por ser muito repetida; lugar-comum, chavão". A maioria das gramáticas escolares nos manda fugir de clichês como o diabo foge da cruz. Mas será que é isso mesmo?

Receio que a questão seja mais complexa, e os clichês, muito mais interessantes do que sugerem dicionários e gramáticas. A melhor evidência disso vem dos programas de computador que tentam traduzir línguas naturais. Eles sempre foram muito ruins e continuam deixando a desejar, mas é forçoso reconhecer que melhoraram bastante nos últimos anos, depois que sucessivos fracassos levaram os programadores a mudar sua estratégia.

Inspirados nas ideias de Claude Shannon e sua teoria da informação, eles deixaram de apostar em algoritmos que combinavam listas de palavras com regras linguísticas para adotar métodos estatísticos alimentados por megabancos de documentos bilíngues que, no caso do Google Translate, formam, só para o inglês, um "corpus" de 1 trilhão de palavras arranjadas em 95 bilhões de frases.

De forma muito simplificada, o que os novos algoritmos fazem é abandonar aquilo que os linguistas chamam de recursividade da linguagem –a capacidade de produzir um número infinito de sentenças a partir de um conjunto finito de regras– para ficar com uma técnica de força bruta, que, analisando dentre toda as possibilidades de traduções registradas em seus bancos de dados aquelas que são mais frequentes, tenta adivinhar a expressão "certa".

E o fato de esses programas estatísticos funcionarem razoavelmente bem revela que o ser humano é muito mais previsível do que gostamos de supor. Até mesmo aquilo que dizemos, e que deveria ser o ponto inexpugnável da criatividade individual, é uma área densamente habitada por clichês e repetições.


Endereço da página: