Folha de S. Paulo


Pesquisadores desenvolvem algoritmo capaz de prever sucessos de vendas

Aqui vai uma fórmula de sucesso para pesquisas e estudos contemporâneos: pegue o conceito de megadados e aplique ao que quer que você esteja estudando. Talvez não seja propriamente útil ao seu objeto, mas certamente vai chamar atenção.

Os pesquisadores Jodie Archer e Matthew L. Jockers passaram quatro anos para desenvolver um algoritmo que pudesse identificar livros que seriam um sucesso de vendas.

O resultado de seu trabalho está no livro "The Bestseller Code: Anatomy of the Blockbuster Novel" [O código do bestseller: a anatomia de um romance de sucesso, St. Martin's Press, 256 págs, 26 dólares], publicado nos EUA no dia 20/09 e sem previsão de chegada ao Brasil.

Anatomia de um Best Seller

Archer veio do mercado editorial. Trabalhou como editora na Penguin e como chefe de pesquisa da divisão de livros digitais da Apple e fez doutorado em literatura de língua inglesa na Universidade de Stanford, onde estudou justamente os best-sellers.

Já Jockers é professor de literatura da Universidade de Nebraska, onde dirige o Nebraska Literary Lab, laboratório dedicado a usar abordagens quantitativas e computacionais para o estudo de textos.

A ambição deles era treinar computadores para fazerem exatamente o que os avaliadores de editoras comerciais tentam há décadas: prever quais entre aqueles originais enviados por autores desesperados têm potencial de serem a próxima capa onipresente nos metrôs da cidade.

Para isso, eles fizeram com que os computadores fossem capazes de mapear um enredo, identificar o começo e o fim de uma sentença, os personagens, os temas e as partes do discurso e usaram algoritmos de classificação para isolar as características mais comuns em best-sellers.

"Ao analisar um livro por computador você tem acesso a informações que simplesmente não poderia reunir usando métodos qualitativos tradicionais de leitura atenta e síntese humana", diz Jockers à Folha. "Não se trata de substituir a avaliação humana, mas de acrescentar dados a ela."

Chegaram a um total de 2.799 características que estariam fortemente associadas ao sucesso de vendas de uma obra. Por fim, analisaram 20 mil volumes de ficção que figuraram na lista de mais vendidos do "New York Times" nos últimos 30 anos e dizem ter chegado a um código que prevê best-sellers com uma eficácia de 80%.

Para divulgar o livro, a editora americana lançou uma promoção excêntrica: um sorteio no qual aspirantes ao estrelato literário podiam enviar seus originais para serem analisados segundo o código.

INTIMIDADE SIM, SEXO NÃO

Conclusões da pesquisa: o público quer ler sobre heroínas jovens e fortes que sejam levemente desajustadas; prefere cenas de intimidade às de sexo propriamente dito; e adora contrações verbais.

O autor candidato a best-seller deve evitar pontos de exclamação e deve preferir personagens cachorros do que gatos; deve falar sobre casamentos, mortes, funerais, impostos, armas, escolas, crianças, mães e tecnologias vagamente ameaçadoras; mas não sobre sexo, drogas e rock'n'roll; corpos humanos só devem ser descritos exaustivamente em cenas de crime ou em contextos de dor; as pessoas se interessam mais pela descrição de um mercado de ações do que de um rosto humano.

Também deve evitar o excesso de assuntos: devem ser três ou quatro temas centrais do livro, que ocupem ao menos 30% de suas páginas; o ritmo deve ser regular; o narrador deve ser uma voz de autoridade; finais tristes estão liberados. E seja vago: a palavra "coisa" tem uma incidência seis vezes maior em best-sellers do que em não best-sellers.

Não surpreendentemente, a linguagem simples e direta é a favorita. Frases curtas e autores que vêm da publicidade ou do jornalismo têm mais chances. O leitor mainstream quer um texto transparente, quer ter a impressão de que teve um entendimento total da obra, sem lacunas.

A estrutura em três atos –que divide a história entre apresentação dos personagens e do universo ficcional, conflito e resolução– é a favorita.

CÍRCULO PERFEITO

Quer ler um romance perfeito segundo os algoritmos? Vá de "O Círculo", de Dave Eggers, um livro que ironicamente traz uma profunda desconfiança em relação a esse tipo de uso da tecnologia. Para os autores de "The Bestseller Code", Eggers vem seguindo quase todas as regras.

O código fala mais sobre o grande público americano do que sobre as obras. A intenção dos pesquisadores não era estabelecer o mérito artístico, mas sim mostrar o que há em comum entre os livros mais vendidos naquele mercado.

Empresas de leitores digitais, como Amazon e Apple, têm coletado informações importantes sobre os hábitos de leitura de seus clientes. Em que página as pessoas abandonaram um livro, a velocidade média de leitura, quais palavras acharam necessário buscar no dicionário, quais trechos foram grifados ou comentados.

Em países em que o mercado editorial é mais forte (e voraz) esses dados já estão sendo usados. Há empresas, por exemplo, que prestam consultoria a editoras fazendo pesquisas em que um determinado grupo recebe uma prévia de livro digital e tem seus dados de leitura coletados, uma vez que as próprias Amazon e Apple não fornecem esse tipo de informação.

"O que a nossa pesquisa tenta é munir leitores, escritores e pesquisadores dessa espécie de dado. O que dá para fazer com isso? Praticamente qualquer coisa. Você pode usar para escrever um livro de maior impacto ou apenas como curiosidade", diz Jockers.

No Brasil, não há notícias de que esses métodos venham sendo usados. O que as editoras já fazem é usar algoritmos na outra ponta: a da venda, tentando influenciar sites de busca a mostrarem seus livros quando a pessoa procura por determinado tema.

Para André Conti, editor da Companhia das Letras, há uma questão de volume. "Além de não termos acesso a esses dados, é preciso ver que nos Estados Unidos o leitor de livro digital corresponde a 20% do mercado. Aqui, só a 4%, então seria complicado usar isso para inferir muita coisa", diz.

Conti, no entanto, admite dar uma olhada no Kindle para saber quais trechos de um livro foram mais grifados, já que essa informação é pública. "Nunca usei isso para nada prático, mas é interessante ver o que os leitores consideraram impactante", diz.

A análise de dados tende a desempenhar um papel cada vez mais relevante na produção e divulgação de obras comerciais. Assim como a Netflix já produz seriados com base em informações sobre o que as pessoas têm assistido, editoras podem começar a fazer o mesmo com livros.

O único porém é que esses dados revelam apenas o que já está acontecendo, enquanto um autor grande de verdade é aquele que consegue elaborar algo difuso. É por isso que o poeta francês Arthur Rimbaud dizia que o artista era o "oráculo da modernidade", porque ele adiantava o que ainda não havia acontecido.

Mas, para Rimbaud, o poeta se fazia "vidente por um longo, imenso e pensado desregramento de todos os sentidos" –não exatamente por algoritmos.


Endereço da página:

Links no texto: