Folha de S. Paulo


'Big data' poderia ter impedido o 11 de Setembro?

Será que os sistemas 'big data' (captura e processamento de grandes volumes de dados) poderiam ter impedido o 11 de Setembro? Talvez. Dick Cheney, por exemplo, parece acreditar que sim. Mas consideremos outra questão, muito mais provocativa: o que aconteceria se o 11 de Setembro transcorresse hoje, a era do 'big data', algo que tornaria inevitável que todos os 19 sequestradores dos aviões usados no ataque tivessem extensos históricos digitais?

Os irmãos Tsarnaev, responsáveis pelo atentado contra a maratona de Boston alguns meses atrás, são parte dessa nova geração de terroristas. Sentiam-se em casa no mundo do Twitter e do YouTube. E alguns dos vídeos que Tamerlan, o irmão mais velho, supostamente tinha em sua lista de preferidos têm natureza claramente extremista. Se alguém estivesse analisando os hábitos de consumo de vídeos dos irmãos em tempo real, uma grande tragédia poderia ter sido evitada.

No passado, a propensão de uma pessoa ao terrorismo era medida com base nos livros que ela lia e nos sermões que ouvia; hoje, ela é medida pelos cliques de seu uso da Web e pelos apps que a pessoa baixa. Não é que livros e sermões tenham perdido a importância --eles continuam a ter papel crucial--, mas hoje são consumidos de modo digital, de uma forma que deixa uma trilha, e essa trilha permite estabelecer padrões. Os livros que você comprou hoje na Amazon são mais radicais do que aqueles que comprou no mês passado? Se são, você pode se tornar objeto de interesse para os serviços de segurança.

A boa notícia, ao menos para os proponentes dos sistemas 'big data', é que não precisamos compreender o que quaisquer dessas visitas a sites e vídeos significam. Precisamos apenas estabelecer algum relacionamento entre os terroristas desconhecidos do amanhã e os terroristas estabelecidos de hoje. Se os terroristas gostam de, por exemplo, homus, deveríamos então aplicar escrutínio mais severo a qualquer pessoa que compre esse tipo de produto --sem que precisemos desenvolver uma teoria que explique por que o homus é tão amado. (De fato, por breve período, em 2005 e 2006, o serviço federal de Investigações [FBI], esperando localizar células clandestinas de terroristas iranianos, fez exatamente isso: analisou dados recolhidos de lojas de alimentos na região de San Francisco, em busca de registros de venda de comida típica do Oriente Médio.)

Graças aos sistemas 'big data', podemos deixar de nos preocupar com a compreensão e tomar por foco a ação preventiva. Em lugar de desperdiçar recursos públicos preciosos para tentar compreender o motivo --ou seja, descobrir a razão para que terroristas se tornem terroristas--, podemos nos concentrar em prever o "quando", para que uma intervenção oportuna possa ser realizada. E assim que uma pessoa tenha sido identificada como suspeita, seria inteligente estudar todos os componentes de sua rede social; apanhar só um dos irmãos Tsarnaev antes do ato poderia não ter impedido o atentado em Boston. Assim, o melhor é mesmo registrar tudo, porque você nunca sabe quando uma informação pode se provar útil.

Gus Hunt, diretor geral de tecnologia da Agência Central de Inteligência norte-americana (CIA), admitiu esse ponto, meses atrás. "O valor de qualquer informação só será conhecido quando for possível conectá-la a alguma outra coisa que pode surgir em algum momento futuro", ele disse em uma conferência sobre computação em nuvem. Assim, "porque ninguém pode conectar pontos que não conheça, isso nos conduz a um modo de... fundamentalmente, tentamos recolher tudo, e mantemos esses dados para sempre". O final da teoria que Chris Anderson previu anos atrás em artigo para a revista "Wired" chegou aos serviços de inteligência: da mesma forma que o Google não precisa saber por que alguns sites recebem mais links de outros sites --garantindo melhor posição nos retornos de busca como resultado -, espiões não precisam saber por que algumas pessoas se comportam como terroristas. Basta que se comportem como terroristas.

Como aponta Mark Andrejevic, pesquisador acadêmico de mídia, em "Infoglut", seu novo livro sobre as implicações políticas da sobrecarga de informações, há um custo imenso --mas no geral invisível-- na adoção dos serviços Big Data pelos serviços de inteligência (e por quase todo mundo mais, nos setores público e privado). O custo é a desvalorização da compreensão individual, exemplificada por nossa relutância em investigar as causas de ações e pela tendência de saltar diretamente para como enfrentar as consequências. Mas, argumenta Andrejevic, se o Google pode se dar ao luxo de ser ignorante, as instituições públicas não podem.

"Se o imperativo da mineração de dados é continuar a recolher mais dados sobre tudo", ele escreve, "sua promessa é colocar esses dados para funcionar, e não necessariamente compreendê-los". De fato, o objetivo da mineração e dados e da análise preditiva é "gerar padrões úteis que ficam bem além da capacidade humana de detectar e explicar". Em outras palavras, não precisamos perguntar por que as coisas são como são, desde que possamos influenciá-las para que sejam o que desejamos que sejam. E isso é triste. O abandono da compreensão como objetivo útil de política pública pode tornar impossíveis as reformas políticas sérias.

Esqueça o terrorismo por um momento. Vamos falar de algo corriqueiro como o crime. Por que o crime acontece? Você poderia afirmar, por exemplo, que acontece porque os jovens não têm empregados adequados. Ou poderia afirmar que acontece porque as portas de nossos edifícios não são fortes o bastante. Se dispusesse de verbas limitadas para gastar, você poderia dedicá-las a um programa nacional de empregos, ou poderia equipar as casas com câmeras, sensores e fechaduras ainda melhores. Qual seria a solução certa?

Se você for um tecnocrata em cargo administrativo, a resposta é fácil: adote a opção mais barata. Mas e se você for parte daquela rara categoria, a dos políticos responsáveis? Só porque alguns crimes agora se tornaram mais difíceis de cometer, não significa que os jovens anteriormente desempregados enfim encontraram trabalho. Câmeras de segurança podem reduzir o crime -ainda que os dados a respeito sejam contraditórios-, mas nenhum estudo demonstra que resultam em maior felicidade para todos os envolvidos. Os jovens problemáticos continuam a enfrentar o mesmo problema do passado - mas talvez agora passem a descarregar sua raiva uns nos outros. Sob essa leitura, fortificar nossas ruas sem examinar as raízes do crime é uma estratégia que resultará em derrota, pelo menos em longo prazo.

Os serviços big data são mais ou menos como as câmeras de vigilância, nessa analogia. Sim, podem nos ajudar a tornar menos frequentes certas perturbações à saúde do sistema. Mas também podem nos cegar para o fato de que o problema existente requer abordagem mais radical; eles nos dão tempo, mas também criam uma falsa sensação de domínio.

Podemos estabelecer aqui uma distinção entre big data -números e correlações- e big narrative, uma abordagem antropológica e propelida por narrativas que busca explicar por que as coisas são como são. Big data custa barato e big narrative custa caro. Big data é claro, e big narrative é confuso. Big data permite ações práticas, e big narrative gera paralisia.

A promessa dos sistemas big data é que permitirão que evitemos os percalços do método big narrative. Mas isso é também seu maior custo. No caso de uma questão extremamente emocional como o terrorismo, é fácil acreditar que o big data possa fazer maravilhas. Mas quando falamos de questões mais corriqueiras, se torna evidente que a suposta superferramenta é um instrumento bastante frágil que enfrenta os problemas de maneira pouco imaginosa e pouco ambiciosa. E pior: impede que conduzamos debates públicos importantes.

O big data é excelente como paliativo. Mas paliativos não resolvem quando o paciente precisa de cirurgia. Caso seja esse o caso, o amor pelos paliativos resulta muitas vezes em amputação. Mas não tenho como ter certeza, já que isso é o que o big data me diz.

Tradução de Paulo Migliacci


Endereço da página: