Folha de S. Paulo


Empresas usam dados para prever crédito, chuva e fraude

Divulgação
Sensor pluviométrico feito pela Pluvi.on coleta dados a cada milímetro de água que cai
Sensor pluviométrico feito pela Pluvi.on coleta dados a cada milímetro de água que cai

Sem que você note, as máquinas ao seu redor estão aprendendo. Seu e-mail usa "machine learning" para decidir o que é spam, por exemplo. A técnica já é dominada em universidades e usada por empresas brasileiras.

"'Machine learning' é fazer um computador aprender, através de exemplos, sobre algum domínio", explica André Carlos Ferreira de Carvalho, do Instituto de Ciências da Computação e Matemática da USP-São Carlos.

Nos últimos anos, triplicou a demanda de empresas ao instituto em busca de funcionários ou de apoio técnico para projetos.

A universidade criou um mestrado profissional, para atender quem está no mercado, e um centro de colaboração com empresas, que faz convênios para produzir projetos específicos. Um deles, com uma indústria moveleira, faz reconhecimento de imagens para a triagem da melhor madeira.

Fora dos convênios da USP, Itaú, Nubank e Magazine Luiza são marcas que já utilizam a técnica de "machine learning" para análise de crédito, recomendações de produtos aos consumidores e atualização da base de clientes.

Com o hype em torno da técnica, muitas vezes o jargão vende algo quase mágico. Mas a técnica, sozinha, não faz mágica. Os modelos dependem de bons dados.

Foi onde esbarraram os criadores da start-up Pluvi.on, os engenheiros Diogo Tolezano e Pedro Godoy. Eles queriam usar dados públicos para prever onde e quando há maior risco de alagamento durante as chuvas em São Paulo, mas os dados não tinham a qualidade necessária. Por isso, criaram sensores próprios para medir a intensidade da chuva em pontos da cidade. Hoje, são 40; em breve serão cem.

Ainda assim, as previsões não virão tão cedo. As cerca de 300 mil linhas de dados captadas com toda a chuva recente ainda são pouco para prever a dinâmica da chuva paulistana. Em residência no Campus São Paulo, do Google, os engenheiros estimam que levará três estações chuvosas para coletar um volume capaz de prever alagamentos antes que ocorram.

Ilustração Marcelo Cipis

No final de 2016, um robô fez com que deputados federais devolvessem R$ 5 mil em gastos irregulares. Era a Operação Serenata de Amor, que analisava despesas de gabinete para apontar possíveis irregularidades.

Írio Musskopf, criador da operação, criou o robô com colegas. "Rosie" aprendeu regras simples sobre o que era gasto irregular: muito mais alto que a média, inclui bebida alcoólica, CNPJ inválido etc. O robô detecta até se duas notas fiscais consecutivas são de estabelecimentos muito distantes entre si.

"Teoricamente seria possível fazer esse trabalho olhando nota por nota, mas quem recebe 2 mil notas por dia dificilmente consegue checar em que cidade cada deputado estava naquele dia, por exemplo", diz Musskopf.
O trabalho fez com que o grupo fosse chamado por italianos para criar algo semelhante —e pela Câmara dos Deputados brasileira, para ouvir críticas.

A operação também serviu como uma espécie de vitrine para a Data Science Brigade, empresa de Musskopf que presta serviços particulares em projetos de que dependam de reconhecimento automático de padrões. Nos últimos meses, a empresa foi contratada para projetos de auditoria, previsão de decisões jurídicas e até um chatbot de corretagem de imóveis.

Para Musskopf, a primeira barreira para uma empresa trabalhar com "machine learning" é de mentalidade. "É preciso mudar a mentalidade em relação aos dados, entender o que é e como aplicar", disse. "Já existem no Brasil pessoas que podem lhe ajudar nisso."


Endereço da página: