Folha de S. Paulo


Missão é transmitir dados complexos de forma intuitiva, diz brasileira que trabalha no Google

A brasileira Fernanda Viégas, 42, comanda ao lado de Martin Watterberg o grupo 'Big Picture', dedicado à pesquisa e desenvolvimento de ferramentas de visualização de dados no Google.

É dela o Google+ Ripples (ou Google Eco, no Brasil bit.ly/googleeco ), lançado em 2011, que mostra a trajetória de compartilhamento de um link desde que foi postado.

Ao olhar para o gráfico, um círculo central mostra o nome do usuário que originalmente postou o conteúdo. Ao redor dele, círculos menores indicam quem compartilhou.

No Rio, Fernanda falou com a Folha sobre como seu trabalho ajuda a entender os novos fluxos de informação.

Ela não quis falar sobre o impacto disso na privacidade dos usuários. Por meio da assessoria de imprensa, o Google disse tratar-se de uma prioridade e que "centenas de milhões de dólares são investidos todos os anos".

-

Divulgação
A brasileira Fernanda Viégas lidera o grupo de pesquisa de visualização de dados Big Picture, no Google
A brasileira Fernanda, 42, que trabalha no Google

RAIO-X - FERNANDA VIÉGAS

IDADE E ORIGEM
42 anos, brasileira

FORMAÇÃO
Bacharel em design gráfico e história da arte pela Universidade do Kansas e PhD em Media Arts & Science pelo Massachusets Institute of Technology (MIT).

CARREIRA
Desenvolveu o Many Eyes, projeto experimental de visualização de dados públicos na IBM;
Lidera o grupo de pesquisa de visualização de dados Big Picture, no Google e tem projetos artísticos diversos, vários deles exibidos em museus. Conheça o WindMap (hint.fm/wind/ ) e outros trabalhos.

-

*

Pode explicar rapidamente o que mudou de dez anos para cá, com o aumento da quantidade de dados em circulação? O que se chama hoje de Big Data foi uma mudança apenas quantitativa ou também qualitativa?

Fernanda Viégas: A mudança foi quantitativa e qualitativa. É importante pensar em três dimensões quando se fala de big data.

Volume. 90% dos dados que existem hoje foram criados nos dois últimos anos; ou seja, o crescimento é exponencial. Hoje temos dados sendo gerados em contextos que não existiam antes: texto vindo de redes sociais, dados recolhidos por sensores, transações comerciais, etc.

Variedade. Há estimativas mostrando que cerca de 80% dos dados de empresas hoje não são numéricos. Isso significa uma variedade grande de formatos: texto, imagens, vídeo, áudio, etc.
E Velocidade, que não se refere somente à produção de dados, mas também ao seu processamento que deve acontecer rapidamente. Para processos em tempo real, como monitoramento de fraude por exemplo, os dados têm que ser processados como um stream em tempo real.

De que maneira esse fenômeno teve impacto sobre a visualização? E como é possível garantir a veracidade dos dados quando usamos ferramentas de visualização? Uma curva de dados pode revelar algumas coisas enquanto oculta outras, certo?

Hoje há muito mais dados disponíveis na web. Vários governos têm iniciativas para publicação de dados na rede. Cientistas também estão disponibilizando muitos dados de pesquisa. A tarefa de visualização tem se tornado um pouco mais fácil devido à criação de ferramentas gratuitas. Hoje há ferramentas de visualização que visam desde o usuário leigo (e.g. Many Eyes) até o desenvolvedor (e.g. d3.org, processing).

A visualização traz a vantagem de ressaltar claramente certos erros numa base de dados, por exemplo. Também é importante haver sempre uma conexão entre a visualização e os dados brutos para que se possa checar quaisquer dúvidas que surjam sobre a informação sendo mostrada.

Como diferenças culturais influenciam nossa interpretação de dados? E na criação de visualizações?

Diferenças culturais podem afetar a interpretação de visualizações de dados de maneira sutil. Um exemplo clássico se refere a leitura das cores. Enquanto o vermelho para nós significa perigo ou alerta, em alguns países asiáticos essa cor é bastante positiva, representando felicidade e coisas boas.

Como são criadas visualizações de streaming data, quando você não sabe que dados existem até ter esses dados?

Um dos maiores desafios quando visualizamos dados em tempo real é a variedade na amplitude. Sempre que desenhamos uma visualização, levamos em conta os valores mais altos e mais baixos dos dados. A ideia é que a variação de valores fique clara nas imagens que criamos. Quando lidamos com streaming data, nem sempre sabemos quais serão os valores extremos a cada momento.

O que você tem desenvolvido no Google? Quais são as particularidades desse trabalho?

Nossa missão no Google é criar visualizações que transmitam informações complexas aos usuários de maneira intuitiva. Já lançamos o Google+ Ripples, uma visualização que mostra como links se tornam virais na rede social. Também lançamos o YouTube TrendsMap, que mapeia os vídeos mais assistidos nos EUA em tempo real.

No Brasil ainda não temos uma cultura forte de disponibilização de dados abertos. Enxerga algum caminho para melhorar isso?

O Brasil já começou a dar os primeiros passos em prol da abertura de dados. Com a criação do dados.gov.br, o governo brasileiro abriu um diálogo com a população e reconheceu nesses dados um bem público.

Você disse que acredita que a visualização pode ser um meio que apela à emoção...

A visualização de dados é uma maneira de entendermos o mundo a nossa volta. Há dados impessoais mas também há muitos dados emocionais. Quando visualizamos nossas conversas com familiares, por exemplo, criamos um mapa íntimo de nossas vidas.

Há alguns anos atrás, o New York Times publicou uma visualização chamada "Faces of the Dead", que mostra o rosto de todos os soldados americanos mortos na guerra com Iraque e Afeganistão. A visualização é atualizada todos os dias, mostrando que as mortes continuam até hoje.


Endereço da página:

Links no texto: