Entrevista com Ricardo Correia, autor do artigo sobre a popularidade das aves brasileiras na internet

Por: Felipe Moreno

Batemos um papo com Ricardo Correia, pesquisador da parte da equipe do LACOS 21 e autor do artigo Familiarity breeds content: assessing bird species popularity with culturomics que foi publicado em fevereiro na revista científica PeerJ e que fala sobre a sobre a popularidade das espécies de pássaros brasileiros na internet.Leia mais: A importância da fama das aves brasileiras na internet

Na entrevista abaixo, falamos um pouco sobre seu artigo, seu novo projeto, além de algumas explicações sobre big data e culturômica, principais ferramentas usadas no processo de produção do seu trabalho.

Como surgiu a ideia do estudo com as aves brasileiras na internet?

Ricardo Correia: Surgiu na sequência do desenvolvimento das ideias do grupo de pesquisa, que resultaram num outro artigo a que vai ser publicado brevemente na revista Frontiers in Ecology and the Environment intitulado “Conservation Culturomics“.

Do que se trata?

RC: Nesse artigo, pretendemos apresentar esta nova área de pesquisa e as oportunidades geradas pela emergência do big data para melhor entender a relação cultural entre o homem e a natureza. Uma das novidades que apresentamos nesse artigo é a possibilidade de mapear os locais que apresentam comunidades de espécies mais visíveis num determinado local, país ou até mesmo globalmente. Para exemplificar essa aplicação, usamos o exemplo do Brasil e das comunidades de aves brasileiras. No entanto, ao produzir esse mapa, começamos a nos perguntar quais os processos que geram os padrões observados e decidimos investigar com mais detalhe essa situação. É nesse contexto que surge o artigo das aves brasileiras na internet, onde mostramos o papel da familiaridade para a popularidade de uma espécie.

Vimos que o big data foi a principal ferramenta nesse trabalho. Pra você, qual a importância do big data e até onde ele pode chegar?

RC: Eu acho que big data não terá o papel de substituir os métodos científicos e bancos de dados mais tradicionais, mas poderá contribuir significativamente para a ciência a nível global, permitindo responder a novas perguntas e gerar novas áreas de pesquisa. A revolução que ocorreu com o aparecimento da internet e com a evolução computacional produziu várias mudanças significativas na sociedade em geral, e o mundo cientifico não é diferente. No passado, os dados científicos eram obtidos de forma minuciosa, fruto de experiências planejadas e detalhadas, mas eram tradicionalmente escassos. O aparecimento de grandes bancos de dados disponíveis aos cientistas enquadra-se num contexto totalmente diferente: os dados são superabundantes, mas muitas vezes complexos e “desorganizados”. Isso traz aos cientistas novas oportunidades, mas também novos desafios! Por um lado, a abundância de dados pode potenciar a resposta a várias questões que até aqui eram muito complexas para ser abordadas com pequenas bases de dados (o nosso estudo é um exemplo de um trabalho que seria impossível de fazer à escala nacional e internacional recorrendo a técnicas mais tradicionais). Por outro lado, esses dados são complexos e as técnicas para os obter e trabalhar bastante especializadas.

Leia mais: Você sabe o que é big data?

Com esse montante de dados a serem analisados, podemos imaginar o tempo e o difícil processo que deve ter sido lidar com todas as informações. Qual foi a maior dificuldade encontrada no decorrer da pesquisa?

RC: Realmente é um desafio trabalhar na área de big data, e esse desafio na verdade começa antes da obtenção dos dados e estende-se para além do volume de dados. Para além da necessidade de identificar os dados mais adequados à pesquisa dentro do “mar” de informação que a internet disponibiliza, é também necessário compreender como os dados de interesse são gerados e quais os potenciais vieses que eles apresentam. Por exemplo, no nosso estudo foi utilizada informação retirada do motor de busca Google. Hoje em dia, esse motor de busca inclui uma série de algoritmos de personalização de busca a nível espacial e pessoal para retornar os resultados mais “adequados” tendo em conta a localização e o perfil do internauta. O problema que essa situação levanta relaciona-se com a capacidade de replicação do estudo: se os dados obtidos resultarem de uma busca personalizada é impossível que outro pesquisador replique a mesma busca. Dessa forma, foi necessário desenvolver um programa específico para contornar esse problema. Este é apenas um exemplo das dificuldades de trabalhar com big data, mas essa área apresenta vários outros desafios que ainda estão a ser trabalhados.

A culturômica ainda é uma técnica emergente e está crescendo aos poucos, sem muitos trabalhos expressivos conhecidos. Nos fale um pouco sobre ela!

RC: O trabalho original que define o campo da culturômica foi publicado em 2011 na revista Science e foi liderado por Jean-Baptiste Michel da universidade de Harvard. Nesse trabalho original, os autores iniciaram o campo da culturômica (a análise quantitativa da frequência com que palavras são mencionadas em diferentes conjuntos de texto) usando o banco de dados do Google Books. Esse foi um trabalho impressionante pois o banco de dados inclui 4% de todos os livros publicados pelo homem desde sempre!

E como você conheceu a culturômica? Por que se interessou em trabalhar com isso?

RC: Foi através dessa publicação que tomei originalmente conhecimento da técnica, mas, entretanto, têm saído outros trabalhos com abordagens ligeiramente diferentes, mas que usam técnicas semelhantes. Ao ler alguns desses artigos e em discussão com a restante equipe do projeto (Dra. Ana Malhado, Prof. Richard Ladle e o Dr. Paul Jepson da Universidade de Oxford), surgiu a ideia e o interesse de expandir a análise para outros bancos de dados digitais e aplicar essas técnicas à área da conservação da natureza. Foi nessa altura que começamos a trabalhar no artigo que procura lançar a aplicação dessas técnicas à conservação e daí até surgir a ideia de analisar a frequência com que aves brasileiras são mencionadas nas páginas da internet foi um saltinho!

Na conclusão de seu artigo, podemos encontrar que a divulgação sobre o risco de extinção não foi muito relevante para a popularidade das espécies, e que isso pode significar uma falha nessa divulgação.

RC: Realmente o risco de extinção e o estatuto de endemismo não parecem ser fatores importantes na visibilidade digital das espécies. No entanto, não consideramos que isso seja uma falha de divulgação dessas espécies e da sua vulnerabilidade, mas sim o efeito da familiaridade que se sobrepõe a tudo o resto. A ser verdade, essa informação é extremamente importante para os conservacionistas pois pode permitir desenvolver novas formas de divulgação de espécies ameaçadas. As poucas exceções a esse padrão que identificamos são espécies que de alguma forma ganharam visibilidade mais global através das mídias (o caso dos filmes “Rio”) ou de espécies particularmente atrativas, como é o caso de algumas araras.

Nesse caso, como você acha que isso esse tipo de estudo pode ajudar nessa questão?

RC: Creio que um melhor entendimento e um estudo mais aprofundado de como estas espécies conseguiram ganhar um lugar de visibilidade junto do público em geral pode ajudar os conservacionistas na divulgação de espécies ameaçadas de extinção.

Deixe um comentário

Preencha os seus dados abaixo ou clique em um ícone para log in:

Logotipo do WordPress.com

Você está comentando utilizando sua conta WordPress.com. Sair /  Alterar )

Imagem do Twitter

Você está comentando utilizando sua conta Twitter. Sair /  Alterar )

Foto do Facebook

Você está comentando utilizando sua conta Facebook. Sair /  Alterar )

Conectando a %s