Blog

Obstáculos à análise de redes sociais por pesquisadores da governança da internet

Escrito por

2 de setembro de 2019

Um dos principais problemas enfrentados hoje em dia por pesquisadores da governança da internet são os mecanismos de análise de dados de redes sociais e plataformas de troca de mensagem privadas entre usuários. É online que ocorrem e se potencializam grande parte dos fenômenos que mais intrigam e desafiam a sociedade atualmente, como a influência a pleitos eleitorais (inclusive por meio de desinformação), a ameaça ao exercício de direitos fundamentais (liberdade de expressão e acesso à informação, notadamente), a prática de bullying, entre outros. Para cientistas interessados nesses e em outros temas, resta a tarefa de mapear demandas, categorizar grupos sociais e objetos de estudo, obter dados significativos, além de extrair conclusões plausíveis a partir de resultados concretos. Mas como fazer isso de maneira fidedigna, representativa e relevante? Quais ferramentas utilizar na análise de redes sociais e quais limitações podemos esperar dessas técnicas? Este post pretende responder essas e outras questões. Confira:

O tamanho da problemática: representatividade

Quem está conectado? O que essas pessoas conversam online representa a sociedade como um todo? Esse é um dos primeiros questionamentos que qualquer pessoa disposta a analisar dados de redes sociais precisa se fazer. No caso brasileiro, a pesquisa TIC Domicílios é uma fonte confiável, abrangente e detalhada, que descreve o perfil do usuário de internet no país. A versão mais recente reflete os avanços de 2018, e já está disponível aqui

Segundo o relatório, quase 70% dos domicílios estão conectados, mas há ainda um forte recorte de classe social, já que nas classes D e E essa porcentagem cai para 48%. No âmbito urbano, a taxa de conexão é de 74%, enquanto no rural o número é 49%.  Ou seja, uma investigação detalhada de discurso online deve, necessariamente, fazer ressalvas ao perfil (inclusive socioeconômico, mas também geográfico) dos usuários sujeitos à análise. 

Além disso, no conjunto de perfis analisados em redes sociais como Facebook e Twitter, por exemplo, é cada vez mais comum o uso de bots para a reprodução em massa de conteúdos impulsionados. Basicamente, bots consistem em contas não representativas de um usuário individual (como se propõe nessas redes), mas milhares de contas que são controladas por um número pequeno de indivíduos. Elas fazem muito barulho online (automação de comentários, reações, compartilhamentos e postagens), mas não refletem nem mesmo a realidade dos usuários individuais que estão online. Por essa razão, quem empreende a difícil empreitada de analisar redes sociais deve primeiro “limpar” o ruído do conjunto de objetos de estudo dessas contas automatizadas, a não ser que o objeto de estudo seja precisamente os bots.

Outro aspecto de análise a se considerar é a personalização que essas plataformas realizam nas experiências dos usuários. Recente pesquisa coordenada pelo Prof. Virgílio Almeida (UFMG e Harvard), por exemplo, tentou mapear traços de radicalização na ferramenta de recomendações de vídeo do YouTube. Uma das maiores fragilidades da tese central da pesquisa, no entanto, diz respeito justamente à personalização que a plataforma realiza com os vídeos que são recomendados a seus usuários, já que isso leva em consideração geolocalização, histórico de navegação, padrão de interesses vinculados à conta do Google, entre outros. Como saber se o estudo reflete efetivamente o que a plataforma tem oferecido a seus usuários? Pesquisadores que analisam sugestões em ferramentas de busca, como Google e Bing, têm o mesmo problema. 

Privacidade e ética nas pesquisas online

As plataformas mais utilizadas como redes sociais por usuários online, a exemplo do Facebook, Twitter, Instagram e YouTube, possuem diferentes configurações de privacidade. Usuários podem, cada vez mais, configurar suas contas para apresentar níveis maiores ou menores de privacidade para suas postagens, comentários, reações, amizades relacionadas, vídeos e fotos disponibilizados ao público, entre outros graus de individualização. Isso não deixa de ser positivo, sob o ponto de vista do exercício do direito à privacidade do usuários, mas limita e restringe bastante o âmbito de análise possível por pesquisadores interessados em mapear perfis, discursos e outras métricas geradas por essas plataformas.

Até mesmo os usuários que deixam seus perfis, comentários e postagens em modo público, o que seria ideal para quem busca analisar as métricas geradas por sua atividade online, acarretam questionamentos válidos a pesquisadores das redes. Essa publicidade, geralmente uma opção default de quem se inscreve nas plataformas, decorre do aceite de termos e condições de uso, que por sua vez são frequentemente criticados pelos mesmos pesquisadores das redes para denunciar a fragilidade do consentimento na cessão de dados pessoais, de direitos de propriedade intelectual sobre o conteúdo postado, entre outros aspectos. 

Em relação à privacidade, também é importante mencionar os limites éticos e de privacidade impostos a pesquisadores que realizam análises etnográficas Ao contrário de questionáveis critérios de empresas de publicidade e marketing, pesquisas acadêmicas sérias buscam ética na coleta, tratamento e divulgação dos dados obtidos. Isso acarreta preocupações com o consentimento de cada um dos sujeitos investigados (casos as informações não estejam em modo público), com a anonimização dos sujeitos (especialmente para fins de divulgação de resultados finais), além de aprovação em comitês independentes de análise desses padrões. Por mais que essas questões diminuam a velocidade de aprovação, realização e publicização de resultados, são padrões que garantem autonomia e privacidade dos sujeitos.

A técnica como instrumento essencial de análise de redes sociais

Muitos dos pesquisadores interessados no comportamento de usuários em redes sociais, por razões naturais de instigação de objetos de estudo, decorrem de áreas relacionadas às ciências sociais humanas e aplicadas tradicionais, como Sociologia, Ciências Políticas, Psicologia, Direito, Antropologia, entre outras. No entanto, o funcionamento dessas redes online impõem, no mínimo, conhecimentos básicos sobre a infraestrutura da internet, de aplicações Over-the-Top (OTT – que utilizam superficialmente a estrutura da internet para ofertar produtos e serviços) e, finalmente, de instrumentos de coleta e análise de dados agregados produzidos por essas redes.

Essa necessidade apresenta a esses cientistas o desafio de realizar pesquisas cada vez mais multidisciplinares, não apenas no que diz respeito ao objeto de estudo (que por si só já envolve a lógica da ciência da computação, da economia comportamental etc.), mas também na composição de suas equipes. Um grupo de trabalho composto por cientistas de dados, programadores, especialistas em novas mídias, além dos tradicionais cientistas sociais, têm maiores chances de utilizar ferramentas adequadas de investigação de comportamentos nas redes, com maior escala de sujeitos e dados analisados e em menor tempo. Como pesquisadores das ciências sociais humanas aplicadas, devemos estar aptos e dispostos a nos aperfeiçoar por meio do aprendizado de softwares de análise de dados e ferramentas acessórias (você consegue verificar alguns exemplos aqui), ou ao menos a trabalhar com equipes cada vez mais diversas em termos de formação. 

Ainda, é preciso lidar com a mudança constante da forma de funcionamento dessas plataformas que, diga-se de passagem, ainda são protegidas por segredos industriais que reduzem a transparência de seus algoritmos. Frequentemente, o tempo da pesquisa não é o tempo do mercado, ou da sociedade. Isso quer dizer que, no espaço temporal em que dados são coletados, analisados e publicizados, podem ocorrer mudanças significativas nos algoritmos que apresentam postagens a determinados usuários, evoluções no número de reações possíveis a um post, novas possibilidades de comentários e compartilhamentos, desativação de ferramentas abandonadas pelas plataformas, entre outras evoluções comuns ao universo das aplicações digitais. Além de pesquisadores terem que se atualizar com uma frequência muito maior do que as evoluções às quais estavam acostumados (a exemplo de constantes alterações legislativas no campo de estudo do Direito), sob pena de suas pesquisas se tornarem irrelevantes ou ultrapassadas no momento de publicação, isso gera o problema adicional de analisar objetos de estudo que estão em constante (e substancial) transformação. 

Das redes sociais para os chats privados

Uma tendência observada nos últimos anos diz respeito à crescente transição de usuários de redes sociais “abertas”, como Facebook e Twitter, para aplicativos de troca de mensagens privadas (inclusive com a formação de grupos). Essa é uma das várias razões que leva o grupo Facebook a gradualmente se fundir, mesclando públicos, informações, dados e troca de mensagens entre suas três plataformas (incluindo WhatsApp e Instagram).

A transição das plataformas públicas para mensageiros privados apresenta obstáculo adicional a pesquisadores de discurso online. O que antes era rastreável por meio de hashtags e de palavras-chave, agora se esconde por trás de grupos semi-públicos (nem sempre o link é disponibilizado ao grande público), números aleatórios de celular e criptografia ponta a ponta. Como mapear a origem e o caminho de informações circuladas (notícias falsas e discurso de ódio, por exemplo)? Qual a melhor forma de reportar o que se obtém em grupos de troca de mensagens, se não há consentimento de todos os membros? Qual seria a estrutura da rede de troca de mensagens (algo que é mais facilmente mapeável no Twitter, por exemplo), se os contatos de cada usuário não são públicos?

Um caso paradigmático que reflete esse problema foi a greve de caminhoneiros no Brasil, em 2018. Os principais foros de deliberação, decisão, e comunicação da greve estavam no WhatsApp, segundo vários relatos individuais. Pesquisadores e jornalistas que queriam examinar esses grupos, entender como o movimento se organizava e quem o compunha, tinham que acompanhar diversos grupos, cada um com mais de 250 membros, de diversos perfis, sem a certeza da identificação pessoal dos usuários para fins de averiguação de suas origens. Ao final, como reportar, com credibilidade, os resultados obtidos? O mesmo dilema surge atualmente, com análises de grupos e troca de mensagens com conteúdo político polarizado

O que esperar para o futuro?

A única certeza que esse cenário realmente apresenta é a de que esses problemas não vão se simplificar. A complexidade do cenário digital aumenta progressivamente, de forma a exigir atualizações cada vez mais frequentes de pesquisadores. As plataformas digitais estão passando por escrutínio público crescente, inclusive por meio de instrumentos normativos mais compreensivos e que exigem maior transparência dos provedores de aplicação, como é o caso da Lei Geral de Proteção de Dados, no Brasil, e da General Data Protection Regulation, na União Europeia. O que se pode esperar da (e para a) comunidade científica é a possibilidade de mais pesquisas interdisciplinares, complementaridade de estudos em outras áreas, o auxílio de ferramentas de automação de análise de dados, entre outros. 

Você se interessa pelo tema de proteção de dados pessoais e segurança informacional? Quer ler mais sobre isso? Aproveite para ler este post do Diego Machado em nosso blog!

As opiniões e perspectivas retratadas neste artigo pertencem a seu autor e não necessariamente refletem as políticas e posicionamentos oficiais do Instituto de Referência em Internet e Sociedade.

Escrito por

Fundador e membro do Conselho Científico do Instituto de Referência em Internet e Sociedade, é Doutorando, Mestre e Bacharel em Direito pela Universidade Federal de Minas Gerais, em regime de cotutela com a Université libre de Bruxelles, na Bélgica. É também Professor de Direito da Universidade Federal de Juiz de Fora.

Especialista em Direito Internacional pelo CEDIN (Centro de Direito Internacional). Foi estagiário docente dos cursos Relações Econômicas Internacionais, Ciências do Estado e Direito, da Universidade Federal de Minas Gerais. Advogado, é também membro da Associação Brasileira de Relações Internacionais (ABRI).

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *