Ferramenta do Google promete 'conversas melhores', mas silencia drag queens enquanto poupa racistas

“E se a tecnologia pudesse ajudar a melhorar a conversa online?” sugere o site que apresenta o Perspective, uma ferramenta criada por pesquisadores do Google e da empresa-irmã Jigsaw para detectar automaticamente discurso de ódio online. A ideia é simples: usar aprendizado de máquina (machine learning, em inglês) para reconhecer conteúdos abusivos ou ameaças – e, assim, ajudar a promover conversas mais saudáveis nas redes sociais ou caixas de comentários.

Pesquisadores brasileiros, no entanto, descobriram que a tecnologia falha em entender o contexto ao analisar determinadas comunidades, como as drag queens. Por isso, se usada como forma de censura, pode funcionar exatamente a favor da propagação do discurso de ódio, silenciando as comunidades que mais sofrem com ela. Na prática, os brasileiros mostraram que o Perspective considera que os tuítes racistas de notórios supremacistas brancos são “conversas melhores” do que os palavrões e a exaltação à cultura gay de um perfil de uma drag queen.

O Perspective foi apresentado em 2017 pela Jigsaw, uma incubadora de projetos do grupo Alphabet (a empresa-mãe do grupo Google). A API pode ser conectada a outros sites, serviços e ser usada em diferentes plataformas interessadas em “hospedar conversas melhores”. Já há, por exemplo, um plugin do Chrome que usa o Perspective para silenciar comentários de ódio. Os jornais The Guardian e The New York Times também testaram a ferramenta para moderar automaticamente suas caixas de comentários. O sistema já está disponível em inglês, francês e espanhol.

O Perspective classifica em uma escala de 0% a 100% a probabilidade de um comentário ser tóxico – rude, desrespeitoso ou não razoável. A tecnologia foi treinada por usuários de internet que ranquearam comentários em uma escala entre “muito tóxico” e “muito saudável”. Com base na experiência humana, ela aprendeu o que costuma ser tóxico para humanos, e aplica automaticamente esses critérios ao analisar conteúdos.

Decididos a monitorar a eficácia da inteligência artificial, pesquisadores do InternetLab, instituto de pesquisa de internet e direito, criaram um programa que usa a API do Perspective para medir a toxicidade de tweets de drag queens e compará-los a perfis da extrema direita, notoriamente racistas e homofóbicos, e outras personalidades para controle. Para analisar o discurso das drag queens – grupo importante na discussão de identidade e papeis de gênero e com voz ativa na comunidade LGBTQ – eles escolheram as 80 participantes do programa RuPaul’s Drag Race. Para o teste, foram usados apenas tuítes em inglês – no total, 114 mil.

Os resultados, que ainda não foram divulgados na íntegra, mostram que, de maneira geral, os perfis das drag queens são considerados mais tóxicos do que os de supremacistas brancos: os primeiros chegam a 37,81% de toxicidade, enquanto o deles vai até 28,87%. Donald Trump, por exemplo, é considerado um perfil saudável. Seu nível de toxicidade é 21,84%.

Ferramenta do Google promete ‘conversas melhores’, mas silencia drag queens enquanto poupa racistas

Nível de toxicidade de diferentes perfis: em vermelho estão os supremacistas brancos e em azul as drag queens. Para controle, Donald Trump está em laranja e Michele Obama em verde.

Fonte: InternetLab

A equipe também testou palavras individualmente. “Bitch” – que pode ser usada como xingamento, como “puta” ou “vadia”, mas também pode ter conotação de exaltação feminina, por exemplo – é considerada 98,18% tóxica. “Gay”, 76,1%. E “lésbica”, 60,79%. “Isso significa que, independentemente do contexto, palavras como gay, lesbian e queer já são consideradas como significativamente tóxicas, o que aponta a existência de vieses no Perspective”, escreveram os pesquisadores.

Por outro lado, supremacistas brancos que usam uma linguagem polida no Twitter foram considerados saudáveis pela ferramenta. Stephen Moluyneux, youtuber conhecido por vomitar teorias racistas supostamente científicas, por exemplo, tuitou que “as três maiores raças têm diferentes volumes cerebrais e médias de QIs”. Nível de toxicidade? Só 21%, segundo o Perspective.

O impacto nas comunidades vítimas do ódio

Quando os pesquisadores testaram o Tune, um plugin para o Chrome que usa o Perspective para suprimir conteúdo tóxico online, eles perceberam como esse tipo de classificação pode funcionar, na prática, para suprimir o discurso e censurar determinadas comunidades. Lançado em março, o Tune permite que os usuários escondam comentários tóxicos no YouTube, Twitter e Facebook, regulados por uma espécie de “volume”.

O mais baixo é o “modo zen”, em que os comentários classificados como abusivos são substituídos por pontinhos na tela. A ideia, segundo a empresa, é permitir que os usuários “foquem no que importa”.
Neste modo, os pesquisadores perceberam que o perfil da drag Yuhua Hamasaki, que participou da décima temporada de Ru Paul’s Drag Race, fica assim:

Foto: Reprodução/Twitter

“Quando considerados individualmente, 3.925 tweets das drag queens tiveram seu potencial de toxicidade avaliado em 80% ou mais, o que significaria que ficariam todos ocultados de usuários do Tune”, explicam os pesquisadores.

Terceirizando a decisão para robôs

Nós já explicamos como a lógica das plataformas de internet estimula que conteúdos que despertem raiva se espalhem – e como elas têm se tornado um celeiro para conteúdos de extrema direita. Conteúdos de ódio estão entre os mais denunciados na SaferNet, organização não-governamental que combate violações de direitos humanos na internet, e o número de denúncias só cresce.

As grandes empresas de internet sabem que têm um problema sério – e as iniciativas de inteligência artificial são uma tentativa de combatê-lo em larga escala, além de mostrar para autoridades e para o público que elas estão agindo. Só que manifestações de racismo, homofobia, machismo e ameaças muitas vezes dependem de uma análise contextual para serem detectadas – e cada grupo tem um modo específico de falar, o que dificulta a análise. Se é difícil para seres humanos classificarem, para robôs é ainda pior. “Essas tecnologias não são plenamente capazes de reconhecer o contexto e discernir quando um conteúdo é legítimo”, diz Dennys Antonialli, diretor-executivo do InternetLab e um dos pesquisadores envolvidos.

‘Na medida em que pessoas negras ou LGBTQs desenvolverem tecnologia, elas terão mais sensibilidade para essas questões.’

Em relação ao discurso LGBTQ analisado pelos brasileiros, a tecnologia falha em captar o diferente significado de palavras consideradas tóxicas quando usadas por membros da comunidade queer. As drags queens costumam usar expressões chulas ou têm uma linguagem mais dura justamente porque, como personalidades públicas, estão na linha de frente e precisam se posicionar como estratégia de sobrevivência ou aceitação. É claro que um robô não entende isso – especialmente se ele foi feito ou treinado por seres humanos que também não entendem. “Elas acabam usando um banco de dados que muitas vezes estão recheados e viciados com vários vieses. E reforçam preconceitos”, diz Antonialli.

Enquanto isso, discursos racistas são aprovados pelos robôs quando não digitados com palavrões e expressões que podem ser consideradas agressivas em alguns ambientes. As máquinas ainda não entendem que ideias escritas de forma elegante também podem ser extremamente tóxicas.

É o mesmo caso, por exemplo, das ferramentas de reconhecimento facial. O fato de elas serem muito mais eficientes para identificarem homens brancos do que mulheres negras não é por acaso – é reflexo de como elas foram feitas e treinadas.“Os algoritmos são treinados. Ter diversidade e pluralidade para que esses bancos tenham menos vieses é super importante. Olhar pra quais são os dados que estão treinando a inteligência artificial é uma primeira questão sensível”, diz Antonialli.

A outra, para ele, é no desenvolvimento. Uma equipe diversificada permite encontrar esses vieses e corrigi-los, dando mais ou menos peso para um dado. Um programador LGBTQ, por exemplo, poderia interferir na carga de toxicidade atribuída à palavra “gay” ou “lésbica”. “Na medida em que pessoas negras ou LGBTQs desenvolverem tecnologia, elas terão mais sensibilidade para essas questões.”

A Jigsaw, por meio da assessoria de imprensa do Google no Brasil, disse que não comentará a pesquisa.

JÁ ESTÁ ACONTECENDO

Quando o assunto é a ascensão da extrema direita no Brasil, muitos acham que essa é uma preocupação só para anos eleitorais. Mas o projeto de poder bolsonarista nunca dorme.

A grande mídia, o agro, as forças armadas, as megaigrejas e as big techs bilionárias ganharam força nas eleições municipais — e têm uma vantagem enorme para 2026.

Não podemos ficar alheios enquanto somos arrastados para o retrocesso, afogados em fumaça tóxica e privados de direitos básicos. Já passou da hora de agir. Juntos.

A meta ousada do Intercept para 2025 é nada menos que derrotar o golpe em andamento antes que ele conclua sua missão. Para isso, dependemos do apoio de nossos leitores.

Você está pronto para combater a máquina bilionária da extrema direita ao nosso lado? Faça uma doação hoje mesmo.

Apoie o Intercept Hoje

TEMAS RELACIONADOS

Notícias

Entre em contato

Tatiana Dias @tatikmd [email protected]

APOIE O JORNALISMO INDEPENDENTE!

O Intercept revela os segredos dos mais poderosos do Brasil.

Você vai fazer sua parte para que nosso jornalismo independente não pare?

Garanta que esse trabalho continue. Faça uma doação de R$ 20 hoje!

APOIE O JORNALISMO INDEPENDENTE!

O Intercept revela os segredos dos mais poderosos do Brasil.

Você vai fazer sua parte para que nosso jornalismo independente não pare?

Garanta que esse trabalho continue. Faça uma doação de R$ 20 hoje!

Ferramenta do Google promete ‘conversas melhores’, mas silencia drag queens enquanto poupa racistas

O impacto nas comunidades vítimas do ódio

Terceirizando a decisão para robôs

Entre em contato

Conteúdo relacionado

Graças ao Facebook, sua operadora de celular te vigia agora mais perto do que nunca

Novo estudo sugere que algoritmo de anúncios do Facebook é uma máquina de estereotipar raça e gênero

Como o YouTube se tornou um celeiro da nova direita radical

Facebook e Google investem contra fake news. Mas são uma das causas do problema.

No YouTube, policial coach ensina a ‘alcançar sonhos’. No Bope, é acusado de tortura

APOIE O JORNALISMO INDEPENDENTE!

O Intercept revela os segredos dos mais poderosos do Brasil.

Você vai fazer sua parte para que nosso jornalismo independente não pare?

Garanta que esse trabalho continue. Faça uma doação de R$ 20 hoje!

APOIE O JORNALISMO INDEPENDENTE!

O Intercept revela os segredos dos mais poderosos do Brasil.

Você vai fazer sua parte para que nosso jornalismo independente não pare?

Garanta que esse trabalho continue. Faça uma doação de R$ 20 hoje!

Ferramenta do Google promete ‘conversas melhores’, mas silencia drag queens enquanto poupa racistas

O impacto nas comunidades vítimas do ódio

Terceirizando a decisão para robôs

Entre em contato

Conteúdo relacionado

Graças ao Facebook, sua operadora de celular te vigia agora mais perto do que nunca

Novo estudo sugere que algoritmo de anúncios do Facebook é uma máquina de estereotipar raça e gênero

Como o YouTube se tornou um celeiro da nova direita radical

Facebook e Google investem contra fake news. Mas são uma das causas do problema.

Líder de entregadores diz que breque quer abalar imagem do iFood e critica falta de apoio do governo Lula

Réu ao som de marcha fúnebre e ignorado por Trump: a semana humilhante de Bolsonaro

Ministro de Lula ressuscita projeto bolsonarista que enfraquece Petrobras e favorece bilionário

Extrema direita usa julgamento de Bolsonaro para atacar o STF

No YouTube, policial coach ensina a ‘alcançar sonhos’. No Bope, é acusado de tortura

Inscreva-se na newsletter para continuar lendo. É grátis!