Se você já deixou um comentário em um vídeo do YouTube, um novo site afirma que pode ser capaz de encontrar todos os comentários que você já fez em qualquer vídeo que já assistiu. Em seguida, uma IA pode criar um perfil do comentarista e adivinhar onde você mora, quais idiomas fala e quais podem ser suas inclinações políticas.
O serviço se chama YouTube-Tools e é apenas o mais recente em um conjunto de ferramentas baseadas na web que começou como um site para investigar nomes de usuário do League of Legends. Agora, ele usa um modelo de linguagem de grande porte modificado, criado pela empresa Mistral, para gerar um relatório de histórico sobre comentaristas do YouTube com base em suas conversas. Seu desenvolvedor afirma que ele foi feito para ser usado pela polícia, mas qualquer pessoa pode se cadastrar. Custa cerca de US$ 20 por mês para usar, e tudo o que você precisa para começar é um cartão de crédito e um endereço de e-mail.
A ferramenta representa um risco significativo à privacidade e mostra que as pessoas podem não ser tão anônimas nos comentários do YouTube quanto pensam. O relatório do site fica pronto em segundos e fornece dados suficientes para que uma IA identifique detalhes sobre um comentarista. A ferramenta pode ser uma vantagem para assediadores que tentam criar perfis de seus alvos, e a 404 Media já viu evidências de que comunidades focadas em assédio usaram outras ferramentas do mesmo desenvolvedor.
O YouTube-Tools também parece violar as políticas de privacidade do YouTube e levanta questões sobre o que a plataforma está fazendo para impedir a coleta e o reaproveitamento de dados das pessoas. "Os mecanismos de busca públicos só podem coletar dados em conformidade com o arquivo robots.txt do YouTube ou com permissão por escrito prévia do YouTube", diz a política.
Para testar o serviço, inseri um comentarista aleatório do YouTube no sistema e, em segundos, o site encontrou dezenas de comentários em vários vídeos e produziu um parágrafo gerado por IA sobre ele. "Possível localização/região: A presença de comentários em italiano e referências a 'X Factor Italia' e culinária italiana sugerem uma associação com a Itália", dizia o relatório.
"Opiniões políticas/sociais/culturais: Alguns comentários refletem um nível de crítica a entrevistadores e normas sociais (por exemplo, comentários sobre masculinidade), indicando um envolvimento com discussões culturais contemporâneas. No entanto, não há uma posição política explícita expressa", continuava.
De acordo com o site, ele tem acesso a "1,4 bilhão de usuários e 20 bilhões de comentários". O conjunto de dados não é completo; o YouTube tem mais de 2,5 bilhões de usuários.
O YouTube-Tools foi lançado há cerca de uma semana e é uma evolução do LoL-Archiver. Há também o nHentai-Archiver, que pode fornecer um histórico completo de comentários de um usuário no popular site de compartilhamento de mangás adultos. O Kick-Tools pode gerar o histórico de chat ou de banimento de um usuário no site de streaming Kick. O Twitch-Tools pode fornecer o histórico de chat de uma conta, organizado por data e classificável por todos os canais com os quais o usuário interage.
O Twitch-Tools só monitora um canal se um usuário solicitar especificamente. No momento desta publicação, o site diz que está monitorando 39.057 canais da Twitch. Por exemplo, consegui pegar um nome de usuário de uma transmissão popular da Twitch, inserir na ferramenta e rastrear todas as vezes que aquele usuário fez um comentário em outro dos canais monitorados.
Questionado sobre o motivo de ter criado essas ferramentas, o desenvolvedor não hesitou. "O objetivo final de quem rastreia canais da Twitch certamente seria coletar informações sobre usuários específicos", disse.
A Twitch não respondeu ao pedido de comentário da 404 Media, e o YouTube confirmou o recebimento do pedido, mas não forneceu uma declaração a tempo da publicação. No entanto, conversei com alguém responsável por um endereço de e-mail de contato listado na página "sobre" do LoL-Archiver. Eles disseram que estão baseados na Europa, têm experiência em OSINT (inteligência de fontes abertas) e frequentemente trabalham com a polícia em seu país. "Decidi lançar essas ferramentas inicialmente como um projeto para construir algo que pudesse ser usado por agências de aplicação da lei e investigadores particulares."
De acordo com o desenvolvedor, eles já forneceram a ferramenta para policiais em Portugal, Bélgica e "outros países da Europa". Eles disseram à 404 Media que o site é destinado a investigadores particulares, jornalistas e policiais.
"Para evitar abusos, só permitimos o acesso ao site para pessoas com propósitos legítimos", disseram. Perguntei como o site verifica os usuários. "Pedimos que os usuários aceitem nossos Termos de Uso e fazemos solicitações direcionadas de KYC [conheça seu cliente] para pessoas que estimamos terem motivos ilegítimos para usar o site. Se descobrirmos que um usuário não tem um propósito legítimo para usar nosso serviço, de acordo com nossos termos de uso, nos reservamos o direito de encerrar o acesso desse usuário ao site."
Os Termos de Serviço do site deixam isso explícito no primeiro parágrafo. "O serviço é distribuído apenas para investigadores profissionais licenciados e autoridades policiais. Indivíduos não profissionais não têm permissão para se inscrever no serviço", diz o texto.
Mas o YouTube-Tools é um site do tipo "dê acesso primeiro, peça comprovação depois". A 404 Media conseguiu criar uma conta e começar a navegar pelas informações em minutos após pagar um mês de serviço com um cartão de crédito. O site não fez nenhuma pergunta sobre como eu planejava usar o serviço nem solicitou qualquer outra informação sobre mim.
Perguntei ao desenvolvedor se ele já havia removido alguém da plataforma. Eles disseram que removeram um cliente há algumas semanas, depois de descobrir que o e-mail usado para obter a licença era "temporário". O desenvolvedor disse que entrou em contato com o cliente para perguntar por que ele queria a ferramenta e não obteve resposta. "Eles nos ignoraram, e, por isso, reportamos o problema ao Stripe e encerramos o acesso deles."
Os resumos de IA são novos e só existem para as ferramentas do YouTube. "O resumo de IA serve para fornecer pontos de interesse, para que um investigador não precise analisar (potencialmente) milhares de comentários", disse o desenvolvedor. "Esse resumo não substitui o processo de pesquisa e investigação do profissional, mas dá pistas sobre onde ele pode começar a procurar."
Perguntei sobre as possíveis violações de privacidade que a ferramenta apresenta, e o desenvolvedor reconheceu que elas existem. "Mas tentamos limitá-las durante nosso processo de verificação", disseram. Novamente, consegui me cadastrar no site apenas com um cartão de crédito e um e-mail. Não fui verificado.
"Também acredito que a ferramenta pode ser uma fonte valiosa de informação para profissionais, como agências policiais, investigadores particulares e jornalistas", disse o desenvolvedor. "É por isso que atualmente oferecemos acesso gratuito a agências policiais que solicitarem, e já oferecemos [o serviço] a várias agências. Se alguém quiser remover qualquer informação que as ferramentas arquivaram, pode nos enviar uma solicitação formal, com a qual cumpriremos, como sempre fizemos."
A coleta de dados públicos é um grande problema. No mês passado, pesquisadores no Brasil publicaram um conjunto de dados construído a partir de 2 bilhões de mensagens do Discord coletadas de servidores publicamente disponíveis. No ano passado, o Discord encerrou um serviço chamado Spy Pet, semelhante ao YouTube-Tools.