Internet Morto? Um Terço dos Novos Sites São Gerados por IA, Diz Stanford

Resumo

  • Até meados de 2025, 35% dos sites recém-publicados eram gerados por IA ou assistidos por IA, um aumento em relação a zero antes do lançamento do ChatGPT em novembro de 2022.
  • Os efeitos confirmados são contração semântica e positividade artificial — não desinformação ou homogeneidade estilística, apesar do que a maioria das pessoas acredita.
  • Com uma prevalência de IA de 35%, o risco de colapso do modelo passa de uma preocupação teórica para uma empírica para a próxima geração de modelos fundamentais.

Um novo estudo apresenta um número para quanto da internet agora é gerado por IA: 35%. Essa é a parcela de sites recém-publicados classificados como gerados por IA ou assistidos por IA até meados de 2025, de acordo com pesquisas da Universidade de Stanford, Imperial College London e Internet Archive. A cifra era praticamente zero antes do lançamento do ChatGPT em novembro de 2022. “Considero bastante impressionante a velocidade com que a IA está tomando conta da web,” disse Jonáš Doležal, pesquisador do Imperial College London e coautor do artigo, ao 404 Media. “Após décadas de humanos moldando-a, uma parte significativa da internet tornou-se definida por IA em apenas três anos.” O estudo, intitulado “O Impacto do Texto Gerado por IA na Internet”, baseou-se em 33 meses de snapshots de sites do Wayback Machine do Internet Archive e utilizou um detector de texto por IA chamado Pangram v3 para classificar cada página.

 Os danos confirmados: vibrações, não fatos Pesquisadores testaram seis hipóteses sobre o que o conteúdo de IA faz na web. Apenas duas resistiram à análise de dados. A primeira: Estamos nos tornando uma horda de NPCs burros agindo da mesma maneira… Ou, mais cientificamente, a web está se tornando menos semanticamente diversa.

Sites gerados por IA apresentaram pontuações de similaridade semântica pareadas 33% mais altas do que as de sites escritos por humanos. As mesmas ideias continuam sendo expressas de quase as mesmas formas.

O artigo sugere que a janela de Overton online pode estar se estreitando, não por censura ou campanhas coordenadas, mas porque os modelos de linguagem otimizam para saídas próximas à sua distribuição de treinamento. A segunda: A web está ficando agressivamente otimista. O conteúdo de IA apresentou pontuações de sentimento positivo mais de 107% superiores ao conteúdo humano. Os pesquisadores relacionam isso às tendências bem documentadas de bajulação dos LLMs — treinados com sinais de aprovação humana, eles produzem textos que parecem sanitizados, sem atritos e persistentemente otimistas. Uma internet inundada de conteúdo alegre e homogeneizado pode marginalizar a dissidência humana em larga escala sem que ninguém precise puxar uma alavanca.

Apesar da crença pública generalizada, o estudo não encontrou evidências estatisticamente significativas de que o conteúdo de IA esteja tornando a internet menos factual. Os pesquisadores não encontraram correlação relevante entre a prevalência de IA e a taxa de erros factuais.

A hipótese de monocultura estilística — IA achatando vozes individuais em um registro uniforme genérico — foi a crença mais fortemente sustentada pelos entrevistados (83% concordaram). Os dados não a confirmaram. Análises ao nível de caracteres não revelaram aumento estatisticamente significativo na homogeneidade estilística relacionada à prevalência de IA. O problema do colapso do modelo ficou sério As apostas mais amplas vão além da qualidade do discurso. Com uma prevalência de IA de 35%, o risco teórico de colapso do modelo — onde modelos futuros se degradam após treinarem com dados gerados por IA — passa de uma preocupação acadêmica para uma realidade empírica. Modelos fundamentais futuros treinados com rastros atuais da web inevitavelmente ingerirão dados substancialmente gerados por IA e medidamente menos diversos semanticamente. A equipe está agora colaborando com o Internet Archive para transformar o estudo em uma ferramenta de monitoramento contínuo e ao vivo, acompanhando a participação da IA na web em tempo real, em vez de uma única captura. Uma pesquisa nos EUA realizada junto ao estudo revelou que a maioria dos americanos já acredita em todas as seis hipóteses negativas, incluindo aquelas que os dados não apoiam. Pessoas que usam IA com pouca frequência estavam 12% mais propensas a acreditar nos danos do que usuários frequentes. Crentes na Teoria da Internet Morta, conheçam os dados: A internet não está morta, mas 35% do que é novo provavelmente é conteúdo zumbi de alguma forma.

Ver original
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
  • Recompensa
  • Comentar
  • Republicar
  • Partilhar
Comentar
Adicionar um comentário
Adicionar um comentário
Nenhum comentário
  • Fixar