Internet Morto? Um Terço dos Novos Sites São Gerados por IA, Diz Stanford

Question

#### Resumo* Até meados de 2025, 35% dos sites recém-publicados eram gerados por IA ou assistidos por IA, um aumento em relação a zero antes do lançamento do ChatGPT em novembro de 2022.* Os efeitos confirmados são contração semântica e positividade artificial — não desinformação ou homogeneidade estilística, apesar do que a maioria das pessoas acredita.* Com uma prevalência de IA de 35%, o risco de colapso do modelo passa de uma preocupação teórica para uma empírica para a próxima geração de modelos fundamentais.Um novo estudo apresenta um número para quanto da internet agora é gerado por IA: 35%. Essa é a parcela de sites recém-publicados classificados como gerados por IA ou assistidos por IA até meados de 2025, de acordo com pesquisas da Universidade de Stanford, Imperial College London e Internet Archive. A cifra era praticamente zero antes do lançamento do ChatGPT em novembro de 2022."Considero bastante impressionante a velocidade com que a IA está tomando conta da web," disse Jonáš Doležal, pesquisador do Imperial College London e coautor do artigo, ao 404 Media. "Após décadas de humanos moldando-a, uma parte significativa da internet tornou-se definida por IA em apenas três anos."O estudo, intitulado “O Impacto do Texto Gerado por IA na Internet”, baseou-se em 33 meses de snapshots de sites do Wayback Machine do Internet Archive e utilizou um detector de texto por IA chamado Pangram v3 para classificar cada página.Os danos confirmados: vibrações, não fatosPesquisadores testaram seis hipóteses sobre o que o conteúdo de IA faz na web. Apenas duas resistiram à análise de dados.A primeira: Estamos nos tornando uma horda de NPCs burros agindo da mesma maneira… Ou, mais cientificamente, a web está se tornando menos semanticamente diversa.Sites gerados por IA apresentaram pontuações de similaridade semântica pareadas 33% mais altas do que as de sites escritos por humanos. As mesmas ideias continuam sendo expressas de quase as mesmas formas.![](https://img-cdn.gateio.im/social/moments-b262f61631-b1757661ef-8b7abd-badf29)O artigo sugere que a janela de Overton online pode estar se estreitando, não por censura ou campanhas coordenadas, mas porque os modelos de linguagem otimizam para saídas próximas à sua distribuição de treinamento.A segunda: A web está ficando agressivamente otimista.O conteúdo de IA apresentou pontuações de sentimento positivo mais de 107% superiores ao conteúdo humano. Os pesquisadores relacionam isso às tendências bem documentadas de bajulação dos LLMs — treinados com sinais de aprovação humana, eles produzem textos que parecem sanitizados, sem atritos e persistentemente otimistas.Uma internet inundada de conteúdo alegre e homogeneizado pode marginalizar a dissidência humana em larga escala sem que ninguém precise puxar uma alavanca.![](https://img-cdn.gateio.im/social/moments-ac90127edf-76785c91a4-8b7abd-badf29)Apesar da crença pública generalizada, o estudo não encontrou evidências estatisticamente significativas de que o conteúdo de IA esteja tornando a internet menos factual. Os pesquisadores não encontraram correlação relevante entre a prevalência de IA e a taxa de erros factuais.A hipótese de _monocultura estilística_ — IA achatando vozes individuais em um registro uniforme genérico — foi a crença mais fortemente sustentada pelos entrevistados (83% concordaram). Os dados não a confirmaram. Análises ao nível de caracteres não revelaram aumento estatisticamente significativo na homogeneidade estilística relacionada à prevalência de IA.O problema do colapso do modelo ficou sérioAs apostas mais amplas vão além da qualidade do discurso. Com uma prevalência de IA de 35%, o risco teórico de colapso do modelo — onde modelos futuros se degradam após treinarem com dados gerados por IA — passa de uma preocupação acadêmica para uma realidade empírica. Modelos fundamentais futuros treinados com rastros atuais da web inevitavelmente ingerirão dados substancialmente gerados por IA e medidamente menos diversos semanticamente.A equipe está agora colaborando com o Internet Archive para transformar o estudo em uma ferramenta de monitoramento contínuo e ao vivo, acompanhando a participação da IA na web em tempo real, em vez de uma única captura.Uma pesquisa nos EUA realizada junto ao estudo revelou que a maioria dos americanos já acredita em todas as seis hipóteses negativas, incluindo aquelas que os dados não apoiam. Pessoas que usam IA com pouca frequência estavam 12% mais propensas a acreditar nos danos do que usuários frequentes. Crentes na Teoria da Internet Morta, conheçam os dados: A internet não está morta, mas 35% do que é novo provavelmente é conteúdo zumbi de alguma forma.

Internet Morto? Um Terço dos Novos Sites São Gerados por IA, Diz Stanford

Resumo

Tópicos em destaque

WCTCTradingKingPK

CryptoMarketsDipSlightly

IsraelStrikesIranBTCPlunges

#DailyPolymarketHotspot

SolanaReleasesQuantumRoadmap

Fixar