Líderes da indústria na Conferência Beijing Zhiyuan debateram preocupações sobre a homogeneização dos modelos de IA, à medida que as principais performances de avaliação dos modelos convergem cada vez mais e que se acredita que a diferença entre modelos de código aberto e de código fechado seja apenas de 3-6 meses. Chen Weiguang, Sócio-Diretor da Bluerun Ventures, Wang Zhongyuan, Diretor do Instituto de Investigação Zhiyuan, Wang He, Fundador e CTO da Galaxy General, e Li Dahai, CEO da MiniMax, discutiram fontes de valor a longo prazo na era dos grandes modelos. O painel abordou se os modelos de IA e as indústrias de inteligência incorporada estão a caminhar para a homogeneização e onde existem vantagens competitivas duradouras. Observadores da indústria consideram que o talento é fundamental na competição de IA entre EUA e China, com a inteligência incorporada a representar a oportunidade da China de alcançar momentos de rutura comparáveis aos de AlphaGo e ChatGPT.

Líderes da Indústria Rejeitam Preocupações com Homogeneização na Conferência Zhiyuan

Wang Zhongyuan afirmou que, embora várias tabelas de classificação de líderes de grandes modelos sejam vertiginosas e as próprias classificações não sejam totalmente credíveis, as empresas de modelos que se atrevem a fazer demonstrações em direto e a entrar em cenários do mundo real demonstram confiança e conseguem encontrar ciclos fechados de dados em cenários reais. Disse que, no conjunto, a iteração do desempenho dos grandes modelos está muito longe de atingir um gargalo, as rotas técnicas não convergiram e o futuro pode apresentar múltiplos padrões, incluindo “uma superpotência com vários jogadores fortes” ou “múltiplos gigantes lado a lado”. Wang caracterizou as alegações de que a indústria se vai mover para a homogeneização como prematuras.

O Fundador da Galaxy General, Wang He, alargou a discussão dos grandes modelos de linguagem para a inteligência incorporada. Afirmou que os próprios grandes modelos de linguagem ainda têm muitas variáveis, com maior incerteza nas capacidades de compreensão multimodal e de vídeo. Wang caracterizou a inteligência incorporada como estando atualmente na “fase do GPT-1 ao GPT-2”, com a indústria apenas a entrar num período de aceleração.

Wang He descreveu a vantagem competitiva (“moat”) da inteligência incorporada como um sistema completo que engloba o fornecimento de dados de origem (dados sintéticos, dados humanos, dados de robôs), capacidades de refinamento de dados, iteração de hardware e co-design hardware-software, capacidades de fusão de throughput do modelo e capacidades finais de entrega de hardware. Caracterizou isto como um sistema abrangente de “guerreiro hexagonal”, afirmando que não existem produtos maduros deste tipo no mundo e que a vantagem (“moat”) permanece extremamente profunda.

O CEO da MiniMax, Li Dahai, citou o sucesso comercial da Anthropic como prova direta contra a homogeneização. Afirmou que os grandes modelos não podem ser apenas “talentos em forma de T” com capacidades horizontais gerais, mas precisam ter forças verticais. Li explicou que a Anthropic se tornou um fenómeno global porque construiu capacidades de codificação a um nível incomparável, por cima da sua base de modelo geral, apoiando avaliações elevadas e um desempenho comercial impressionante.

Li afirmou que os grandes modelos se estão a integrar na evolução de sistemas, em vez de pontos técnicos isolados. Disse que a otimização futura dos modelos deve coordenar profundamente com os cenários de aplicação, comparando-a com o design de um motor que tem de coordenar com o veículo inteiro, onde as direções de otimização diferem completamente entre carros de corrida F1 e carros para compras de supermercado. Li disse que a universalidade técnica e a universalidade comercial devem ser separadas, com uma boa comercialização a exigir uma otimização extremamente específica do cenário, permitindo a cada empresa criar o seu próprio “moat” ao encontrar a direção certa.

A Galaxy General Reporta Inteligência Incorporada na Fase do GPT-1 ao GPT-2

Wang He partilhou as práticas da Galaxy General com o paradigma WAM (World Action Model). Antes de o paradigma WAM surgir, a Galaxy General usou 1 mil milhão de frames de dados de simulação para verificar possibilidades de escalabilidade para capacidades de agarrar. A empresa desenvolveu o GRASP-VLA para alcançar agarrar zero-shot de objetos arbitrários, sem que nenhum modelo que dependa de dados de teleoperação reais tenha atingido níveis de desempenho equivalentes até à data.

Wang explicou que a emergência do paradigma WAM quebrou completamente o gargalo de dados para a inteligência incorporada. Modelos VLA tradicionais requerem dados com rótulos de ação e só podem basear-se em dados de robôs. O WAM coloca a Ação como núcleo, realizando planeamento de ações ao nível da visão através de previsão futura sem exigir rótulos de ação. Isto significa que os robôs podem aprender diretamente a lógica comportamental a partir de vídeos humanos, com uma enorme quantidade de dados de vídeos humanos a tornar-se material de treino.

Wang afirmou que a Galaxy General publicou o primeiro artigo WAM do mundo em março de 2025, e em abril o Diretor do NVIDIA Embodied Intelligence Lab, Jim Fan, afirmou que o objetivo final dos robôs é o WAM. Wang caracterizou o pré-treino de inteligência incorporada como a entrada num período explosivo, sem limitações para aquisição de dados. Disse que, nos próximos dois anos, a inteligência incorporada irá plenamente inaugurar o seu momento GPT-3.5, com o bilhete de entrada a ser dezenas de milhões de horas de dados de alta qualidade e milhares de milhões de investimento de capital.

IA Multimodal e Inteligência Incorporada Abrem Novas Vias de Escalabilidade

Wang Zhongyuan revelou que as discussões da indústria do ano passado sobre falhas na Scaling Law resultaram de uma ansiedade de que “os dados de pré-treino da internet se tinham esgotado”. Nos últimos dois anos, o pós-treino, a otimização de raciocínio e a auto-evolução recursiva de Agents trouxeram uma nova vaga de melhorias de capacidade. Wang afirmou que isto representa não necessariamente aumentos de parâmetros nos próprios modelos, mas sim que todo o sistema se está a tornar cada vez mais capaz, com a IA a transformar-se de uma ferramenta de conversação num instrumento de execução.

Como instituto de investigação, a Zhiyuan explora a próxima curva de crescimento da inteligência. Nos últimos dois anos, o instituto verificou o paradigma de escalabilidade no campo multimodal, com a série Wujie Emu3 a usar menos de 1% de dados multimodais e dezenas de milhares de milhões de parâmetros já a mostrar melhorias claras de desempenho. O instituto já começou a avançar para modelos base de mundo para o mundo físico, explorando caminhos de escalabilidade para modelos de mundo.

Li Dahai propôs a “lei da densidade de conhecimento” da MiniMax: inteligência global do grande modelo = densidade de conhecimento × número de parâmetros. Revelou que, ao implementar modelos de borda para empresas automóveis no ano passado, só conseguiam atingir 1B de parâmetros; este ano foi atualizado para 4B e, no próximo ano, é provável que atinja dezenas de milhares de milhões. À medida que a tecnologia de quantização melhora e a densidade de conhecimento aumenta, modelos mais fortes após quantização ocupam os mesmos recursos de antes, com a expansão da escala dos modelos de borda apenas a começar.

Li afirmou que muitas conclusões em fases da indústria têm vidas úteis muito curtas, com o desenvolvimento a derrubar constantemente perceções antigas. Disse que não só os modelos de borda têm espaço enorme para crescer, como também o processamento de contexto longo e a otimização com baixo consumo dos grandes modelos de linguagem ainda têm potencial de escalabilidade muito longe de estar totalmente explorado, com a indústria ainda longe de atingir uma fase de convergência.

O Painel Identifica Vantagens da Cadeia de Abastecimento e do Talento da China

Wang Zhongyuan afirmou que o desenvolvimento da tecnologia de IA segue o mesmo caminho da condução autónoma, necessitando de passar por um processo de preocupação e medo para adaptação e uso, e depois para estabelecer sistemas completos de governação e mecanismos de alocação de responsabilidades. Quando a tecnologia consegue trazer melhorias de produtividade de 3-5 vezes, a sua popularização não pode ser bloqueada e, tendo a humanidade experienciado várias vagas de ondas tecnológicas, encontrará soluções de governação correspondentes.

Li Dahai afirmou que a sociedade humana se desenvolveu essencialmente através de “aprender com os erros” — as regras de segurança da aviação e os limites de velocidade nas estradas têm lições dolorosas por trás. A tecnologia de IA vai melhorar a eficiência na descoberta de vulnerabilidades e na correção de problemas, reduzindo significativamente esse custo, com a indústria a dar grande ênfase a bases de segurança desde o estágio inicial e as empresas a assumirem proativamente responsabilidades sociais. Li disse que o padrão de aprender com os erros pode ser difícil de evitar completamente, com riscos de segurança frequentemente a surgirem de dimensões inesperadas, tornando a melhoria de regras através de lições uma realidade que tem de ser enfrentada.

No que diz respeito às vantagens de diferenciação da China em IA, Wang Zhongyuan afirmou que a cadeia de abastecimento da China, as vantagens de fabrico e o vasto mercado interno são suficientes para incubar e catalisar a implementação de tecnologias novas, com a inteligência incorporada e os modelos de mundo provavelmente a tornarem-se áreas onde a China alcança liderança diferenciada.

Wang He afirmou com firmeza que a inteligência incorporada é a oportunidade da China. Expressou a convicção de que o “momento AlphaGo” e o “momento ChatGPT” da inteligência incorporada serão ambos realizados na China, afirmando que, se o zero para um for concluído na China, o um para cem irá certamente amadurecer na China.

Li Dahai acrescentou o fator subjacente mais central: a China tem o maior número de jovens talentos em IA mais inteligentes do mundo, o que é a vantagem mais fundamental. Combinado com vantagens da cadeia de abastecimento, do ecossistema e dos cenários, a China irá certamente avançar significativamente no campo da IA.

FAQ

Em que fase a Galaxy General disse que a inteligência incorporada chegou?

O Fundador e CTO da Galaxy General, Wang He, afirmou na Conferência Beijing Zhiyuan que a inteligência incorporada está atualmente na “fase do GPT-1 ao GPT-2”, com a indústria apenas a entrar num período de aceleração. Wang afirmou que, nos próximos dois anos, a inteligência incorporada irá plenamente inaugurar o seu momento GPT-3.5, com o bilhete de entrada a ser dezenas de milhões de horas de dados de alta qualidade e milhares de milhões de investimento de capital.

Como é que os participantes do painel responderam às preocupações sobre homogeneização de modelos de IA?

O Diretor do Instituto de Investigação Zhiyuan, Wang Zhongyuan, afirmou que, no geral, a iteração do desempenho dos grandes modelos está muito longe de atingir um gargalo e que as rotas técnicas não convergiram, caracterizando as alegações de homogeneização como prematuras. O CEO da MiniMax, Li Dahai, citou o sucesso da Anthropic em capacidades de codificação como prova de que as empresas podem construir diferenciação através de forças verticais. O Wang He da Galaxy General descreveu a vantagem competitiva da inteligência incorporada como um sistema completo que abrange o fornecimento de dados, a iteração do hardware e as capacidades do modelo, afirmando que não existem produtos maduros deste tipo no mundo.

Que vantagens o painel identificou para o desenvolvimento de IA da China?

Os participantes do painel identificaram várias vantagens da China. Wang Zhongyuan citou a cadeia de abastecimento, as vantagens de fabrico e o vasto mercado interno da China como suficientes para catalisar a implementação de novas tecnologias. Li Dahai afirmou que a China possui o maior número de jovens talentos em IA mais inteligentes do mundo como a vantagem mais fundamental. Wang He expressou convicção de que os momentos de rutura da inteligência incorporada comparáveis aos de AlphaGo e ChatGPT serão realizados na China, afirmando que, se o zero para um for concluído na China, o um para cem irá certamente amadurecer na China.

Ver fonte

Aviso legal: As informações contidas nesta página podem provir de fontes externas e têm caráter meramente informativo. Não refletem os pontos de vista nem as opiniões da Gate e não constituem qualquer tipo de aconselhamento financeiro, de investimento ou jurídico. A negociação de ativos virtuais envolve um risco elevado. Não se baseie exclusivamente nas informações contidas nesta página ao tomar decisões. Para mais detalhes, consulte o Aviso legal.

Notícias relacionadas

4h atrás

O modelo de IA Yunzhisheng U2 ocupa o top 8 a nível global e abre acesso aos programadores

5h atrás

Marc Andreessen defende a regulação direcionada da IA enquanto os EUA restringem o acesso ao modelo da Anthropic

9h atrás

Os modelos de IA chineses atingem 18,42 biliões de chamadas semanais de tokens, liderando globalmente pela sétima semana consecutiva

Dan Ives afirma que uma fusão entre a SpaceX e a Tesla é provável no prazo de um ano

Lucas Bennett1h atrás

O CEO da Microsoft, Nadella, propõe uma estrutura de IA para capital humano e capital de tokens

Oliver Grant4h atrás

CEO da MiniMax: a inteligência do Edge Model corresponde à GPT-4, a tecnologia de agentes precisa de tempo

Oliver Grant6h atrás

CEO da Microsoft: a “vala” defensiva da IA é o ciclo de aprendizagem; as empresas não podem terceirizar a aprendizagem

Market Whisper7h atrás

Raoul Pal: A capacidade de computação vai substituir o capital, e o gargalo da IA vai despoletar uma nova rotação de capitais cripto «Terceira vaga»

Market Whisper9h atrás

Comentar

0/400

Nenhum comentário