O gargalo de capacidade de processamento do cluster de 100 mil cartões AI está sendo transferido: como a interconexão óptica pode se tornar o núcleo da nova infraestrutura?

Question

Nos últimos dois anos, as discussões sobre poder de computação em IA quase que exclusivamente giraram em torno de GPUs: a lacuna na oferta do H100, os parâmetros de desempenho do B200, o roteiro arquitetônico da próxima geração de GPUs, formando a narrativa principal do setor. No entanto, quando o cluster de treinamento de IA passou de milhares para dezenas de milhares e até centenas de milhares de GPUs, uma restrição estrutural mais profunda começou a emergir — a eficiência do fluxo de dados entre GPUs, que está se tornando o limite final para o desempenho geral do cluster.

O arquiteto de rede óptica da Tencent, Fu Sidong, apontou no início de 2026 que, de 2016, com a arquitetura Pascal, até 2024, com a arquitetura Blackwell, o poder de computação em IA cresceu aproximadamente 1000 vezes em oito anos; a capacidade de inferência cresceu 32 vezes nos últimos quatro anos, enquanto o poder de treinamento aumentou 16 vezes. Ao mesmo tempo, a largura de banda da rede aumentou de 200G para 800G, apenas 4 vezes. Essa disparidade — “poder de computação como foguete, rede como caminhada” — faz com que a velocidade de transmissão de dados entre nós se torne o gargalo crítico em clusters de dezenas de milhares ou centenas de milhares de GPUs, afetando severamente a eficiência geral do cluster e a utilização de recursos.

Essa realidade está reformulando a lógica de investimento em infraestrutura de IA e as escolhas de roteiros tecnológicos. Quando a tecnologia de interconexão óptica evolui de uma solução de compensação de desempenho local para uma capacidade fundamental que sustenta a operação em larga escala de clusters de IA, compreender sua lógica técnica, o cenário de mercado e o valor industrial torna-se uma questão fundamental na avaliação do setor de poder de computação em IA. Paralelamente, o lado do investimento também está passando por uma transformação estrutural semelhante — de uma alocação de ativos única para uma coordenação multissetorial, formando uma cadeia de valor que conecta infraestrutura de poder de computação e infraestrutura financeira.

O dilema de comunicação em clusters de cem mil GPUs: o escore de poder de computação versus rede

A eficiência de um cluster de GPUs não é determinada apenas pelo pico de desempenho de uma GPU individual, mas pelo tempo necessário para que todas as GPUs realizem cálculos colaborativos. Em treinamentos distribuídos de grandes modelos, sincronizações frequentes de parâmetros e trocas de gradiente fazem com que a capacidade de comunicação entre os nós determine diretamente a eficiência total do treinamento. No white paper da tecnologia CPO da H3C, é destacado que, nos últimos anos, a velocidade de aumento do poder de computação por GPU superou em muito a evolução da largura de banda de interconexão de rede; a maioria dos clusters aumenta o número de GPUs na camada de computação, mas a expansão da largura de banda de comunicação fica relativamente atrasada, resultando em tempos de comunicação cada vez mais altos na proporção do tempo total de treinamento, com GPUs aguardando longamente a chegada de dados, dificultando a ampliação proporcional do poder de computação efetivo.

Esse fenômeno possui uma base de quantificação clara. Dados de palestras da Tencent mostram que, nos últimos quatro anos, o poder de treinamento cresceu 16 vezes, o de inferência 32 vezes, enquanto a largura de banda de rede aumentou de 200G para 800G, apenas 4 vezes. Quando o cluster ultrapassa dezenas de milhares de GPUs e evolui para centenas de milhares, o padrão de comunicação entre GPUs deixa de ser uma simples transmissão ponto a ponto, passando a envolver milhares ou dezenas de milhares de links operando simultaneamente, formando um sistema complexo. Qualquer congestionamento ou atraso em um link pode atrasar todo o ciclo de iteração de treinamento.

Um artigo publicado em fevereiro de 2026 pela IEEE reforça essa avaliação: à medida que o tamanho dos modelos de IA cresce, a interconexão torna-se o gargalo crítico em clusters de GPUs em grande escala, e as redes tradicionais de comutação por pacote enfrentam desafios crescentes em termos de consumo de energia, custo e escalabilidade. Pesquisas indicam que arquiteturas baseadas em comutação óptico-eletrônica podem reduzir o consumo de energia da camada backbone em quase 99%, e diminuir o custo de ciclo de vida em 76% ao longo de oito anos.

Dados do setor indicam que essa contradição estrutural está impulsionando uma expansão acelerada da infraestrutura de comunicação óptica. Segundo a UBS, a demanda global por fibra óptica cresceu cerca de 2% ao ano nos últimos cinco anos, mas, com a aceleração na construção de data centers de IA, a demanda nos próximos anos deve superar 30% ao ano, com uma taxa de crescimento composta superior a 75%. Antes, 70% a 80% da demanda por fibra vinha de operadoras de telecomunicações; a UBS projeta que, até 2030, a participação de empresas e data centers ultrapassará 80%. A indústria de fibra está passando de uma infraestrutura de comunicação tradicional para um componente central na infraestrutura de IA.

Interconexão óptica: uma rota tecnológica determinística para resolver o gargalo de poder de computação

Diante da disparidade entre poder de computação e rede, a tecnologia de interconexão óptica está ascendendo de uma solução complementar para uma escolha arquitetônica fundamental. A expansão de clusters de IA geralmente ocorre em três dimensões: escalonamento vertical (Scale-up, conectando GPUs dentro de um rack com alta velocidade), escalonamento horizontal (Scale-out, conectando racks em clusters distribuídos), e escalonamento transregional (Scale-across, conectando data centers geograficamente dispersos). Cada dimensão tem requisitos distintos de largura de banda, latência, consumo de energia e alcance de transmissão, mas todas apontam para a indispensabilidade da interconexão óptica.

No cenário de Scale-up, a interconexão óptica substitui principalmente cabos de cobre ou switches eletrônicos, proporcionando maior largura de banda e menor latência na comunicação intra-nó. Por exemplo, a Nvidia NVLink 576, com base em Spectrum-X Ethernet switch com tecnologia CPO, oferece uma capacidade de troca de 512×200Gbps, incluindo 32 engines de fibra óptica de 1,6T, para cenários de Scale-out e Scale-across. O Huawei CloudMatrix 384, com arquitetura de interconexão totalmente igualitária, usa 3.168 fibras ópticas e 6.912 módulos LPO de 400G para construir um barramento de interconexão de alta velocidade, conectando 384 NPUs, 192 CPUs e recursos de armazenamento e memória de forma integrada.

No nível de roteiro técnico, famílias de tecnologias “x”PO — como LPO, LRO, CPO — estão em rápida evolução. Dados da LightCounting indicam que o mercado global de módulos de fibra óptica Ethernet deve crescer 35% em 2026, atingindo US$ 18,9 bilhões, e deve ultrapassar US$ 35 bilhões até 2030, com a demanda por módulos de alta velocidade como 800G e 1,6T liderando o mercado. A TrendForce projeta que, em 2026, a participação de módulos ópticos de 800G ou mais na quantidade total de transceptores ultrapassará 60%, com base na estimativa de quase 4 milhões de unidades de TPUs Google, a demanda por módulos de 800G deve superar 6 milhões de unidades.

A questão do consumo de energia é um dos principais desafios dos módulos ópticos plugáveis. A tecnologia Apollo OCS do Google usa espelhos de reflexão micro para conectar diretamente fibras ópticas de dados, evitando as perdas de energia e atrasos causados pelas conversões entre luz e eletricidade em tecnologias tradicionais. Um switch OCS consome cerca de 95% menos energia do que switches tradicionais. Em termos de latência, o chip THine, que não usa DSP óptico, adaptado para cenários de interconexão de curto alcance com LPO ou CPO, consegue reduzir a latência em 90% e economizar 73% de energia.

O vice-diretor do Instituto de Pesquisa da China Telecom, Li Junjie, afirmou no início de 2026 que a tecnologia de interconexão óptica está evoluindo de uma compensação de desempenho local para uma capacidade fundamental que sustenta operações de escala, flexibilidade e alta confiabilidade em supernós de IA. Seja para resolver gargalos de taxa, restrições de consumo ou limitações de capacidade, a interconexão óptica tornou-se uma condição prévia para a evolução de infraestrutura de IA de milhares para centenas de milhares de GPUs.

A mudança estratégica da Ciena: de banda larga de telecomunicações para rede óptica de IA

Quando a interconexão óptica se torna o tema central da infraestrutura de IA, a estratégia dos principais fornecedores de equipamentos nesse setor torna-se uma janela importante para entender a evolução do mercado. A Ciena, líder global em sistemas de rede de alta velocidade, está passando por uma transformação estratégica profunda.

No terceiro trimestre fiscal de 2025, a Ciena reportou receita de US$ 1,22 bilhão, impulsionada principalmente por plataformas ópticas e de roteamento. Ao mesmo tempo, anunciou a interrupção do desenvolvimento de sua linha de produtos PON de banda larga, redirecionando investimentos de P&D para soluções centrais de óptica e data center, incluindo tecnologias de gerenciamento fora da banda, além de reduzir de 4% a 5% sua força de trabalho, provisionando cerca de US$ 90 milhões em despesas de P&D não monetárias para amortização. A Ciena espera que o crescimento futuro seja liderado principalmente por mercados de IA e grandes provedores de nuvem.

O CEO Gary Smith afirmou na teleconferência de resultados que clientes provedores de serviços estão concentrando seus investimentos em redes capazes de suportar o crescimento do tráfego de IA, gerando novas demandas de sistemas e oportunidades de interconexão, que eventualmente se estendem ao interior dos data centers. A Ciena estima que cerca de 50% de seus negócios vêm de grandes provedores de nuvem, e que a composição de clientes em 2026 será semelhante.

A implementação concreta da estratégia da Ciena na infraestrutura de IA já apresenta resultados. A empresa apontou um projeto de infraestrutura de IA na América do Norte envolvendo seu sistema RLS e o módulo ZR de 800G WaveLogic 6 Nano, voltado à interconexão de clusters GPU regionais e de treinamento. Além disso, sua solução de gerenciamento fora da banda DCOM, voltada à operação de data centers, ajuda grandes operadoras a simplificar a instalação e gestão de operações em larga escala, aumentando a escalabilidade e reduzindo consumo de energia e espaço.

De uma perspectiva macro, a mudança estratégica da Ciena reflete uma transição do setor de redes ópticas de uma mera expansão de capacidade para uma infraestrutura essencial para suportar a escala, flexibilidade e alta confiabilidade de data centers de IA. O CTO global Jürgen Hatheier destacou que o mercado está claramente migrando para conexões ópticas de maior capacidade, com forte demanda por comprimentos de onda de 1,6T, expectativa de continuidade até 2026. Rob Shore, responsável por marketing de produtos de redes ópticas da Nokia, prevê que, em 2026, módulos plugáveis de 800G coerentes se tornarão o padrão de conexão óptica para redes de IA.

O mercado de redes de data centers de IA está crescendo exponencialmente. Segundo dados do setor, esse mercado deve passar de US$ 10,31 bilhões em 2025 para US$ 12,8 bilhões em 2026, com taxa de crescimento anual composta de 24,2%, atingindo US$ 30,17 bilhões até 2030. A demanda por cabos ópticos para aplicações de IA deve crescer 77% em 2025, e a taxa de crescimento anual composta de cinco anos deve superar 26%, muito acima de aplicações não relacionadas à IA. A Ciena ocupa uma posição central nessa curva de crescimento estrutural.

De infraestrutura de poder de computação a infraestrutura financeira: o mapa de ações do Gate

A evolução da infraestrutura não ocorre apenas no nível de poder de computação, mas também na alocação de ativos. Quando a interconexão óptica de data centers de IA se torna o fator decisivo para a eficiência de clusters de GPUs, a capacidade de alocação multissetorial de ativos também precisa de infraestrutura eficiente correspondente.

A Gate, que atua no setor financeiro tradicional, está avançando de forma constante. Em janeiro de 2026, a plataforma lançou pela primeira vez funções de contratos de diferença (CFDs) tradicionais, cobrindo ouro, câmbio, índices de ações, commodities e ações populares. Em março, expandiu para tokens de ações e ETFs alavancados. Em junho, por meio de parceria estratégica com a Alpaca, lançou oficialmente serviços de negociação de ações reais.

Atualmente, a Gate suporta mais de 10.000 ações e ETFs nos EUA, incluindo empresas listadas na NYSE, NASDAQ e outros principais mercados, abrangendo uma gama muito maior do que plataformas de tokenização de ações que geralmente suportam apenas algumas centenas de ativos. Os usuários podem investir diretamente no mercado de ações dos EUA usando USDT, com frações de ações a partir de 0,01, permitindo que participem de investimentos em ações de primeira linha com valores a partir de US$ 1.

No aspecto técnico e de parcerias, a Gate conecta-se a corretoras regulamentadas com licença de Broker-Dealer nos EUA, com acesso às principais bolsas como NYSE e NASDAQ. Cada ação é suportada por ativos reais depositados de forma independente no sistema DTC, não sendo derivativos na blockchain ou produtos de mapeamento RWA. Os detentores de posições podem automaticamente usufruir de dividendos, subscrições e desdobramentos, com direitos completos de acionista.

Do ponto de vista de tendências do setor, a consolidação de plataformas de criptomoedas que oferecem negociação de ações já é uma direção clara. Dados indicam que 73% dos traders de criptomoedas também possuem ativos tradicionais. A abordagem da Gate, por meio de infraestrutura regulamentada, garante negociação de ações reais, não apenas representações sintéticas ou tokenizadas, assegurando descoberta de preços e liquidação reais. Com seus produtos de CFDs, a Gate está evoluindo de uma bolsa de ativos exclusivamente criptográficos para um centro multissetorial que combina cripto e finanças tradicionais, além de derivativos.

Essa evolução também está alinhada à macro tendência de tokenização de ativos RWA. Em setembro de 2025, a Gate lançou oficialmente a seção Ondo, com os primeiros tokens de ações e ETFs de empresas como Apple, Tesla e Microsoft. O volume total de ativos tokenizados RWA ultrapassou US$ 15,7 bilhões, com a Ondo Finance ocupando a terceira posição global, com cerca de US$ 1,66 bilhão em ativos sob custódia. De ações reais a ações tokenizadas e CFDs de ações, a Gate está construindo uma via de alocação multiestrutural que cobre diversas formas de ativos.

Conclusão

A trajetória de evolução da interconexão óptica aponta claramente para um fato fundamental: a competitividade dos data centers de IA está migrando de um foco exclusivo em métricas de GPU para indicadores de eficiência sistêmica. A rede deixou de ser apenas um suporte ao cluster de poder de computação, tornando-se uma condição prévia para que clusters de dezenas de milhares de GPUs possam realmente explorar seu potencial teórico. Nesse contexto, o valor estratégico das empresas de infraestrutura de rede óptica está sendo reavaliado pelo mercado — a decisão da Ciena de se concentrar totalmente na rede óptica de IA é a prova mais direta dessa tendência.

Ao mesmo tempo, a evolução da infraestrutura de investimento também não pode ser ignorada. Quando o poder de computação em IA se torna um elemento central na produção digital, a capacidade de conectar essa força produtiva ao capital global por meio de plataformas de alta eficiência também está passando por uma mudança sistêmica. Da mesma forma que a tecnologia avança do hardware para o financeiro, a interseção de inovação tecnológica e financeira frequentemente gera oportunidades estruturais concentradas.

RWA1,82%

ONDO-8,47%

TSLA-4,17%

Ver original

O gargalo de capacidade de processamento do cluster de 100 mil cartões AI está sendo transferido: como a interconexão óptica pode se tornar o núcleo da nova infraestrutura?

O dilema de comunicação em clusters de cem mil GPUs: o escore de poder de computação versus rede

Interconexão óptica: uma rota tecnológica determinística para resolver o gargalo de poder de computação

A mudança estratégica da Ciena: de banda larga de telecomunicações para rede óptica de IA

De infraestrutura de poder de computação a infraestrutura financeira: o mapa de ações do Gate

Conclusão

Tendências

GateIPOAccessSpaceX

AnthropicReleasesFable5Model

IsraelStrikesIranBTCPlunges

MyGateTradeStory

SpaceXIPOAttractsOver250BillionInOrders

Fixado