Futuros
Acesse centenas de contratos perpétuos
TradFi
Ouro
Plataforma única para ativos tradicionais globais
Opções
Hot
Negocie opções vanilla no estilo europeu
Conta unificada
Maximize sua eficiência de capital
Negociação demo
Introdução à negociação de futuros
Prepare-se para sua negociação de futuros
Eventos de futuros
Participe de eventos e ganhe recompensas
Negociação demo
Use fundos virtuais para experimentar negociações sem riscos
Lançamento
CandyDrop
Colete candies para ganhar airdrops
Launchpool
Staking rápido, ganhe novos tokens em potencial
HODLer Airdrop
Possua GT em hold e ganhe airdrops massivos de graça
Launchpad
Chegue cedo para o próximo grande projeto de token
Pontos Alpha
Negocie on-chain e receba airdrops
Pontos de futuros
Ganhe pontos de futuros e colete recompensas em airdrop
Investimento
Simple Earn
Ganhe juros com tokens ociosos
Autoinvestimento
Invista automaticamente regularmente
Investimento duplo
Lucre com a volatilidade do mercado
Soft Staking
Ganhe recompensas com stakings flexíveis
Empréstimo de criptomoedas
0 Fees
Penhore uma criptomoeda para pegar outra emprestado
Centro de empréstimos
Centro de empréstimos integrado
Centro de riqueza VIP
Planos premium de crescimento de patrimônio
Gestão privada de patrimônio
Alocação premium de ativos
Fundo Quantitativo
Estratégias quant de alto nível
Apostar
Faça staking de criptomoedas para ganhar em produtos PoS
Alavancagem Inteligente
Alavancagem sem liquidação
Cunhagem de GUSD
Cunhe GUSD para retornos em RWA
Na era da IA, «compartilhamento de poder de computação» é a nova bicicleta dos programadores iniciantes
Fonte: Geek Park
Autor: Xu Shan
«O custo dos Tokens está a cair em flecha.»
Se esta frase fosse dita há dois anos, faria com que cada fundador de startups de IA ficasse entusiasmado. De 2023 a 2025, os custos de inferência da IA desceram 99,7%. Note-se que, quando o GPT-4 foi lançado, o custo por milhão de Tokens era de 37,5 dólares; em 2025, esse número já caiu para 0,14 dólares. Seguindo esta tendência, os custos de computação deveriam, para os empreendedores, não ser um problema.
Mas a realidade é precisamente o contrário.
No mesmo período, as despesas globais das empresas com nuvem de IA dispararam de 11,5 mil milhões de dólares para 37 mil milhões de dólares, triplicando. Depois de a IA entrar na era A2A, dezenas de agentes interagem repetidamente, provocando uma explosão exponencial no volume de chamadas de Tokens. Isto também fez com que, apesar de o preço unitário dos Tokens ficar mais barato, a quantidade de Tokens consumida por cada tarefa tenha disparado de forma desenfreada.
Está claro que a computação está a tornar-se o recurso mais estranho desta era. Está cada vez mais barata, mas o dinheiro que lhe vais gastar só vai continuar a aumentar.
Para os gigantes, este problema pode ser resolvido com a construção de centros de computação próprios. Mas para a maioria das startups, só têm de ficar à espera no mercado de computação pública, aceitar os preços dos fornecedores de nuvem, ver as faturas de computação subirem mês após mês, sem qualquer capacidade de negociação.
O que o fundador da Qiaojike (共绩科技), Fu Zhi, vê é precisamente uma oportunidade de negócio nascida do desajuste neste mercado.
Na sua perspetiva, a solução para reduzir o custo da computação não passa apenas por esperar que os custos desçam naturalmente; passa por mudar a forma como se utiliza a computação, permitindo também que o custo comece a baixar. Fazer com que a computação funcione como a eletricidade — disponível quando for necessário, faturação por uso, e reativar grandes quantidades de recursos computacionais que estavam ociosos e a ser desperdiçados.
Recentemente, a Qiaojike concluiu um financiamento da ronda Pre-A, com uma avaliação pós-investimento de 350 milhões de RMB, e planeia arrancar em breve com uma ronda A. Em 2025, ano em que a corrida pela computação enfrenta pressão generalizada, esta empresa de tecnologia, que resolve o problema do escalonamento de recursos com métodos de inteligência artificial, alcançou silenciosamente receitas na ordem das várias dezenas de milhões de RMB, com uma taxa de retenção de clientes próxima de 100%.
A Qiaojike está a transformar o escalonamento de computação numa atividade comercial real.
Fundador da Qiaojike, Fu Zhi. Fonte da imagem: Qiaojike
01 Quando as empresas de IA explodem, surge uma nova solução para a conta dos custos de computação
Na véspera do lançamento do novo produto, a equipa da Remy quase não dormiu, preparada a qualquer momento para situações inesperadas.
Mas quando o site da empresa recebeu, em 48 horas, 500 mil utilizadores, para uma startup de IA que acabou de sair do teste interno para o modo público, foi necessário aumentar toda a infraestrutura dezenas de vezes num curto espaço de tempo. Apesar de terem alguma preparação, antes do lançamento eles tinham testado com antecedência vários fornecedores de serviços de nuvem, como Ucloud, Aliyun e Huawei Cloud; porém, quando o fluxo de tráfego caiu de forma massiva, a solução final veio da Qiaojike.
Dito de forma simples, o que a Qiaojike faz é colocar a computação ociosa em funcionamento e, em seguida, distribuí-la sob demanda para empresas de IA com necessidades elásticas. Quer seja máquinas a rodar em vazio de um cybercafé durante a noite, quer seja um 4090 de um utilizador individual, ou ainda recursos ociosos de pequenas salas de servidores — tudo pode tornar-se parte de um pool de computação que a Qiaojike consegue escalar. Se um cliente não for suficiente, é possível ajustar imediatamente mais capacidade dentro do pool; usar “quando precisa”, “pegar quando necessário”.
Nessas 48 horas, a Qiaojike providenciou de emergência cerca de 1900 placas de GPU para a Remy. Sempre que um utilizador iniciava um pedido, surgia uma nova encomenda; quando o cálculo do utilizador terminava, a encomenda era encerrada de imediato. Nesse dia, a plataforma processou mais de um milhão de encomendas.
«No pico, para um fornecedor típico de serviços de computação, conseguir temporariamente abrir 20 placas já é difícil; na maioria das vezes, as empresas têm ainda de esperar. Mas esperar significa perda de tráfego, algo que as empresas absolutamente não querem ver.» Fu Zhi explicou que, depois disso, a maior parte da computação usada pela Remy vinha da Qiaojike.
A necessidade de computação da Remy é, na verdade, muito simples: sempre que explode o volume de tráfego, os cliques dos utilizadores devem ser respondidos atempadamente; o acesso à computação tem de ser rápido e oportuno, e o custo tem de ser baixo. Estas são as necessidades mais básicas de computação para uma startup de IA ainda a começar.
Em contraste, há uma categoria de clientes de aplicações de IA que enfrenta necessidades de computação ainda mais específicas, mas também mais realistas.
Durante o Festival da Primavera do ano passado, uma empresa que fazia troca de roupa com IA e tirava fotografias numa zona turística procurou a Qiaojike. Eles não é que não soubessem em que altura do ano o tráfego explode, mas ainda assim lhes era difícil calcular a conta de computação.
Os seus dispositivos de IA estavam instalados na área turística. Assim que chegavam os feriados, ficavam completamente lotados e a necessidade de computação disparava. Mas, terminado o feriado, a procura por computação voltava quase a zero. «O Festival da Primavera é o maior pico do ano; o resto são mais de seis meses em que não há muita gente na zona turística.» disseram a Fu Zhi.
Estas oscilações de computação implicam que, se escolhesse alugar computação por pico, então 90% do tempo normal estaria a queimar dinheiro para manter placas em funcionamento; se alugasse pela média, durante o Festival da Primavera a procura certamente colapsaria, o que afectaria diretamente a experiência do utilizador. «Esse tipo de variação de procura é difícil de obter um plano adequado nas soluções tradicionais de serviços de computação. Porque essas diferenças extremas entre pico e vale não têm lógica de preços correspondente nos produtos padrão.» disse Fu Zhi.
Mas este tipo de cenário é particularmente adequado para utilizar a plataforma de partilha de computação da Qiaojike.
Nesse mês, os nós de serviço mudaram 1963 computadores pessoais; ao longo de todo o Festival da Primavera, nunca houve problemas de estabilidade. «Comparando com eles próprios montarem computação por pico, ajudámos a poupar-lhes cerca de 70% dos custos.» acrescentou Fu Zhi.
Uma procura com este tipo de flutuação temporal não aparece apenas em alguns cenários verticais e nichos; também é comum para muitas empresas emergentes de IA.
A liblib, uma das maiores plataformas nacionais de geração de imagens com IA em termos de utilizadores, já tinha alugado um grande número de placas GPU na plataforma de um fornecedor de nuvem. Mas, se estudarem com atenção, verificaram que, quando se calcula a média das GPU em termos globais, a taxa de utilização geral era apenas de 45%.
Isto significa que mais de metade das placas está a queimar dinheiro em vão todos os dias.
Segundo Fu Zhi, na verdade, empresas como a liblib não são raras; quase todas as ferramentas de aplicações de IA que têm como utilizadores centrais trabalhadores por conta de outrem enfrentam este problema. Durante o dia, os utilizadores são densos; à noite, o número de utilizadores cai significativamente. Se se ajusta computação por pico, a taxa de inatividade à noite é elevada; mas se se ajusta pela média, durante o dia torna-se difícil satisfazer a procura de todos os utilizadores.
A via da IA parece quente, mas aquilo que pode travar a linha vital de desenvolvimento de uma empresa é, possivelmente, a conta dos custos de computação. Muitas empresas têm expectativas demasiado elevadas para a computação; os custos de computação arrastam o fluxo de caixa até ao colapso. Outras subestimam a previsão de computação: quando se atinge o pico de utilização, o serviço colapsa, e os utilizadores vão-se embora sem voltar.
«O tráfego das aplicações de IA é naturalmente volátil. A lógica de preços do mercado de computação foi desenhada para procura estável; a forma de alocar os custos de computação tem permanecido ainda relativamente tradicional.» disse Fu Zhi. É por isso que, quando uma empresa de IA realmente explode, a conta dos custos de computação precisa de um algoritmo novo.
No passado, os modelos tradicionais de serviço de computação eram dominados por contratos de longo prazo. As empresas alugavam por um ano; quer utilizassem ou não, tinham de pagar antecipadamente uma taxa para a computação. O custo da computação ociosa era sobretudo suportado pelas próprias empresas. E o que a Qiaojike faz, na realidade, é transferir este custo para outro lugar: pessoas com recursos ociosos de computação que, por si mesmas, não conseguem utilizá-los ao máximo — como utilizadores individuais, cybercafés, etc. — uma vez que essa computação já está a ser desperdiçada. Ao escaloná-la, não se criam novos custos de computação e reativa-se a computação ociosa existente.
«Computação não é “quanto mais, melhor”» disse Fu Zhi, «o importante é que seja “móvel”, disponível para ser chamada a qualquer momento.»
02 Este negócio de computação elástica testa a capacidade de gestão de energia
Para Fu Zhi, a oportunidade para fazer negócio com escalonamento de computação surgiu, na verdade, de um acaso.
Em maio de 2023, durante um período de férias, quando a vaga de IA estava apenas a começar a surgir, Fu Zhi enviou uma mensagem para uma comunidade de empresários em arranque de IA. Dizia apenas isto: Tenho um A100; quanto mais curto for o período de aluguer, mais barato é. Se precisares, vem ter comigo.
Na altura, as suas expectativas não eram grandes, porque era apenas uma placa de GPU. O resultado foi inesperado: no fim, 30 pessoas consultaram-no e todas pagaram de forma muito rápida.
«Eu digo: quem paga rápido, eu sirvo.» No fim, escolheu 5 pessoas para atender. Uma placa, cinco clientes. Isto validou uma decisão que ele tinha refletido durante muito tempo: as pessoas comuns começam a precisar de computação.
Mas ele também sabia que este negócio só se tornou possível naquele momento, não por ter sorte, mas porque antes não existiam condições.
Em 1999 já havia quem propusesse partilhar computação, construir uma plataforma BOINC, e dezenas de milhares de pessoas contribuíam com capacidade computacional; mas na altura era um plataforma de computação científica sem fins lucrativos, em que toda a gente podia usar gratuitamente. Mais tarde, quando o Bitcoin ficou quente, também houve quem pensasse em aproveitar a febre da mineração para escalonar a computação ociosa, mas isso não era legal.
A ideia sempre esteve lá, mas o “solo” não existia.
No fundo, os utilizadores comuns com GPUs de alto desempenho eram principalmente da geração nascida nos anos 90 e 2000. Antes disso, eram poucos os que tinham um computador pessoal com 4090. E também só em 2022 é que foi oficialmente lançado o WSL1.0.0, que permite que ambientes virtuais Linux corram com segurança em computadores pessoais; quanto mais ao remoto acesso de dispositivos pessoais distribuídos por todo o lado, de modo a permitir “penetração” pela rede interna, que só por volta de 2021 é que ficou realmente maduro como tecnologia.
Com a oferta, a procura e as condições técnicas reunidas, é que este negócio se tornou possível hoje.
Mas Fu Zhi acredita que o sinal de que a “altura certa” tinha chegado não era o DeepSeek, nem uma máquina integrada, mas sim os cenários de consumo de IA, que estavam a passar de uma ferramenta para nichos para se infiltrarem no entretenimento diário das pessoas comuns.
«Assim que esse processo se acelera, a procura por computação já não é apenas para serem compradas por algumas grandes empresas; passa a ser algo que precisa de ser gerido em grande escala, com distribuição entre nós, como a eletricidade.» disse Fu Zhi.
É também por isso que a Qiaojike tem vindo a promover conversações com os centros nacionais de computação para cooperação. Atualmente, já participam na construção de plataformas provinciais de escalonamento de computação em Pequim-Tianjin-Hebei, Delta do Rio Yangtze, Shenzhen e Qinghai. Os sistemas de escalonamento montados em cada local, tecnicamente, contam com participação da Qiaojike.
No entanto, «escalonamento de computação» é muito mais difícil do que parece.
Escalonamento de computação e gestão de computação não são a mesma coisa. Fu Zhi faz uma distinção: o que as grandes empresas fazem é gestão. Elas colocam muitos servidores numa única configuração de sistema, sabem quem está a usar e quem está ocioso, mas dificilmente conseguem fazer uma alocação dinâmica que atravesse regiões e dispositivos.
Já escalonamento de computação é outra questão: precisa preencher a procura de pico neste local com capacidade computacional ociosa de outros lugares. Em engenharia informática, na verdade não existe uma solução pronta e direta; pelo contrário, é um problema antigo do setor energético. «Cortar picos e preencher vales» é um termo que, originalmente, é usado em sistemas elétricos.
Fu Zhi estudou Engenharia de Ambientes e Aplicações de Energia em Arquitetura na Universidade Tsinghua; o seu orientador foi um académico ligado à área da energia. Ele transplantou os algoritmos de escalonamento de energia, resolvendo a versão do mesmo problema para computação — e é esta a principal barreira da Qiaojike.
Claro que, do ponto de vista de engenharia, este sistema de escalonamento que atravessa regiões também enfrenta muitos problemas. Por exemplo, os computadores pessoais que acedem ao pool de escalonamento podem ser «ocupados» a qualquer momento; se o utilizador começar um jogo, essa máquina precisa sair. Porém, os clientes a jusante exigem que o serviço não pare.
Fu Zhi escolheu uma combinação de hot standby e previsão: preparar antecipadamente nós redundantes para cada tarefa e, ao mesmo tempo, usar dados históricos acumulados para prever padrões de disponibilidade online de cada fornecedor, ajustando dinamicamente a proporção de backups. Quanto mais dados houver, mais preciso é o backup e mais baixo é o custo. «No início eu tinha de te reservar duas máquinas. Mas conforme foi sendo usado, agora só preciso de reservar uma.»
A camada de transmissão de rede também não é estável. A Qiaojike, como resposta, liga simultaneamente três grandes fornecedores de nuvem, e Fu Zhi mencionou: «Não é possível que estejam todos com problemas ao mesmo tempo.»
Então, porque é que os fornecedores de nuvem não fazem computação elástica?
A explicação de Fu Zhi é que as grandes empresas viram, mas a computação elástica das grandes empresas tem diferenças na definição de produto e na estratégia de preços. A vantagem da Qiaojike está no preço e na eficiência do escalonamento.
A principal contradição da computação elástica é que tens de reservar com antecedência capacidade «pronta a ser chamada». Mas quando não há utilização, essa capacidade vira apenas custo ocioso. Em geral, a expansão elástica oferecida por um fornecedor típico de computação corresponde a cerca de 5 vezes o preço normal; ou então permite que o cliente assine um contrato anual longo, fazendo o cliente suportar o risco de ociosidade da computação.
A Qiaojike consegue fornecer uma elasticidade real porque os recursos que utiliza já eram ociosos. Esses recursos não foram comprados antecipadamente para pressionar custos; simplesmente estavam ociosos. Por isso, a Qiaojike consegue oferecer preços com mais vantagem.
Segundo a análise de Fu Zhi, no mercado inteiro, 80% das necessidades de computação passam por pacotes de aluguer de longo prazo das grandes empresas; os restantes 20% são a parte com necessidade elástica. Fu Zhi não pretende disputar esses 80%; dedica-se mais aos restantes 20%. E à medida que as aplicações de IA continuam a crescer, o espaço de mercado destes 20% também vai ficando cada vez maior. «Nos outros, quanto mais longo é o aluguer, mais barato é. No meu caso, quanto mais curto é o aluguer, mais barato é.» acrescentou Fu Zhi. Atualmente, a plataforma de computação partilhada «suanli.cn» da Qiaojike permite que consumidores comuns aluguem capacidade relevante por milissegundo.
Foto de grupo da equipa da Qiaojike. Fonte da imagem: Qiaojike
Este tipo de modelo de negócio de partilha já tinha sido validado noutros setores há muito tempo.
Fu Zhi compara a essência deste negócio a um Airbnb: quando uma cidade organiza grandes feiras, os hotéis nos arredores ficam lotados. O Airbnb junta residentes com quartos ociosos e participantes da conferência que não têm onde ficar. A história na versão de computação segue caminhos semelhantes: nos momentos de lançamento de versões e explosão de tráfego das aplicações de IA, é necessária uma grande quantidade de computação; em dias comuns, a procura é muito menor do que esse volume. Por outro lado, utilizadores individuais, cybercafés e pequenas salas de servidores têm uma grande quantidade de capacidade computacional ociosa durante a noite e nos dias úteis. Unir estes dois lados é o que a Qiaojike está a fazer.
A diferença é que o que é partilhado não são quartos, mas sim computação.
03 Escalonamento de computação e energia: «infraestrutura definida por software» na era da IA
Nos mercados estrangeiros, já houve quem trilhasse este caminho. Por exemplo, a RunPod também fornece serviços de inferência elástica através de computação dispersa; em 2024, conseguiu uma ronda de semente de 20 milhões de dólares, com investimento principal conjunto da Intel Capital e da Dell Technologies Capital. Entre os clientes estão Cursor, OpenAI e Perplexity.
Mas para Fu Zhi, fazer isto nos Estados Unidos e fazer isto na China são completamente coisas diferentes.
A AWS fornece computação elástica desde o momento em que nasceu. Desde cedo, comprometeu-se com o modelo de uso sob demanda, servindo um mercado já maduro através de serviços elásticos de preço elevado. Mas os fornecedores de nuvem na China tendem mais para modelos de longo prazo; as políticas de benefícios também tendem para isso. Eles não dão tanta importância aos serviços elásticos e a disposição dos utilizadores para pagar por computação elástica é muito menor do que nos Estados Unidos. Por isso, se se transferisse o raciocínio da RunPod para o mercado chinês, a estratégia de preços não funciona.
No entanto, Fu Zhi acredita que escalonamento de computação não é um negócio que olha apenas para aluguer de capacidade. «Partilha de computação pode ser apenas uma pedra de toque.» disse isto sem hesitar. Na sua análise, esta área de negócio tem provavelmente uma janela de dois a três anos. Enquanto a oferta e a procura de computação estiverem desalinhadas, existe essa “fenda”; mas ela não vai durar para sempre.
Esta lucidez não é comum entre empreendedores. Mas talvez seja precisamente por isso que ele começou cedo a pensar numa questão mais fundamental: de onde vai nascer a próxima aplicação de IA que realmente vai explodir? Este julgamento vai determinar diretamente para onde vai a procura por computação. Quanto a isso, Fu Zhi tem duas perspetivas para o futuro.
A primeira é que, na sua análise, as superaplicações na China não vão surgir a partir de ferramentas de produtividade no PC. O caminho com oportunidade real está no mundo do entretenimento e social no telemóvel, em hardware transfronteiriço ligado a cadeias de abastecimento, e em aplicações de IA que consigam ser integradas em cenários reais da vida.
A Internet chinesa nunca passou por uma fase profunda de ferramentas de produtividade no PC. Os utilizadores saltaram diretamente da era dos telefones feature para a era da Internet móvel. Aquelas aplicações de IA — documentos de IA, apresentações de IA, assistentes de código de IA — que saíram e ganharam tração nos Estados Unidos, por trás dependem de uma base de utilizadores com hábitos de trabalho em PC, que estão dispostos a pagar por ferramentas SaaS. Mas a China não é assim. «Com mais de 100 milhões de pessoas na China a precisar escrever Word? Acho que provavelmente não.» E mais complicado ainda: mesmo que existisse uma procura dessas, as grandes empresas tornariam essas funcionalidades rapidamente em plugins gratuitos.
Em vez disso, ele viu um crescimento forte em cenários de social e entretenimento. Ele conversou com muitos profissionais que fazem curtas-metragens e produções audiovisuais; perguntou-lhes porque é que abraçavam a IA com tanta energia. As respostas deram-lhe uma nova ideia: «Eu já não tenho nada a perder; já ninguém vai ver filmes e séries, estamos quase mortos.» Estas pessoas estão entre as mais ativas a abraçar a IA no mercado chinês; não porque percebam mais de tecnologia, mas porque não têm para onde recuar. «Agora, praticamente ninguém vê televisão, filmes.»
Quanto ao desenvolvimento de hardware de IA, ele também tem uma perspetiva diferente.
Nos últimos anos, a ideia dominante para hardware de IA era «tudo com uma caixa de diálogo». Ou seja, qualquer dispositivo, com uma janela de chat. Fu Zhi acha que este caminho não está certo. «Os consumidores não precisam de um frigorífico que saiba escrever poesia.»
O hardware de IA verdadeiramente vivo é aquele que entra em cenários de alta frequência que os utilizadores já têm, fazendo com que a IA opere silenciosamente por trás, em vez de puxar o utilizador para se sentar e conversar com ela.
É como uma câmara de pet: devia conseguir identificar automaticamente se o gato está doente; ou câmaras de uma zona turística: realizam automaticamente a troca de roupa e tiram fotografias. O utilizador não precisa mudar nada; a IA faz o trabalho em silêncio. «Se este tipo de hardware conseguir adotar modelos open source em deploy, no momento em que o tráfego explode, também se tornará um cliente de computação elástica.» Fu Zhi considera isto também um dos pontos de crescimento futuros da Qiaojike.
O segundo julgamento de Fu Zhi está mais escondido e já estava formado no final de 2024, mas ele só este ano encontrou a oportunidade de o validar.
Ele acredita que, fazer com que as pessoas façam diretamente diálogo com a IA, por si só, é um desperdício de eficiência. Existe um limite para a velocidade de entrada e saída de informação dos humanos: cada vez só se pode levantar uma pergunta, e é preciso esperar a resposta aparecer para fazer a seguinte. Mas a IA pode processar ao mesmo tempo dezenas de milhares de threads, concluindo a transmissão de informação entre máquinas em milissegundos. «Usar pessoas para conduzir a IA é usar o elo mais lento, arrastando para baixo a velocidade de todo o sistema.»
O que verdadeiramente deveria acontecer é a colaboração direta entre IA e IA, A2A. Uma tarefa é definida; isso desencadeia uma cadeia de execução entre vários agentes de IA. A pessoa só precisa definir objetivos e não precisa participar em cada passo intermédio. É por isso que o OpenClaw hoje é tão valorizado. E também é por isso que, na perspetiva de Fu Zhi, o OpenClaw é realmente importante: não pelo produto em si, mas porque prova uma coisa — entre IA e IA pode formar-se uma comunidade por si própria; e há quem pague pelo modelo A2A. Este caminho é exequível.
Quando o modelo A2A se tornar mainstream, o consumo de computação será várias vezes, ou até dezenas de vezes, superior ao de hoje. Huang Renxun disse no GTC 2026 que, devido à explosão da Agentic AI e às capacidades de inferência, a quantidade de computação necessária atualmente é pelo menos 100 vezes a expectativa de um ano antes, e isso é só o começo. Nessa altura, a computação vai mesmo parecer-se com eletricidade: a preocupação deixa de ser quantas placas você precisa armazenar; passa a ser se a inteira «rede elétrica de computação» consegue distribuir recursos sob demanda. A gestão de recursos de computação chegou ao domínio do escalonamento.
Quando o A2A chegar realmente, a computação torna-se, como a eletricidade, uma infraestrutura por trás de cada pessoa, de cada tarefa e de cada nó de IA. Nesse momento, quem conseguir fazer um escalonamento de computação preciso, atravessando regiões, dispositivos e períodos de tempo, terá a capacidade real de operar esta rede.
O que a Qiaojike faz agora, na perspetiva de Fu Zhi, é preparar-se para esse momento: usar a janela destes próximos dois a três anos para construir capacidade de escalonamento, rede de nós e relações com clientes. Quando as necessidades de A2A explodirem de verdade, este sistema é a verdadeira vala (moat) da Qiaojike.
Ele disse recentemente uma frase dentro da empresa; quando a entrevista estava quase a terminar, voltou a repeti-la:
«Mesmo assim, tudo isto está apenas a começar.»
No contexto da computação elástica, estas palavras talvez sejam apenas um juízo otimista de um empreendedor sobre o mercado. Mas no contexto do A2A, o «começo» que ele menciona talvez não seja o início deste negócio, e sim o momento em que a tese de que a computação é infraestrutura chega, de facto, ao seu verdadeiro início.