Recentemente, vídeos gerados por IA estão a fazer imenso sucesso, e vejo muitas pessoas a experimentar vídeos criativos. Percebi que muitas ainda não sabem bem como usar o Seedance 2.0 para criar. Justamente agora, a plataforma AI Jiyun da ByteDance lançou esta nova ferramenta, e organizei aqui os principais modos de uso para que todos possam começar mais rapidamente.



O Seedance 2.0 é mais uma ferramenta de IA em chinês que está a fazer sucesso, depois do DeepSeek, e foi lançado oficialmente a 9 de fevereiro deste ano. O mais impressionante é que suporta entrada multimodal de texto, imagens, vídeos e áudio, podendo gerar vídeos de 5 a 12 segundos com qualidade de filme. A grande vantagem é a forte consistência entre múltiplos ângulos, sincronização labial precisa, alta fidelidade na simulação física, basicamente baixando ao mínimo a barreira para criar vídeos.

Para usar esta ferramenta, é bem simples. Primeiro, aceda à plataforma AI Jiyun e faça login com uma conta ByteDance (pode usar conta do Douyin ou do Jianying). Se for assinante (a partir de 69 yuans), pode mudar diretamente para o modelo Seedance 2.0. Se não for assinante, ainda está em fase de testes limitados, com alguns usuários a experimentar funcionalidades básicas. Após a verificação de identidade, aceda à página de criação de vídeos AI e escolha o modo “Short Film Imersivo” para entrar no Seedance 2.0.

A funcionalidade principal desta ferramenta não é complicada. Criar vídeos a partir de texto é gerar vídeos apenas com descrições textuais, suportando movimentos de câmara e detalhes de luz e sombra. Para criar a partir de imagem, pode fazer upload de uma única imagem, de quadros de início e fim, ou usar várias imagens de referência para controlar o conteúdo e o estilo. Há também a função de áudio, onde ao fazer upload de áudio, ela gera automaticamente a sincronização labial correspondente, suportando comandos por voz ou música. O mais avançado é a fusão multimodal, que permite fazer upload de até 9 imagens, 3 trechos de vídeo e 3 de áudio como referências, com limite total de 12 ficheiros.

A minha funcionalidade preferida é a de consistência de personagem. Após criar um perfil de personagem, consegue manter as características faciais, penteado e acessórios iguais em diferentes ângulos, o que é ótimo para curtas-metragens. A qualidade de saída também é boa, suportando resolução nativa de 1080p, e alguns recursos de assinantes podem gerar vídeos em 2K.

Como funciona na prática? Para iniciantes, recomendo começar por criar vídeos a partir de texto. Aceda à página de criação, escolha o modo “Texto para Vídeo” e insira o prompt. O mais importante é que o prompt inclua os cinco elementos: cenário, protagonista, ação, ângulo de câmara e atmosfera, para obter o melhor resultado. Por exemplo: “Cena de rua urbana com chuva e luzes de néon a piscar, protagonista é um homem de casaco preto a segurar um guarda-chuva vermelho, a câmara faz um travelling lento de plano geral para um close do rosto com gotas de água, atmosfera melancólica com cores frias e fundo ligeiramente desfocado.”

A configuração dos parâmetros também é importante. Pode escolher proporções 16:9 (horizontal), 9:16 (vertical) ou 1:1 (quadrado), dependendo da plataforma. Os estilos disponíveis incluem realista, filme, anime, cyberpunk, tinta chinesa, entre outros. Para iniciantes, recomenda-se começar com 8 segundos de duração, resolução padrão de 1080p. Após clicar em gerar, aguarde entre 30 a 90 segundos, dependendo da complexidade. Se ficar satisfeito com a pré-visualização, pode fazer download do ficheiro MP4.

Se desejar maior controlo sobre a imagem, a criação a partir de imagem é uma boa opção. Pode fazer upload de referências de três formas: uma imagem única para definir o estilo geral, quadros de início e fim para gerar transições automáticas, ou até 9 imagens de referência, usando @image1, @image2, etc., no prompt. Aqui, a ação é especialmente importante, devendo descrever claramente a relação entre as imagens e o vídeo. Por exemplo: “A menina começa na posição de partida em @image1 e corre lentamente até @image2, com o cabelo ao vento e pôr-do-sol dourado ao fundo, a câmara faz um travelling suave, mantendo as características do personagem.”

A função de vídeo com áudio é uma verdadeira ferramenta mágica, especialmente para vídeos explicativos. Faça upload de um ficheiro MP3 de até 15 segundos, e pode também fazer upload de uma imagem de referência do personagem para manter a consistência facial. No prompt, destaque a sincronização labial, por exemplo: “O rapaz explica conhecimentos de IA com expressão natural, a boca sincronizada com @audio1, fundo de uma sala de estudo com tema tecnológico, câmara fixa de frente ao rosto.” Ative a função de sincronização labial, escolha o estilo e a duração, e após gerar, verifique o sincronismo. Se não estiver satisfeito, ajuste o áudio ou o prompt e gere novamente.

A técnica avançada é a fusão de múltiplos materiais. Pode fazer upload de imagens para definir personagens, vídeos para movimentos de câmara, áudio para música de fundo, e usar @ para relacionar os materiais no prompt. Mas atenção ao limite de 12 ficheiros, priorizando os materiais que mais influenciam a imagem final.

Existem também dicas avançadas para o prompt. Use termos técnicos ou linguagem comum para descrever movimentos de câmara, como “câmara a rodar em torno do personagem”, “ângulo baixo a olhar para cima”, “travelling lento para frente”. A coerência de ações é fundamental; descreva transições suaves entre movimentos, como “o personagem pula e faz uma rotação, mantendo a continuidade do movimento”. Para detalhes, adicione luz, materiais e texturas. Para reforçar o estilo, pode usar referências a estilos de realizadores famosos ou gêneros cinematográficos, como “estilo Wes Anderson com composição simétrica, cores quentes e filtro vintage”. Evite descrições vagas como “bonito” ou “fantástico”; seja específico no que deseja.

Para gerir a consistência de personagens, crie perfis com várias fotos de diferentes ângulos e expressões. Ao gerar vídeos, cite esses perfis no prompt, por exemplo: “Usar o perfil do personagem 小李, correndo na floresta, com características faciais iguais às fotos de referência.” Para múltiplos ângulos, mantenha o mesmo nome de personagem no prompt para garantir a consistência.

Sobre os parâmetros, o formato 16:9 é ideal para YouTube, 9:16 para TikTok e Instagram Stories, e 1:1 para Instagram. O estilo visual deve combinar com o conteúdo; por exemplo, estilo cinematográfico para dramas, anime para conteúdo de anime. Para vídeos curtos, 10 segundos é o ideal, para narrativas, até 12 segundos, e para demonstrações rápidas, 5 segundos. A resolução padrão é 1080p, mas para produção profissional, pode usar 2K com assinatura. A sincronização labial deve estar sempre ativada se houver áudio, e pode desligar para vídeos apenas com música. Mode de simulação física básico ou avançado pode ser selecionado, sendo o avançado indicado para cenas com movimentos ou colisões.

Durante a geração, podem surgir problemas. Se falhar, primeiro verifique se o prompt não está demasiado longo — limite a 200 palavras. Os formatos de ficheiro devem estar corretos: PNG ou JPG para imagens, MP3 para áudio, MP4 para vídeos. Problemas de rede podem ser resolvidos ao atualizar a página e tentar novamente, preferencialmente com uma ligação Wi-Fi estável.

Se a imagem parecer desconexa, adicione transições no prompt, como “movimento suave entre ações”, “transições lentas”, “conexões naturais”. Evite movimentos demasiado complexos ou muitas mudanças em um só vídeo. Verifique se os quadros de início e fim estão alinhados, com o mesmo posicionamento e postura do protagonista.

Se o sincronismo labial não estiver bom, assegure-se de que o áudio está limpo, sem ruídos, pois estes podem interferir na leitura da fala pelo modelo. Seja claro no prompt, pedindo sincronização labial perfeita, e ajuste o áudio para estar entre 5 a 12 segundos.

Quando os personagens não estiverem consistentes, crie perfis de personagem com várias fotos de diferentes ângulos e expressões, e sempre cite esses perfis no prompt. Para cenas mais avançadas, pode gerar múltiplos vídeos com o mesmo personagem, mantendo a coerência.

Para configurações, o formato 16:9 é para YouTube, 9:16 para TikTok, 1:1 para Instagram. Escolha o estilo visual adequado ao conteúdo. Para vídeos curtos, 10 segundos é o ideal; para narrativas, até 12 segundos; para demonstrações rápidas, 5 segundos. Use resolução 1080p para publicações comuns, 2K para produção profissional com assinatura. Ative sempre a sincronização labial se houver áudio, e escolha o modo de física adequado ao cenário.

Durante a geração, podem ocorrer problemas. Se falhar, verifique o comprimento do prompt, os formatos de ficheiro, a estabilidade da rede. Para melhorar a coerência, adicione transições e descreva movimentos de forma detalhada. Certifique-se de que os quadros de início e fim estão alinhados. Para sincronização labial, use áudio limpo e descreva claramente a necessidade de sincronismo. Para manter a consistência de personagens, crie perfis detalhados e use-os sempre que necessário.

Aplicações avançadas incluem criar vídeos de várias partes com personagens consistentes, montar histórias completas, gerar vídeos de demonstração de produtos, vídeos educativos com áudio e texto, ou criar vídeos verticais otimizados para plataformas. Pode também combinar elementos de marca para criar anúncios criativos, reduzindo custos de produção.

Minha dica para iniciantes é começar com imagens e prompts, pois oferece maior controlo. Sempre salve os prompts usados para ajustar depois. Aproveite a biblioteca de modelos de prompts da plataforma para acelerar o processo. Quando algo não funcionar, verifique se o prompt está claro e ajuste os parâmetros. Experimentar combinações de texto, imagens e áudio costuma dar os melhores resultados. Este ferramenta está realmente em alta, vale a pena dedicar tempo a explorar.
Ver original
Esta página pode conter conteúdo de terceiros, que é fornecido apenas para fins informativos (não para representações/garantias) e não deve ser considerada como um endosso de suas opiniões pela Gate nem como aconselhamento financeiro ou profissional. Consulte a Isenção de responsabilidade para obter detalhes.
  • Recompensa
  • Comentário
  • Repostar
  • Compartilhar
Comentário
Adicionar um comentário
Adicionar um comentário
Sem comentários
  • Marcar