Ir para o conteúdo

Veo (modelo de texto para vídeo)

Origem: Wikipédia, a enciclopédia livre.
Veo
Página oficialdeepmind.google/models/veo/

Na informática, o Veo é um sistema de inteligência artificial generativa criado pelo Google DeepMind em maio de 2024, capaz de produzir vídeos a partir de comandos fornecidos pelo usuário. Sua versão mais recente, o Veo 3, lançada em maio de 2025, também inclui a capacidade de gerar trilhas sonoras e diálogos sincronizados para os vídeos criados.[1]

Desenvolvimento

[editar | editar código]
Um vídeo gerado com o Veo-3, representando «Uma sala abandonada e em decomposição, com tinta verde a descascar, uma poltrona vermelha gasta com uma cabeça de boneca, uma pequena cadeira branca ao lado e detritos espalhados pelo chão sujo. Faça uma visão de 180°, lenta, com som de radiação (está em Chernobyl)».

Em maio de 2024, durante o evento Google I/O, foi apresentado o Veo, um modelo multimodal voltado para a geração de vídeos.[2] Segundo o Google, o sistema era capaz de criar vídeos em 1080p com duração superior a um minuto.[2] Já em dezembro do mesmo ano, foi lançada a segunda versão, Veo 2, acessível por meio da plataforma VideoFX. Essa atualização trouxe suporte para vídeos em resolução 4K e melhorias na compreensão de física realista.[3] Em abril de 2025, o Veo 2 passou a ser disponibilizado também para usuários avançados no app Gemini.[4] Um mês depois, em maio de 2025, o Google revelou o Veo 3, que além de gerar vídeos, também produz áudio sincronizado incluindo falas, efeitos sonoros e sons ambientes e acompanhando as imagens geradas.[5][6] Na mesma ocasião, foi anunciada a ferramenta Flow, desenvolvida com base nos modelos Veo 3 e Imagen 4, voltada para a criação de vídeos.[7][8]

Flow possui um estúdio digital audiovisual com integração com o Gemini, que permite ajustes na narrativa em tempo real.[8] Ele gera cenas cinematográficas completa via comando em texto (prompt), com: sequência visual, sons integrados, consistência narrativa, continuidade entre cenas, enquadramento de câmera.[8] Para proteger-se do uso indevido (conteúdo falso), o sistema usa a tecnologia SynthID, que adiciona marca d’água invisível nos vídeos gerados.[8]

Entre as novidades do Veo versão 3, lançado em maio de 2025, está a geração de música e voz alinhadas ao conteúdo visual.[6] Para Demis Hassabis, CEO do Google DeepMind, esse avanço marca uma transição significativa na tecnologia, aproximando a geração de vídeo por IA do que chamou de fim da "era do cinema mudo".[6]

Reações

[editar | editar código]

Após o lançamento do Veo 3, um repórter do Gizmodo observou que muitos usuários estavam utilizando o modelo para criar vídeos de qualidade questionável, como entrevistas improvisadas na rua ou gravações de unboxing.[9] Outro comentarista da mídia destacou que a ferramenta frequentemente repetia a mesma piada em respostas a diferentes prompts.[10]

Alguns especularam que o modelo teria sido treinado com base em conteúdos do YouTube,[6] ou do Reddit.[10] embora o Google não tenha divulgado oficialmente as fontes utilizadas no treinamento.[6]

Referências

  1. «Veo 3: Um guia com exemplos práticos». Datacamp. Consultado em 8 de setembro de 2025 
  2. a b Wiggers, Kyle (14 de maio de 2024). «Google Veo, a serious swing at AI-generated video, debuts at Google I/O 2024». TechCrunch 
  3. «Google unveils improved AI video generator Veo 2 to rival OpenAI's Sora». The Hindu (em inglês). 17 de dezembro de 2024. ISSN 0971-751X. Consultado em 20 de dezembro de 2024 
  4. Wiggers, Kyle (15 de abril de 2025). «Google's Veo 2 video generating model comes to Gemini». TechCrunch (em inglês). Consultado em 16 de abril de 2025 
  5. «Google launches Veo 3, an AI video generator that incorporates audio». CNBC (em inglês). 20 de maio de 2025. Consultado em 20 de maio de 2025 
  6. a b c d e Wiggers, Kyle (20 de maio de 2025). «Veo 3 can generate videos — and soundtracks to go along with them». TechCrunch 
  7. Peters, Jay (20 de maio de 2025). «Google has a new tool just for making AI videos». The Verge. Consultado em 20 de maio de 2025. Cópia arquivada em 20 de maio de 2025 
  8. a b c d «Flow: como funciona a nova IA do Google que gera vídeos com enquadramento de cinema?». Época NEGÓCIOS. 2 de junho de 2025. Consultado em 8 de setembro de 2025 
  9. Pero, James (22 de maio de 2025). «Google's Veo 3 Is Already Deepfaking All of YouTube's Most Smooth-Brained Content». Gizmodo 
  10. a b Maiberg, Emanuel (21 de maio de 2025). «Why Does Google's New Veo 3 AI Video Generator Love This Dad Joke?». 404 Media (em inglês) 

Veja mais

[editar | editar código]