Veo (modelo de texto para vídeo)
| Veo | |
|---|---|
| Página oficial | deepmind |
Na informática, o Veo é um sistema de inteligência artificial generativa criado pelo Google DeepMind em maio de 2024, capaz de produzir vídeos a partir de comandos fornecidos pelo usuário. Sua versão mais recente, o Veo 3, lançada em maio de 2025, também inclui a capacidade de gerar trilhas sonoras e diálogos sincronizados para os vídeos criados.[1]
Desenvolvimento
[editar | editar código]Em maio de 2024, durante o evento Google I/O, foi apresentado o Veo, um modelo multimodal voltado para a geração de vídeos.[2] Segundo o Google, o sistema era capaz de criar vídeos em 1080p com duração superior a um minuto.[2] Já em dezembro do mesmo ano, foi lançada a segunda versão, Veo 2, acessível por meio da plataforma VideoFX. Essa atualização trouxe suporte para vídeos em resolução 4K e melhorias na compreensão de física realista.[3] Em abril de 2025, o Veo 2 passou a ser disponibilizado também para usuários avançados no app Gemini.[4] Um mês depois, em maio de 2025, o Google revelou o Veo 3, que além de gerar vídeos, também produz áudio sincronizado incluindo falas, efeitos sonoros e sons ambientes e acompanhando as imagens geradas.[5][6] Na mesma ocasião, foi anunciada a ferramenta Flow, desenvolvida com base nos modelos Veo 3 e Imagen 4, voltada para a criação de vídeos.[7][8]
Flow possui um estúdio digital audiovisual com integração com o Gemini, que permite ajustes na narrativa em tempo real.[8] Ele gera cenas cinematográficas completa via comando em texto (prompt), com: sequência visual, sons integrados, consistência narrativa, continuidade entre cenas, enquadramento de câmera.[8] Para proteger-se do uso indevido (conteúdo falso), o sistema usa a tecnologia SynthID, que adiciona marca d’água invisível nos vídeos gerados.[8]
Entre as novidades do Veo versão 3, lançado em maio de 2025, está a geração de música e voz alinhadas ao conteúdo visual.[6] Para Demis Hassabis, CEO do Google DeepMind, esse avanço marca uma transição significativa na tecnologia, aproximando a geração de vídeo por IA do que chamou de fim da "era do cinema mudo".[6]
Reações
[editar | editar código]Após o lançamento do Veo 3, um repórter do Gizmodo observou que muitos usuários estavam utilizando o modelo para criar vídeos de qualidade questionável, como entrevistas improvisadas na rua ou gravações de unboxing.[9] Outro comentarista da mídia destacou que a ferramenta frequentemente repetia a mesma piada em respostas a diferentes prompts.[10]
Alguns especularam que o modelo teria sido treinado com base em conteúdos do YouTube,[6] ou do Reddit.[10] embora o Google não tenha divulgado oficialmente as fontes utilizadas no treinamento.[6]
Referências
- ↑ «Veo 3: Um guia com exemplos práticos». Datacamp. Consultado em 8 de setembro de 2025
- ↑ a b Wiggers, Kyle (14 de maio de 2024). «Google Veo, a serious swing at AI-generated video, debuts at Google I/O 2024». TechCrunch
- ↑ «Google unveils improved AI video generator Veo 2 to rival OpenAI's Sora». The Hindu (em inglês). 17 de dezembro de 2024. ISSN 0971-751X. Consultado em 20 de dezembro de 2024
- ↑ Wiggers, Kyle (15 de abril de 2025). «Google's Veo 2 video generating model comes to Gemini». TechCrunch (em inglês). Consultado em 16 de abril de 2025
- ↑ «Google launches Veo 3, an AI video generator that incorporates audio». CNBC (em inglês). 20 de maio de 2025. Consultado em 20 de maio de 2025
- ↑ a b c d e Wiggers, Kyle (20 de maio de 2025). «Veo 3 can generate videos — and soundtracks to go along with them». TechCrunch
- ↑ Peters, Jay (20 de maio de 2025). «Google has a new tool just for making AI videos». The Verge. Consultado em 20 de maio de 2025. Cópia arquivada em 20 de maio de 2025
- ↑ a b c d «Flow: como funciona a nova IA do Google que gera vídeos com enquadramento de cinema?». Época NEGÓCIOS. 2 de junho de 2025. Consultado em 8 de setembro de 2025
- ↑ Pero, James (22 de maio de 2025). «Google's Veo 3 Is Already Deepfaking All of YouTube's Most Smooth-Brained Content». Gizmodo
- ↑ a b Maiberg, Emanuel (21 de maio de 2025). «Why Does Google's New Veo 3 AI Video Generator Love This Dad Joke?». 404 Media (em inglês)