
Novos Modelos de Geração de Mídia com IA do Google
O Google recentemente exibiu seus mais recentes avanços em geração de mídia com IA em sua conferência I/O. A revelação mais significativa é o Veo 3, um modelo inovador capaz de gerar vídeos com áudio correspondente. Essa tecnologia permite a criação de clipes altamente realistas, como cantos de pássaros sincronizados com imagens de aves ou ruas de cidade completas com sons de tráfego realistas. O Google destaca a excelência do Veo 3 na simulação de física do mundo real e na sincronização labial precisa.
Expandindo as Capacidades de IA
Atualmente, o Veo 3 está disponível exclusivamente para assinantes do Gemini Ultra nos EUA, por meio do aplicativo Gemini e para usuários corporativos no Vertex AI. Ele também se integra ao Flow, uma nova ferramenta de criação de filmes com IA, projetada para simplificar a criação de vídeos. O Flow combina Veo, Imagen e Gemini para permitir que os usuários descrevam sua saída de vídeo desejada em linguagem natural, deixando os aspectos técnicos para a IA.
Ao apresentar o Veo 3, o Google não descartou seu predecessor. O Veo 2 permanece acessível, oferecendo aos usuários controle aprimorado dentro do Flow. Os usuários podem usar imagens como referências, manipular ângulos de câmera, ajustar proporções e até mesmo adicionar ou remover objetos de seus vídeos.
Imagen 4 e SynthID Detector
Juntamente com o Veo 3, o Google também apresentou o Imagen 4, seu mais recente modelo de geração de imagens. O Imagen 4 possui detalhes excepcionais, renderizando com precisão texturas intrincadas como tecidos e pelos de animais. Suas capacidades aprimoradas de tipografia e sua capacidade de gerar imagens de alta resolução (até 2K) em várias proporções o tornam uma ferramenta poderosa. O Imagen 4 está disponível por meio do aplicativo Gemini, Vertex AI e aplicativos do Workspace, como Docs e Slides.
Abordando a crescente dificuldade em identificar conteúdo gerado por IA, o Google lançou o SynthID Detector. Este portal permite que os usuários carreguem mídia para análise, determinando a presença do SynthID, a tecnologia de marca d'água de IA do Google. Embora não seja infalível, pois nem todos os geradores de IA empregam o SynthID, é um passo significativo em direção ao uso responsável da IA.
1 Imagem de Geração de Mídia IA:

Fonte: Engadget