Pular para o conteúdo

Com o Lyria 3 Pro, a IA Gemini do Google agora pode criar músicas de até 3 minutos.

Jovem ouvindo música com fones enquanto mexe em laptop com teclado e alto-falante na mesa.

Após apresentar o Lyria 3 em fevereiro, o Google agora coloca no ar uma versão mais avançada, chamada Lyria 3 Pro. Disponível no Gemini pago, o modelo passa a gerar músicas com até 3 minutos de duração - um salto importante em relação ao limite anterior.

O Google vem ampliando sua atuação em inteligência artificial em várias frentes. No caso do Gemini, além de criar imagens e vídeos, a empresa também desenvolveu o Lyria, uma família de modelos voltada especificamente para geração de música. Com o lançamento do Lyria 3 no Gemini, usuários passaram a compor faixas de 30 segundos, com opção de baixar o resultado em MP3 ou MP4.

A chegada do Lyria 3 ao Gemini, porém, era apenas o primeiro passo. Em março, o Google anuncia o Lyria 3 Pro, que adiciona duas melhorias centrais: mais duração e mais controle criativo. Em vez de ficar preso aos 30 segundos, o Lyria 3 Pro cria músicas com até 3 minutos. E, além disso, oferece opções mais refinadas para orientar a geração de acordo com a intenção do usuário.

Segundo o Google, o ganho não é só de tempo: o modelo também “entende” melhor a estrutura musical, permitindo pedidos mais específicos. Em termos práticos, fica mais fácil sugerir partes como introdução, versos, refrão e ponte, o que ajuda tanto quem quer testar gêneros diferentes quanto quem busca composições com transições mais complexas.

Lyria 3 Pro no Gemini: mais duração e mais personalização

O Lyria 3 Pro aprofunda a capacidade de personalização ao aceitar instruções mais detalhadas sobre a composição. Em vez de solicitar apenas “um som em determinado estilo”, o usuário pode direcionar a criação para uma música com seções bem definidas e mudanças de clima ao longo do tempo.

Essa abordagem tende a ser especialmente útil em cenários como: - criação de trilhas para vídeos com “crescimento” de energia (começo leve, refrão mais intenso); - variações de um mesmo tema para diferentes versões (curta, média e longa); - experimentos de arranjos com alternância de instrumentação e ritmo entre as partes.

Também vale considerar o fluxo de trabalho: como as faixas podem chegar a 3 minutos, o Lyria 3 Pro se encaixa melhor em projetos que pedem uma trilha mais completa, como abertura + desenvolvimento + finalização, sem depender de colagens de trechos curtos.

Google diz ter respeitado o direito autoral

No tema direito autoral, o Google afirma que a IA foi projetada e treinada usando conteúdos que Google e YouTube tinham permissão para utilizar, com base nos termos de uso, em acordos com parceiros e nas leis aplicáveis.

A empresa também declara que, para proteger a originalidade da expressão, Lyria 3 e Gemini não fazem imitação direta de artistas. Se a instrução do usuário mencionar um criador, a ideia é que o modelo use isso apenas como uma inspiração geral, sem replicar a identidade musical de alguém de forma literal.

Além disso, o Google menciona o uso de um filtro que compara o áudio gerado pela IA com conteúdos já existentes, como uma camada de verificação adicional.

Por fim, os arquivos de áudio produzidos por Lyria 3 e Lyria 3 Pro recebem uma marca d’água invisível chamada SynthID, criada para ajudar a identificar conteúdos gerados por IA.

Um novo recurso para criação de conteúdo com Lyria 3 Pro

No aplicativo Gemini, o Lyria 3 Pro fica disponível para quem assina a versão paga do chatbot do Google. A tecnologia também aparece integrada em outros produtos da empresa, incluindo: - Vertex AI - Google AI Studio - API Gemini - Google Vids - ProducerAI

A proposta do Google é tornar a criação musical de alta qualidade acessível onde a criatividade acontece - atendendo desde desenvolvedores de aplicativos até profissionais de negócios, música e criação de conteúdo. Com essas integrações, usuários podem aproveitar as capacidades musicais avançadas do Lyria para ampliar a produção, acelerar protótipos e explorar novas ideias com mais agilidade.

Além do uso em trilhas e peças publicitárias, essa disponibilidade em múltiplas plataformas sugere espaço para aplicações como geração de “rascunhos sonoros” para campanhas, variações de temas para diferentes públicos e experimentação rápida de estilos antes de uma produção final mais trabalhada.

Comentários

Ainda não há comentários. Seja o primeiro!

Deixar um comentário