Llama 4

Meta Apresenta Llama 4: Modelos de IA de Código Aberto de Nova Geração

A Meta acaba de lançar seus mais recentes modelos de IA, a família Llama 4, marcando um passo significativo no cenário de IA de código aberto. Esta nova coleção inclui o Llama 4 Scout, o Llama 4 Maverick e o Llama 4 Behemoth. Esses modelos foram treinados em um conjunto de dados massivo de texto, imagem e vídeo não rotulados para alcançar um **amplo entendimento visual**.

O desenvolvimento do Llama 4 foi supostamente acelerado devido ao sucesso dos modelos abertos do laboratório chinês de IA DeepSeek, que superaram os modelos Llama anteriores da Meta. A Meta respondeu intensificando os esforços para entender como a DeepSeek conseguiu reduzir os custos associados à execução e implantação de modelos como R1 e V3.

Llama 4 Scout e Maverick estão prontamente disponíveis em Llama.com e através de parceiros da Meta, como o Hugging Face. No entanto, o Behemoth ainda está em treinamento. O Meta AI, o assistente alimentado por IA integrado a aplicativos como WhatsApp, Messenger e Instagram, já foi atualizado com o Llama 4 em 40 países, embora os recursos multimodais estejam atualmente limitados aos EUA em inglês.

Restrições de Licenciamento

Alguns desenvolvedores podem achar a licença do Llama 4 restritiva. Entidades sediadas na UE estão proibidas de usar ou distribuir os modelos, provavelmente devido às rigorosas leis de privacidade de dados e IA da região. Além disso, semelhante aos lançamentos anteriores do Llama, empresas com mais de 700 milhões de usuários ativos mensais devem solicitar uma licença especial da Meta, que a Meta pode aprovar ou negar a seu critério.

A Meta enfatiza que os modelos Llama 4 representam o início de uma nova era para o ecossistema Llama. Esses modelos são os primeiros a utilizar uma arquitetura de mistura de especialistas (MoE), aumentando a eficiência computacional para treinamento e respostas a consultas. A arquitetura MoE divide o processamento de dados em subtarefas, atribuindo-as a modelos “especialistas” menores e especializados.

Por exemplo, o Maverick possui 400 bilhões de parâmetros totais, mas apenas 17 bilhões de parâmetros ativos em 128 especialistas. O Scout tem 17 bilhões de parâmetros ativos, 16 especialistas e 109 bilhões de parâmetros totais.

Desempenho e Capacidades

Os testes internos da Meta sugerem que o Maverick, projetado para casos de uso geral de assistente e bate-papo, supera modelos como o GPT-4o da OpenAI e o Gemini 2.0 do Google em codificação, raciocínio, tarefas multilíngues, compreensão de contexto longo e benchmarks de imagem. No entanto, fica aquém de modelos como o Gemini 2.5 Pro do Google, o Claude 3.7 Sonnet da Anthropic e o GPT-4.5 da OpenAI.

O Scout se destaca no resumo de documentos e no raciocínio sobre grandes bases de código. Seu recurso de destaque é sua enorme janela de contexto de 10 milhões de tokens, permitindo que ele processe e trabalhe com documentos extremamente longos. O Scout pode operar em uma única GPU Nvidia H100, enquanto o Maverick requer um sistema Nvidia H100 DGX ou equivalente.

O Behemoth, modelo não lançado da Meta, exige hardware ainda mais poderoso, com 288 bilhões de parâmetros ativos, 16 especialistas e quase dois trilhões de parâmetros totais. Os benchmarks da Meta mostram que o Behemoth supera o GPT-4.5, o Claude 3.7 Sonnet e o Gemini 2.0 Pro em avaliações de habilidades STEM, como resolução de problemas de matemática.

Vale a pena notar que nenhum dos modelos Llama 4 são verdadeiros modelos de “raciocínio” como o o1 e o o3-mini da OpenAI. Os modelos de raciocínio priorizam a verificação de fatos, levando a respostas mais confiáveis, mas tempos de processamento mais longos.

Abordando o Viés e Questões Contenciosas

A Meta também ajustou o Llama 4 para estar mais disposto a responder a perguntas “contenciosas”. Os modelos agora respondem a tópicos políticos e sociais debatidos que os modelos Llama anteriores evitavam. A Meta afirma que o Llama 4 é mais equilibrado no tratamento de prompts que antes não entreteria.

De acordo com um porta-voz da Meta, o Llama 4 fornece respostas úteis e factuais sem julgamento e é mais receptivo a diversos pontos de vista. Esses ajustes vêm em meio a acusações de aliados da Casa Branca de que os chatbots de IA são politicamente tendenciosos.

O viés na IA continua sendo um desafio técnico complexo, com empresas como OpenAI e xAI trabalhando constantemente para criar modelos que não favoreçam desproporcionalmente certas visões políticas.

2 Imagens de Llama 4:
imageLlama 4 imageLlama 4

Fonte: TechCrunch