Notícias sobre Inferência

IA

Novo modelo da DeepSeek reduz custos de inferência de IA

DeepSeek revela o V3.2-exp, um modelo projetado para reduzir significativamente os custos de inferência com seu inovador sistema de atenção esparsa.

posted on 29/09/2025

Computação em Nuvem

Ironwood do Google: Inferência de IA Otimizada para Clientes Cloud

Google revela Ironwood, sua TPU de 7ª geração, otimizada para inferência de IA, oferecendo desempenho e eficiência aprimorados para clientes do Google Cloud.

posted on 09/04/2025

Inteligência Artificial

Busca no Tempo de Inferência: Nova Lei de Escala da IA ou Apenas um Truque?

Explorando o potencial da busca no tempo de inferência como uma nova lei de escala da IA, examinando seus benefícios e limitações de acordo com especialistas.

posted on 19/03/2025