Novo modelo da DeepSeek reduz custos de inferência de IA
DeepSeek revela o V3.2-exp, um modelo projetado para reduzir significativamente os custos de inferência com seu inovador sistema de atenção esparsa.
posted on 29/09/2025DeepSeek revela o V3.2-exp, um modelo projetado para reduzir significativamente os custos de inferência com seu inovador sistema de atenção esparsa.
posted on 29/09/2025Google revela Ironwood, sua TPU de 7ª geração, otimizada para inferência de IA, oferecendo desempenho e eficiência aprimorados para clientes do Google Cloud.
posted on 09/04/2025Explorando o potencial da busca no tempo de inferência como uma nova lei de escala da IA, examinando seus benefícios e limitações de acordo com especialistas.
posted on 19/03/2025