Xiaomi lança MiMo V2.5 com IA multimodal e eficiência aprimorada

Xiaomi lança MiMo V2.5 com IA multimodal e eficiência aprimorada



A Xiaomi introduziu sua família de modelos MiMo-V2.5, adicionando recursos multimodais e avançando em sistemas de IA de primeira linha.

Resumo

  • A Xiaomi lançou os modelos MiMo V2.5 e V2.5 Pro, combinando recursos de texto, imagem, áudio e vídeo em um único sistema.
  • O MiMo V2.5 Pro apresentou resultados de benchmark quase de alto nível, resolvendo 57,2% das tarefas no SWE bench Pro enquanto competia com os principais modelos de IA.
  • A empresa reduziu o preço dos modelos e melhorou a eficiência dos tokens, usando até 42% menos tokens do que sistemas comparáveis ​​para desempenho semelhante.

Segundo a Xiaomi, o novo Modelos MiMo-V2.5 e MiMo-V2.5-Pro combine processamento de imagem, áudio e vídeo em um único sistema, trazendo recursos que antes eram divididos em modelos separados em uma versão integrada.

O que diferencia o MiMo-V2.5?

O MiMo-V2-Pro anterior concentrava-se em texto e código, enquanto as funções multimodais eram gerenciadas por um modelo diferente e de baixo desempenho. Essa separação não existe mais. O MiMo-V2.5 mescla esses recursos, permitindo aos usuários processar imagens, vídeos e áudio sem trocar de ferramentas ou modelos.

Os usuários podem fazer upload de uma foto e solicitar sugestões, analisar tutoriais em vídeo para obter orientação passo a passo ou extrair pontos de ação de reuniões gravadas, tudo dentro do mesmo sistema.

A Xiaomi descreve a versão Pro como “um grande salto em relação ao MiMo-V2-Pro em capacidades gerais de agente, engenharia de software complexa e tarefas de longo horizonte”, acrescentando que agora corresponde sistemas líderes como Claude Opus 4.6 e GPT-5.4 na maioria dos benchmarks de codificação e agentes.

Desempenho, preço e posicionamento

O MiMo-V2.5-Pro ​​foi desenvolvido para fluxos de trabalho exigentes. A Xiaomi diz que pode “concluir de forma autônoma tarefas profissionais que envolvem mais de 1.000 chamadas de ferramentas, trabalho que levaria dias para especialistas humanos”.

Executando de 60 a 80 tokens por segundo, o modelo Pro custa US$ 1,00 por milhão de tokens de entrada e US$ 3,00 por milhão de tokens de saída. O modelo básico MiMo-V2.5 é voltado para o uso diário, oferecendo velocidades mais rápidas de 100 a 150 tokens por segundo a custos mais baixos de entrada de US$ 0,40 e saída de US$ 2,00. Ambos os modelos suportam uma janela de contexto de token de 1 milhão, permitindo lidar com grandes conjuntos de dados ou conversas estendidas.

Os dados de benchmark colocam o modelo Pro próximo ao nível superior. No SWE-bench Pro, ele resolve 57,2% das tarefas, mais que o dobro da média típica de cerca de 25%. Os resultados no τ3-bench e no ClawEval o colocam perto dos modelos líderes, embora o desempenho caia em testes de raciocínio mais complexos, como o Último Exame da Humanidade, onde obteve pontuação de 48,0% em comparação com 58,7% do GPT-5.4.

A eficiência emergiu como um diferencial importante. Xiaomi diz que o MiMo-V2.5-Pro ​​usa 42% menos tokens do que o Kimi K2.6 para resultados semelhantes, enquanto o modelo básico consome quase metade dos tokens exigidos por sistemas comparáveis. Para desenvolvedores que operam em escala, o menor uso de tokens reduz diretamente os custos.

Implementação rápida e impulso ao ecossistema

Lançamentos recentes mostram uma cadência constante. A Xiaomi lançou o MiMo-V2-Flash no final de 2025, seguido pelos modelos V2-Pro, Omni e TTS em março, antes de lançar a série V2.5.

Lei Jun anunciado um investimento de 8,7 mil milhões de dólares em IA durante os próximos três anos, e a atividade desde então sugere que a implementação já acelerou.

Os dados da plataforma adicionam contexto. Os modelos da Xiaomi representavam cerca de 21% do tráfego OpenRouter no início de abril, com o uso aumentando mais de 42% em uma única semana. Esse crescimento ocorreu após um período de acesso gratuito por meio da ferramenta de IA agente Hermes, que ampliou a visibilidade e a adoção.

Atualizações de preços acompanham o lançamento. A Xiaomi removeu cobranças adicionais pelo uso da janela de contexto completa de 1 milhão de tokens e redefiniu os créditos do usuário como parte do lançamento. Os modelos estão disponíveis através da API MiMo, enquanto o acesso através do AI Studio permanece limitado.

Xiaomi disse que os modelos futuros se concentrarão em “raciocínio mais profundo, integração mais estreita de ferramentas e base mais rica no mundo real”, sugerindo que outro lançamento pode chegar mais cedo do que o esperado.



POstagem Original.