Fabrício Carraro
👤 SpeakerVoice Profile Active
This person's voice can be automatically recognized across podcast episodes using AI voice matching.
Appearances Over Time
Podcast Appearances
Então eu acho que não é feito pra mim nem pra você, é feito pra galera de lá, que eles já sabem essa história. É igual contar a história de Dom Pedro ou alguma coisa equivalente que a gente já tá cansado de saber, basicamente.
recorde. Aí o Leandro vai falar, é? Então topa. O que aconteceu? Exatamente. Eles lançaram o melhor modelo deles atualmente, que é o Quentrem, que é o Quentres Max Temping. Quentrem é de uma empresa mineira. Exato.
Mas o Q3 Max Thinking, que o modelo melhor deles que eles têm é o Q3 Max, e agora o modelo de Thinking, de raciocínio dessa família Q3, que é um modelo estado da arte, basicamente, vindo lá da China.
E eles publicaram os benchmarks e ele bateu de frente com os modelos estado da arte aqui do ocidente. Então, com o GPT 5.2 Thinking, com o Opus 4.5 e com o Gemini 3 Pro também. Essa ideia de comparar todos eles e ficou muito bem. Só que eles usaram aquela velha técnica de como mentir com dados, que também a OpenAI vinha fazendo ultimamente também.
O que é mostrar? No gráfico lá eles mostraram com time scaling, escalando ali, botando o modo high no tempo de inferência, durante a inferência, mas também sem isso. E aí, se eles fazem isso durante a inferência, melhoram ali, escalam,
poder computacional, aí ele bate todos em praticamente tudo. Olhando aqui, né, comparando com os modelos da concorrência, né, DeepSeq, Claudiopos, GPT 5.2 e Gemini, bateu no Live Command Band, bateu no de Olimpíada de Matemática, no DeepQA, que é de problemas de nível de PHD, no Humanities Last Exam, em
Praticamente todos, só não bateu no SWE Bench Verified e no TAL2 ou TAL² Bench, que é de Function Call, coisas mais agênticas. Só que, se a gente for considerar ele sem esse Test Time Scale, o aumento do poder computacional na inferência,
Aí ele fica um modelo ótimo, muito bom, melhor do que o DeepSeek, só que pior que o GPT, pior que o Gemini e mais ou menos ali igual ao Clouds, a não ser na parte de programação que nessa o Clouds é melhor que todos os outros, né?
Mas, de qualquer forma, o modelo está do da arte, comparável a todos os outros públicos aqui, com excelentes números e já está disponível para quem quiser utilizar ele lá na API e quem quiser utilizar também dentro do chat QEM, no site deles, que eles têm comissões de chat GPT lá do QEM.
E além disso, como o Marques falou, eles tomaram o meu desafio a sério e lançaram também outros dois modelos, que é o QEM 3 ASR, que é para reconhecimento de fala, e o QEM 3 Forced Aligner, um alinhador forçado, basicamente traduzindo aqui,
É literalmente tudo liberado, todos esses liberados, os pesos lá no Hugging Face, licença Apache 2.0, que é a mais liberal de todas. E aí a gente vai ter os modelos QN3-ASR de peso 0.6 bilhões de parâmetros, pequenininho, e de 1.7 bilhões, que aí vai fornecer esse reconhecimento de fala e idioma e a transcrição.
em 52 idiomas e sotaques, incluindo 22 dialetos chineses, que é uma coisa muito relevante para eles lá. A versão de 1.7 é mais para API para uso comercial, e a de 0.6 bilhão é mais para uma latência mais rápida, menor. E esse outro, o QEM 3 Forced Aligner, ele é de 0.6 bilhões de parâmetros, e é um modelo que não é autoregressivo, ele é para fazer o alinhamento
de texto para áudio, usando uma alta precisão de timestamps, a minutagem ali, em 11 idiomas, e ele bate todos os outros que existem até agora nessa questão. Então, novamente, como sempre, let them cook, né? Queen Alibaba cozinhando e lançando mil modelos toda semana, parabéns para eles. E partindo para Deep Seek, bastante notícia da Deep Seek, a gente também brincou, né? Que eles estavam meio quietos, não estão mais.
Sim, e a última aqui do cantão da China, muitos lançamentos, muitas coisas legais vindo de lá essa semana, uma delas foi da Moonshot AI, que era do modelo Kimi K2, agora eles lançaram o Kimi K2,5, que é a evolução dele.
um modelo open source mais poderoso já lançado por eles, talvez um dos mais poderosos que existam hoje em dia do mercado, competindo ali com o QWEN 2 Max Thinking que eu acabei de comentar, que ele é muito forte em capacidades agênticas e também capacidades multimodais ali, tem um foco, eles colocaram muito nessa parte multimodal de análises de imagens e análises de vídeos também.
Eles falaram que treinaram esse modelo com cerca de 15 trilhões de tokens, tanto de texto quanto visuais. E ele é muito bom em programação, muito bom nessas tarefas visuais, só que ele é muito mais rápido ali. Ele tem uma parte que eles especificaram que ele permite a criação de agent swarms, que são enxames visuais.
de agentes, que eles chamaram de 100 sub-agentes, para executar fluxos paralelos de trabalho, e com isso consegue reduzir o tempo, a latência de execução, em até 4 ou 5 vezes. E se a gente for olhar nos benchmarks que eles publicaram aqui, basicamente a mesma coisa que o QEM 3. Então, comparando aqui, que eles compararam com modelos da OpenAI, o GPT 5.2 Thinking, o CloudOps 4.5 e o Gemini 3 Pro,
eles ficam mais ou menos todos ali no mesmo nível, só que utilizando essa técnica que eles usaram do Agent Swarm, nos benchmarks de agentes, ele está na frente de todos os outros, na frente do GPT, na frente do Cloud e na frente do Gemini, que é bem interessante, então alguns benchmarks são o DeepSearch QA, o BrowseCom, o HLE Full,
bem bacana nos de código ele fica mais ou menos empatado não pouco atrás do Claude e do GPT um pouco à frente do Gemini mas basicamente também estado da arte em todos e nos benchmarks de vídeo ele fica à frente de todos menos o Gemini no benchmark do vídeo mmu e no long video bench ele fica na frente de todos
Então, outro modelo excelente, modelo gigantesco, open source, disponível lá para usar, para baixar, e novamente aqui palmas para o pessoal da Moonshot AI por um trabalho excelente feito aqui. Boa! E agora, eu estou com medo, Fabrício, do que a gente... Era para ser uma rapidinha, mas não vai ser uma rapidinha, tá? A gente, na semana passada, para falar 80 notícias por semana...