Fabrício Carraro
👤 SpeakerVoice Profile Active
This person's voice can be automatically recognized across podcast episodes using AI voice matching.
Appearances Over Time
Podcast Appearances
A17B, que 17 bilhões deles são ativos, usando aquela ideia que a gente sempre fala aqui de mixture of experts, a mistura de especialistas, que só uma parte da rede neural é ativada quando o modelo vai realmente fazer a inferência, quando ele vai te dar uma resposta, e essa parte equivale a 17 bilhões de parâmetros do total ativo.
de 397 bilhões, que é algo em torno de 4,2% da rede neural ativada para cada resposta que ele vai te dar. Ele é multimodal de uma forma nativa, ele foi treinado com esse foco em trabalhar com agentes também, ele usa aquela atenção híbrida linear e também o mixture of experts esparso,
E ele disse que foi treinado em mais de 200 línguas e dialetos. Eles falam dialetos que eles consideram vários dialetos lá da China. O Xangainês, tem vários realmente, não vou nem lembrar aqui de tantos. E já está disponível no Alibaba Cloud, já está disponível para você usar.
É um modelo open source, né? Diferentemente dos modelos CID 2.0, né? Os modelos Coen são sempre abertos, open source, com a licença Apache 2.0, que é extremamente permissiva. Você pode baixar lá no seu Hugging Face, você pode retreinar ele, você pode usar, fazer uso comercial dele, se você quiser também. E, novamente, a mesma história de sempre lá dos benchmarks. Estado da arte, fica perto dos modelos americanos, na maioria deles, e blá, blá, blá, blá, blá, pra não ficar a sopa de letrinhas aqui.
Mas talvez a única sopa de letrinhas que vale é os mesmos que a gente está falando no episódio inteiro aqui, o SWE Bench Verified, que é para programação agêntica, ele ficou com 76%, então está ali uns 5 pontos mais ou menos atrás dos modelos americanos privados, no tal ao quadrado Bench.
Ele fica com 86% contra 91%, por exemplo, do Cloud Opus, que era a versão 4.5 ainda, que eles colocaram aqui no benchmark, ou seja, também está um pouco atrás, em torno de 5% atrás. Então é isso, é um modelo aberto que você pode usar, é um pouquinho pior que os outros, mas você consegue rodar local. Se você tiver algo em torno de umas 8 GPUs HCM da NVIDIA, dá para fazer um cluster aí que...
Vamos continuar aqui as notícias. A Fei Fei Li, que é um dos grandes nomes de inteligência artificial no mundo, ela é da Universidade de Stanford, ela tem uma empresa que é a World Labs, que também é essa ideia de modelos de mundo, coisa mais da robótica também aplicada.
E ela, a empresa dela, levantou 1 bilhão de dólares na nova rodada de financiamento para fazer uma nova abordagem de IA, algo parecido com o que o Ian LeCun também está fazendo, com a parte de World Models, ela está também algo mais ou menos nessa parte. A Autodesk, empresa de 3D, investiu 200 milhões de dólares desse 1 bilhão daí, mas também teve da Anderson Horowitz, que é um grande VC, a própria NVIDIA que está colocando os ovos em todas as cestas possíveis.
A AMD também colocou. Bom, faz sentido, né? Você vai ter que rodar chips ali. Então, bem interessante. Parabéns pra Feifei. Quero muito entrevistar a Feifei aqui no IA Subcontrole. Se alguém tiver o contato dela, me passa, me encontra no LinkedIn e me passa por lá. Faz a ponte que vai ser muito legal bater um papo com ela aqui.
indo agora para boas notícias a Mistral Monamour ela comprou uma empresa ela fez uma aquisição tá podendo, fiquei surpreso com essa notícia inclusive, por 13.8 bilhões de dólares, a primeira aquisição dela, uma empresa parisiense francesa mesmo, que se chama Coyab
que a ideia deles é facilitar o deploy, basicamente, de aplicações de IA em escala e também a infraestrutura toda por trás disso. Eles querem forçar aquela estratégia deles de se tornarem full stack. Eles têm tudo para oferecer lá dentro e isso vai para acelerar a parte do departamento que eles chamam de Mistral Compute, que é basicamente a oferta deles de nuvem com esse foco em IA que eles tinham lançado no meio do ano passado. Agora, com a tecnologia, com todo o poder da Coyab também,
vai ajudar a rodar esses modelos também on-premise, vai otimizar o uso de GPU, escalar a inferência que eles têm. A plataforma deles vai continuar funcionando, mas vai ser também um componente mais central do Mistral Compute nos próximos meses. É uma empresa que não era muito grande.
tinha sido foldada em 2020, tinha 13 funcionários só, mas tinham levantado 8,6 milhões de dólares de investimento, e agora foi comprada por 13,8 bilhões. Então, bastante grana, bom para os dois, eu acho. Ah, sim, sem dúvida alguma.
que eles lançaram o Manos Agents, Agentes Humanos, que a ideia é levar todo o poder da IA, do Manos, que ele sempre foi um agentão, tinha várias integrações, você pede, ele faz, mas trazer para aplicativos de mensagens, inicialmente ao Telegram, que é onde todo mundo está usando o próprio OpenClaw. Então você pode estar, para todos os usuários que já pagam, o Manos vai poder já utilizar isso,
E em breve eles falaram que outras plataformas, então imagino que agora que a Meta comprou eles, eles vão poder estar dentro do WhatsApp. Que é uma diferença que eu sempre comentei nas semanas passadas, no episódio inclusive sobre OpenClaw, que se você conecta o seu OpenClaw no seu aplicativo do WhatsApp, é um risco quase certo que a Meta vai bloquear o seu número do WhatsApp.
E não tem como pegar o seu número de volta. Você vai perder o seu número do WhatsApp porque eles são muito chatos quanto a isso. Bots, esse tipo de coisa, se você não tem ali o plano deles, o plano pago do WhatsApp Business. Então, agora, ir no Telegram, isso aqui é gratuito. Mas como a Manos agora é da Meta, vai ser muito fácil eles integrarem aí de uma maneira gratuita mesmo.
Um grande plus aqui, uma grande vantagem para eles já estar dentro do WhatsApp, que é onde uma boa parte do mundo já está e que não gosta de ter que ir lá para o Telegram, tem alguma resistência de ir lá para o Telegram. Mas você vai poder usar o agente diretamente ali do chat, pedir para ele fazer coisas, mandar áudio, qualquer coisa assim, conectar via QR Code em alguma tarefa, executar qualquer coisa que você queira dentro do seu mundo humanos.
fazendo ali diretamente do seu aplicativo. Então, excelente notícia, mas mais uma daquelas que eu falei, menos de dois meses, essa daqui é mais uma que fez em menos de dois meses, o Kimmy Claw, mais um que fez em menos de dois meses, a OpenAI tem que ser rápida para tentar conquistar esse mercado, mas foi uma jogada muito legal, que era óbvia, claro, mas repetindo mais uma vez, porque é importante, como a Manus é da Meta,
gestão de projetos de RH, desde métodos tradicionais à inteligência artificial, Figma, como construir um produto com IA e MCP, governança de dados na prática, N8n para devs, enfim, muitos cursos que têm tudo a ver com isso, com pessoas de áreas diferentes, RH, por exemplo, Figma, que é para a área do design, mas para você usar a IA no seu fluxo normal, que pode ser, pode não, vai ser essencial para o profissional de 2026, 2027,
E uma outra notícia que tem tudo a ver com isso também, a Accenture divulgou agora que vai vincular as promoções para cargos de liderança ao uso regular das ferramentas de A por parte dos funcionários sêniores, os gerentes sêniores, diretores, associados, esse tipo de coisa, que é com esse foco de AI first, basicamente. É meio que um memorando que eles passaram ali, olha...