Fabrício Carraro
👤 SpeakerVoice Profile Active
This person's voice can be automatically recognized across podcast episodes using AI voice matching.
Appearances Over Time
Podcast Appearances
E esse, Marcos, foi uma daquelas notícias que eu tive acesso com certa antecedência para testar, para brincar um pouquinho. Estava coçando a minha língua que não podia falar sobre isso. Mas achei super legal. E mais legal ainda que eles lançaram lá na LM Arena. Lembra dela? Ela não se chama mais LM Arena. Ela se chama Arena AI agora. Mudaram de nome, mudaram basicamente o que eles fazem.
mas ele estreou lá na Arena AI em primeiro lugar no quesito de geração de imagens a partir de texto, passando o próprio Nano Banana Pro. Ou seja, o pessoal gostou muito desse novo modelo, o Nano Banana 2, e ele custa metade do preço do Nano Banana Pro para você criar imagens. Então, excelente notícia para todo mundo. Obrigado, Google!
Android. E partindo agora para a Meta, essa notícia podia estar na Rapidinho, podia estar na OpenAI, podia estar aqui na Meta também, mas é mais uma curiosidade que uma pesquisadora de segurança lá da Meta AI, a Summer Yu, relatou... A líder de alinhamento, não é entre aspas uma pesquisadora de segurança, ela é dona do alinhamento e a da Meta. É importante esse contexto. Realmente, obrigado Marques.
Ela falou que estava usando o OpenClaw ali nos dias a dia dela e ela tinha conectado com as coisas do computador dela. E ela pediu para ele revisar a caixa de entrada do e-mail dela para sugerir o que ela poderia apagar, o que ela poderia arquivar. Tem muitos e-mails velhos que o pessoal, sei lá, tem arquivos grandes até que o pessoal passa por e-mail que dá para ser deletado ou arquivado para não gastar espaço ali na sua caixa do Gmail, por exemplo.
E aí o OpenClaw entrou numa louca lá e começou a apagar muito rápido vários e-mails dela. E ela começou, o que você está fazendo? Stop, stop, stop. E ele não parava basicamente, ele estava ali travado naquilo ali de apagar os e-mails dela. Ela teve que correr para o Mac Mini dela, que ela tinha comprado provavelmente.
pra rodar o OpenClaw, pra desligar ele da tomada, literalmente, e parar isso daí. E falou que, olha, eu não sei porque foi isso, talvez a sessão tenha ficado grande demais, e aí ele começa a resumir as informações passadas e ignora as instruções, essas ordens, por exemplo, de não fazer alguma coisa, ou de tomar cuidado, ou de pedir autorização. Eu só sei que eu li essa notícia e eu fui direto no meu OpenClawzinho aqui e falei, olha,
se você for fazer alguma coisa no meu GitHub, só com autorização, porque é a única senha que eu dei pra ele, senha não, mas o único token de acesso que eu passei pra ele foi o do meu GitHub, mas os outros, por exemplo, o do Gmail, eu criei um Gmail, um e-mail pro OpenClaw, pro meu robozinho, e aí se eu quero que ele tenha acesso a algum e-mail meu, eu encaminho do meu Gmail pra esse Gmail dele, mas essa coisa de organização, eu já sou organizado o suficiente, eu acho, no meu Gmail, então não é um grande problema.
Isso. E lembra que eu falei agora há pouquinho que a Meta tem uma capacidade maior do que a Anthropic na questão de treinar modelos, esse tipo de coisa. Uma é por eles terem uma fonte de renda que não precisa ser desse fã de infinito. Eles têm os ads da Meta, do Facebook, do Instagram e tudo mais.
E a outra é porque eles têm data centers próprios. O Mark tinha comprado 150 mil GPUs. Eu lembro que dois anos atrás já a gente falou uma notícia dessas. Por que eu estou falando isso? Porque a Meta agora assinou um acordo multibilionário de vários anos porque eles precisam de mais chips. Deu ali esgotado basicamente na NVIDIA já para os próximos anos, tá galera?
E aí eles fizeram esse acordo com o Google para eles alugarem os chips e as TPUs, não são GPUs, são as TPUs do Google para eles usarem ali como alternativa das GPUs da NVIDIA
e começar a colocar nos datacenters deles também, quem sabe comprar no futuro próximo, mas por enquanto é aluguel mesmo, porque eles querem treinar, querem colocar o máximo de poder possível, tanto para o treinamento desse modelo que a gente vem falando há alguns meses, o modelo que está com o apelidinho de Avocado, que é o novo Lhama, que a Meta quer lançar com esse time de super inteligência, só que ele não é um Lhama porque ele vai ser fechado, vai ser privado,
E vai competir supostamente com os modelos Cloud, com os modelos GPT, com os modelos Gemini. Então eles querem uma coisa muito poderosa aí e para inferência também, obviamente, depois. Mas esse anúncio rolou depois que a AMD falou que vai vender 60 bilhões, até 60 bilhões.
de dólares em chips para meta e também a Nvidia também já tinha fechado o contrato com eles, ou seja, aqueles 150 mil que eles anunciaram lá atrás, que o Mark Zuckerberg anunciou dois anos atrás, provavelmente vai virar 300 agora ou algo nesse sentido, eles estão investindo muito na questão
dos datacenters, porque eles acreditam que o futuro do planeta vai ser isso. Vai ser a gente rodando modelos de IA e nuvem, basicamente. Datacenter, lembrando, não é só para modelos de IA, não é só treinamento e inferência. É para rodar a nuvem do seu Gmail, do seu Google Drive, da sua Netflix, do seu TikTok, do seu Instagram, tudo isso é datacenter. Então, fiquem de olho nessas notícias aí nas próximas semanas e meses.
Toda semana a gente tinha anunciado recentemente a nova versão que eles tinham lançado, o maior modelo, o Queen 3.5, e agora eles lançaram uma família média, uma família intermediária de modelos dessa família 3.5, dentro do 3.5.
E aí vai ser o QEM 3.5 Flash, o QEM 3.5 de 35 bilhões de parâmetros, sendo que 3 bilhões são ativos. O QEM 3.5 de 122 bilhões de parâmetros, sendo que 10 bilhões são ativos.
E aí, um que não é como esses últimos dois que eu falei, que são mistura de especialistas, mixture of experts, que não roda a rede neural inteira de uma vez só. Ele só roda, por exemplo, esses 10 bilhões, só ativa esses 10 bilhões de parâmetros, ou aqueles 3 bilhões de parâmetros.
quando você vai fazer a inferência. O último é sim um modelo denso que ativa a rede neural inteira, que é o QEM 3.5, de 27 bilhões de parâmetros. Esse número de 27 bilhões é o mesmo número dos modelos GEMA da Google, que tem o GEMA 3. Imagino que em breve deva sair GEMA 4. Falando de Google I.O., imagino que eles devam estar esperando algo nesse sentido para lançar a família GEMA 4, que faz tempo que não tem.
Mas é basicamente continuando essa família de modelos open source deles, só que só variando basicamente os tamanhos para você rodar em máquinas menores, rodar localmente até na sua máquina. Por exemplo, esses modelos de 27 bilhões de parâmetros, você consegue rodar ele em uma GPU. E o modelo de 35 bilhões com 3 bilhões ativos, também, dependendo da GPU que você tiver, você consegue rodar
em uma só sozinha e claro eles todos estão aqui com uma janela de contexto de 1 milhão de tokens por padrão você consegue variar isso mas por padrão é isso e você já consegue baixar todos open source openwaits né lá no Hugging Face você consegue testar eles no Queen chat dessa vez eu vou ficar aqui falando dos benchmarks porque eles não são a família mais poderosa de todos né então é mais pela pelo tamanho