Fabrício Carraro
👤 SpeakerVoice Profile Active
This person's voice can be automatically recognized across podcast episodes using AI voice matching.
Appearances Over Time
Podcast Appearances
Sim. Eu usei, numa conversa com o Paulo Silveira aqui da Alura, a gente estava falando sobre alguns usos e ele me deu uma ideia genial que ele está usando e eu apliquei para mim também, para o meu robozinho aqui, o meu OpenClaw, que é usar ele como um repositório de ideias organizadas, mais ou menos. Então, o prompt exato que eu mandei aqui para o meu OpenClaw foi eu quero que você crie um arquivo ou uma pasta de ideias. Volte e-mail, eu vou te mandar um áudio ou uma mensagem por aqui e
que será uma ideia de projeto, de post, alguma coisa similar, e eu quero que você grave nesse local. E aí se alguma ideia que eu te mandei no passado tiver uma boa conexão com essa ideia atual, ou essa atual com alguma anterior, você pode guardá-las até no mesmo arquivo, no mesmo lugar, e me avisar caso você considere que isso faça sentido.
Então, é um repositório que ele vai mantendo ali de coisas do passado, que em algum momento ele fala, ó Fabrício, essa ideia nova tem muita conexão com alguma coisa que você me falou três meses atrás, e talvez você possa escrever um post sobre isso, ou talvez você possa criar um vídeo sobre isso, ou algo nesse sentido. Então, é uma ideia que é simples, mas que eu achei que, putz, que legal, cara, porque essas coisas se perdem totalmente. Eu tenho vários, vários, vários posts aqui no meu Google Keep,
que eles se perdem porque eu não olho mais. Só que se ele proativamente me avisar dessa coisa, pode facilitar muito na questão da criação de conteúdo pro futuro, né? É uma ideia boba, mas que eu achei bem bacana. Cara, isso, eu não sei se foi de propósito acidentalmente, mas é um método chamado setter casting nisso. Hum...
E você comentou também sobre outras pessoas fazendo similares do OpenClaw. Teve uma galera lá na China que eles reescreveram o OpenClaw usando a linguagem de programação Go e com isso, que ela é muito mais otimizada, eles conseguiram rodar ele numa Raspberry Pi de 10 dólares ali, usando menos de 10 megas de memória, ou seja, é 99% menor que o OpenClaw.
Consegue inicializar 400 vezes mais rápido. Liga ali em um segundo. Também gratuito, também open source. O repositório a gente vai deixar aqui na descrição para quem quiser dar uma olhada. Ele se chama Picoclop. Ultra Efficient AI Assistant in Go. Muito legal. E não foram só eles. Você falou da Moonshot, da Kimmy, que a gente vai ter até notícia. Achei até melhor trazer para cima e a gente falar sobre isso e relacionar o que eles fizeram, o Moonshot, em relação ao OpenClop.
O KimiClaw é basicamente um sistema nativo que você vai usar os modelos da Moonshot AI, os modelos Kimi K2, K2.5, que é o mais poderoso atualmente, para você rodar nativamente lá no navegador mesmo, 24 horas por dia. Então, ele vai subir ali para você na nuvem deles, lá da Moonshot AI.
E você consegue utilizar o Claw Hub, que tem mais de 5 mil skills da comunidade, tem 40 gigas de armazenamento, você consegue fazer busca ali, busca pro que eles chamaram, e conectar também com o Open Claw de terceiros, para fazer uma ponte, conectar no seu Telegram, é meio que a mesma coisa, só que você usando só os modelos lá da Moonshot AI, os modelos Kimi, que
dependendo, pode valer a pena, porque eles são modelos excelentes realmente, e você vai conseguir fazer esse uso através do plano deles, o plano lá da Moonshot AI, que em vez de você pagar por API, por tokens, que você gastaria muito usando, por exemplo, o modelo Squad, você pode só conectar diretamente ali no plano, que é como se você fosse usar o plano da OpenAI, do ChatGPT, que é como eu uso
o meu OpenClaw. Eu não uso por API, cobrando token, que isso poderia sair muito caro. Eu uso no meu plano normal da OpenAI, o de 20 dólares, que ele te dá muito limite ali para você fazer uso, por exemplo, para o seu códex. O limite é muito, muito alto para o códex e com isso você consegue usar praticamente de graça, incluindo no plano que você já está usando da OpenAI, sem problemas. Você poderia fazer essa mesma coisa lá por esse plano da Moonshot AI do Kimmy.
Outro lançamento bem interessante da OpenAI nesta semana foi uma versão nova do GPT 5.3 Codecs, que se chama Codecs Spark. Spark, isso que é uma fagulha, dizendo que ele vai ser muito rápido esse modelo.
E é finalmente a primeira coisa que eles estão fazendo desde a aquisição deles da Cerebra, uma parceria deles com a Cerebras, na verdade, que é um daqueles hyperscalers que eles criam chips muito específicos só para a produção de textos, chips no sentido de uma GPU específica para a inferência de modelos de texto de IA, que faz muito mais rápido do que as GPUs normais da NVIDIA que a gente está acostumado.
E essa versão aqui do Codex é para programação, só que programação rápida, muito, muito, muito rápida, usando esses chips da Cerebras. Eles falaram que é até 15 vezes mais rápido. O próprio Sam Altman colocou no Twitter dele que é mais de mil tokens por segundo, mil palavras praticamente por segundo. Então é absurdo. Eu tinha feito essa comparação já algumas vezes. Quando você fala das GPUs normais da NVIDIA, você está falando algo em torno de 100, 150...
tokens por segundo é um número considerável como bacana, como legal, 200 até. Esses chips aí da Cerebras, da Grok com Q também, que fez parceria com a Nvidia, eles conseguem fazer isso 900 tokens por segundo, 1.000, 1.500 tokens por segundo, dependendo ali da configuração. Então é muito, muito mais rápido.
E esse aqui, o GPT 5.3 Codec Spark, ele consegue ter 80% menos de overhead também e 50% mais rápido para emitir o primeiro token, o TTFT, que é Time to First Token, que é muito útil para quem quer fazer uma programação ali um pouco mais rápida. Só que tem algumas coisas, alguns poréns aqui. O primeiro aqui, por enquanto, ele só está disponível para a galera do plano PRO, aquele de 200 dólares por mês. Além disso,
ele não funciona tão bem quanto o GPT-5.3 Codex normal. Porque do jeito que eles fizeram, ele não está otimizado ainda para esses chips, então a performance deles vai ser pior, não vai ser tão boa quanto seria do Codex normal ou dos outros modelos normais da OpenAI. E também ele tem uma capacidade menor que eles falaram para a cibersegurança,
E segundo a própria OpenAI, eles não têm nenhum chance em algum dia, segundo eles, de chegar no patamar de alta capacidade de segurança do framework deles de preparedness, de preparação, talvez uma tradução que a gente possa fazer aqui, mas de segurança, basicamente. Não é a ideia. É um trade-off que você tem que escolher. Você quer mais qualidade e mais segurança ou você quer mais rapidez? Se você quiser mais rapidez, pode ser uma opção bem legal para você.
Sim, e nem precisa ser para Mac, porque tem para tudo, você pode fazer pelo terminal, usar o Codex, você pode usar dentro do VS Code, você pode usar inclusive só por mensagem mesmo, sem nem ver o código, lá dentro do próprio site do chat GPT, barra Codex, você vai abrir um projetinho, mas você não vai nem ver as pastas, você só vai escrevendo e trocando e ele vai te mostrando as coisas, você vai ter que saber como rodar, mas você pergunta para ele como rodar.
Marcos, como foi a sua primeira vez? Foi bom para você? Foi excelente para mim, fiquei satisfeito. Se eu fumasse, eu teria cedido um cigarro depois. Muito bom. Continuando aqui com o OpenAI, uma coisa que eu achei estranha, mas que a gente já tinha abordado anteriormente, um tribunal lá da Califórnia decidiu a favor da plataforma Cameo,
para proibir a OpenAI de usar o nome Cameo nos produtos dela. Para quem não sabe dessa polêmica, quando lançou o Sora 2, que lançou também o aplicativo do Sora, eles tinham lançado ali uma funcionalidade que chamava Cameo. Para quem não sabe do inglês, é você fazer uma participação. Então, quando o Neymar foi lá no filme do Vin Diesel, eles colocariam nas notícias que Neymar does a Cameo. Ele aparece e faz uma participação no filme do Vin Diesel, por exemplo.