Fabrício Carraro
👤 SpeakerVoice Profile Active
This person's voice can be automatically recognized across podcast episodes using AI voice matching.
Appearances Over Time
Podcast Appearances
Cada milhão de tokens custa 25 dólares. Se você fizer um prompt, a saída do seu prompt tiver menos de 200 mil tokens. Se tiver mais, aí custa 37,50. Isso valores do Opus, que é um modelo caro. Aqui na Zipo AI, na ZAI, o GLM5 custa, Marcos...
1 dólar por milhão de tokens na entrada e 3.2 dólares por milhão de tokens na saída. Então é 10 vezes mais barato praticamente do que o Cloud Opus, oferecendo uma qualidade que segundo eles é equivalente. Também não é exatamente igual, mas vai ser equivalente praticamente. Então para muitos casos de uso pode ser suficiente para você.
E eles também tem um plano de codificação, que eles aumentaram o valor um pouco, porque muita gente estava usando, só que ele também custa bem mais barato. Ele custa ali, a versão Lite custa 10 dólares por mês, a versão Pro custa 30 dólares por mês e a versão Max custa 80 dólares por mês. Sendo que a versão Lite, de 10 dólares, te dá acesso a 3 vezes mais uso, os limites são 3 vezes mais altos do que o plano Pro do Cloud, que é o plano de 20 dólares. Então...
Vale a pena você testar aqui os modelos GLM5 da Z.AI se você trabalha nessa área de codificação ou mesmo se você quer rodar modelos locais. Vai ficar o link aqui na descrição do Hugging Face e da página da Z.AI para você ver e tentar usar por lá também.
Tive um outro aumento recentemente, mas agora quem que aumentou para um milhão de tokens na semana passada? Nem lembro mais. É, foi o Claude, o Opus 4.6. Ele está com um milhão de tokens na janela de contexto. Isso ainda está em beta, tá? O oficial é 200 mil ainda, mas eles já estão testando beta com um milhão. Boa, você vê. Agora a DeepSeek aumentando de 128 mil, que era metade desse, para...
um milhão também, então em breve estaremos em uma realidade que um milhão vai ser a base, que é excelente. E isso é difícil, Marcos, inclusive, trabalhando no Barcelona Supercomputing Center, eu estou do lado do time de modelagem, de criação de modelos. Eu estou lá do lado da GPU, passo um calor danado. Praticamente.
E aí eles falaram que é um dos grandes desafios deles atualmente, de aumentar a capacidade, a janela de contexto de um modelo que nós temos lá já, os modelos Salamandra, modelos Alia, mantendo a coerência até para essas janelas de contexto mais longas. A gente tinha até recentemente a janela de contexto de 4 mil tokens.
conseguimos aumentar para 8 mil, depois para 32 mil, e uma última versão funcionava até 160 mil tokens, só que ela funcionava muito bem, até 120 mil, e continuava funcionando, só que quebrava um pouco ali no Needle e na Haystack, o teste da agulha no palheiro, de 120 mil para frente. Então aquela velha coisa, tem um milhão de tokens ali? Tem!
Mas você tem que ver até onde está bom nesse teste da agulha no palheiro. Se não é capaz de responder até 1 milhão, mas que funciona bem mesmo só até 400 mil, por exemplo, pode ser o caso. Mas é um desafio real de todas as empresas. É bem interessante.
Indo agora aqui para as rapidinhas, a minha querida, amada Unicamp, minha alma mater, anunciou que agora vai ter bacharelado de inteligência artificial e em ciência de dados. É um novo curso, já foi aprovado lá no MEC, e ele vai estar na faculdade tecnológica da Unicamp, que fica em Limeira, não é aquela...
de Campinas, oficial, mas vai ter, mostrando claramente a grande necessidade, a grande demanda, na verdade, por profissões, por carreiras e por estudos nessa área de inteligência artificial. A gente viu recentemente que os cursos de engenharia da computação continuam lá em cima, no candidato vaga, só que um que subiu muito foi estatística, por exemplo.
que tem tudo a ver com essa área de ciência de dados, principalmente, mas da inteligência artificial também. O machine learning tem tudo a ver com estatística. E agora a Unicamp também vai ter, a partir de 2027, bacharelado em IA. Boa. E a gente comentou na semana passada que existia aquele Cloud Hub.
Então, a VirusTotal, ela é do Google. Ela foi comprada pelo Google lá em 2012. Então, é uma empresa que já está nesse ecossistema há muito tempo e funciona bom. Eles ajudam ali a própria Google a fazer a parte de CyberSec deles, ali do Gmail, Google Search e tudo mais, né? Então, são confiáveis minimamente, né? Ok. Então, beleza. Gostei mais da notícia agora ainda. É.
Indo agora para outra rapidinha, a Monamour Mistral anunciou um investimento de 1,2 bilhão de euros, bastante grana, para construir um data center de IA na Suécia, na cidade de Burlanga, em parceria com uma empresa lá, a Eco Data Center, e eles estão prevendo iniciar isso, a construção, em 2027. Eu acho que talvez a primeira notícia que a gente vê brevemente
disso específica de construção de data center específico para IA em parceria com uma empresa de IA que não fosse americana talvez tivesse alguma da China que a gente não ouviu falar muito mas europeia com certeza é a primeira que eu escuto falar aqui e a Mistral
talvez tenha ganhado já esse jogo, que foi um jogo que ela entrou e ganhou por W.O., porque não tem muitas outras empresas com esse aporte financeiro que ela tem. Eu trabalho em um centro de pesquisa europeu, mas não é uma empresa privada. É um pouco diferente como funcionam as coisas. Então eles têm essa coisa de ser uma empresa privada, tem mais liberdade.
E de ter muito, muito apoio do governo francês. Porque quando eles vieram lá atrás, eles conseguiram se destacar em um mercado que estava nascendo. O governo francês viu isso e começou a ajudar, dar aportes e tudo mais para o desenvolvimento desse ecossistema de inteligência artificial na França. Depois veio a União Europeia também colocando um pouco mais de dinheiro em todo o ecossistema europeu.
mas eles estão lá. E agora faz todo sentido, até porque eles estão querendo ou ser comprados, ou fazer IPO também, em breve, como todas as empresas de IA querem. É uma empresa que conseguiu aumentar muito o valor de mercados deles. Então, meus parabéns aqui. E Borlänge, na Suécia. A Suécia é um lugar bem frio, que faz muito sentido para você construir um data center, que gera muito calor, mais do que você colocar no Texas.
Assim, da saída das pessoas e também isso de bastidor da reorganização dela pra tentar, a partir de agora, equilibrar melhor os esforços ali, os produtos, serviços, enfim. É, tem muita coisa envolvida que a fofoca diz, basicamente, que tem a ver um pouco com todo esse bafafá que o groc sempre causa. É sempre uma notícia negativa, geralmente, né, na mídia, de gerar as imagens de biquíni de meninas menores de idade...
De falar que ele é o Mecha Hitler e esse tipo de coisa, né? Isso com certeza deve ter influenciado, mas também falaram que o Musk tem se mostrado cada vez mais nos últimos três, quatro meses, pressionando demais, excessivamente a galera que está lá dentro, estaria, né? Pressionando demais essa galera, porque ele compara o nível do que eles têm, né? Do modelo que eles têm, o modelo Grock, com o nível do Claude, por exemplo, com o nível do Gemini, com o nível...