Gus Martins
đ€ SpeakerAppearances Over Time
Podcast Appearances
que ele Ă© o Developer Relations, Developer Advocate, lĂĄ na Google DeepMind, sobre os modelos Gema, sobre o Open Source Gema, responsĂĄvel sobre esses modelos. Fala aĂ, Gus. Oi, pessoal, tudo bem? Aqui Ă© o Gus, Product Manager da famĂlia de modelos Gema, aqui do Google DeepMind. Primeiro, obrigado, FabrĂcio, pelo convite para a gente conversar um pouquinho sobre
E eu queria falar hoje para vocĂȘs sobre o nosso lançamento de hoje, estou falando hoje na quinta-feira. Acabamos de lançar a famĂlia de modelos Gema 4, que estĂĄ disponĂvel em todas as plataformas, todas as ferramentas que vocĂȘ usa para modelos abertos. E a gente estĂĄ muito feliz e muito importante. Por que Ă© tĂŁo importante? Por que eu estou tĂŁo feliz? Primeiro, que o avanço tecnolĂłgico dessa famĂlia de modelos Ă© enorme.
Espetacular. Se vocĂȘ olhar lĂĄ no LM Arena, que Ă© um benchmark, vocĂȘ vai ver que os nossos modelos sĂŁo desproporcionalmente inteligentes pelo tamanho deles. EntĂŁo, que tamanhos que a gente estĂĄ lançando? NĂłs estamos lançando um 31 bilhĂ”es, denso, um 26 bilhĂ”es MOE, Mixture of Experts, um 4B, efetivo 4B, e um efetivo 2B. E qual que Ă© a diferença? Vamos falar dos grandes primeiro.
O 31B Ă© o nosso modelo mais inteligente, ele Ă© um modelo denso, ele Ă© o melhor para vocĂȘ fazer fine tuning. O 26B Ă© o mix of experts. Isso quer dizer que, na verdade, o que roda de um modelo, o quanto de parĂąmetros ativados que vocĂȘ tem Ă© 4B, prĂłximo de 4B.
EntĂŁo ele precisa de menos hardware, ele roda mais rĂĄpido e ele tem um desempenho muito parecido com o do 31B. Esses dois modelos, se vocĂȘ olhar no LM Arena, eles sĂŁo acho que o terceiro ou sexto entre os modelos abertos para texto, tĂĄ? Os outros benchmarks estĂŁo rodando, mas para texto Ă© o terceiro e o sexto.
Se vocĂȘ for comparar ele com os outros modelos que estĂŁo entre os top 10, eles sĂŁo dezenas de vezes menor que os outros. Tem modelos de 700 bilhĂ”es de parĂąmetros, 1 trilhĂŁo de parĂąmetros. O nosso tem 31, um tem 31, outro tem 26.
Putativement. Outra coisa que Ă© importante, esses modelos sĂŁo focados bastante em cĂłdigo, Code Assistant, eles entendem muito bem de gerar cĂłdigo. Agente, fazer aplicaçÔes com chamada de function calling, agentic capabilities, que a gente fala. Eles tĂȘm reasoning, todos os quatro tĂȘm reasoning, entĂŁo vocĂȘ pode habilitar, ele vai pensar antes de te dar uma resposta.
melhorando bastante as respostas. Eles sĂŁo multimodais, todos eles tĂȘm vision, eles enxergam, dĂĄ para vocĂȘ dar vĂdeo para eles, e os dois menores, o E2B e o E4B, eles tambĂ©m aceitam ĂĄudio como input. E a gente estĂĄ muito feliz com esses modelos. Outra vantagem que essa
lançamento agora os modelos sĂŁo a parte 2 na licença de todos eles a parte 2 o que Ă© muito legal feedback a comunidade eu queria uma licença melhor tudo bem vamos trabalhar nisso e cara eu aconselho fortemente vocĂȘ brincar com os modelos eles estĂŁo no estĂșdio para vocĂȘ testar direto sem precisar instalar nada mas se vocĂȘ quiser instalar tem todas as formas alguĂ©m fez o lama lama se pipi vln tudo tudo que vocĂȘ usa de modelos abertos realmente fez o mĂĄximo possĂvel
para estar disponĂvel com uma implementação de primeira linha, digamos assim. E, pessoal, se tiver feedback, quiser conversar, Ă© sĂł mandar mensagem aĂ. Estou mais que feliz de conversar, porque a gente estĂĄ muito feliz e espero que vocĂȘs utilizem esses modelos para criar excelentes aplicaçÔes e ajudar nos seus produtos por aĂ. Beleza? Valeu, galerinha.