Menu
Sign In Search Podcasts Libraries Charts People & Topics Add Podcast API Blog Pricing

Leandro von Werra

👤 Speaker
133 total appearances

Appearances Over Time

Podcast Appearances

IA Sob Controle - Inteligência Artificial
238: Por que a Hugging Face não quer ser um frontier lab, com Leandro von Werra

E vocês já estão planejando um Small LM4? Imagino que já esteja nos planos, né? Na verdade, a gente pivotou um pouco. Então, a gente está fazendo coisas relacionadas ainda a pré-treinamento, mas o que a gente percebe é que a forma como a gente enquadra o problema de pesquisa em que a gente trabalha é sempre onde que a gente consegue obter o máximo de alavancagem para a comunidade. Qual que é o melhor uso do nosso esforço que gera mais valor para a comunidade?

IA Sob Controle - Inteligência Artificial
238: Por que a Hugging Face não quer ser um frontier lab, com Leandro von Werra

E quando a gente começou a trabalhar com Small LM, a gente era praticamente o único fazendo modelos pequenos. Tinha umas equipes também trabalhando com modelos pequenos, mas era mais como um pensamento secundário. Agora, se você olhar, por exemplo, o QN 4B quase se tornou o modelo principal para a equipe do QN. Dá para ver que eles investem muito tempo no modelo de 4 bilhões e nos modelos muito grandes.

IA Sob Controle - Inteligência Artificial
238: Por que a Hugging Face não quer ser um frontier lab, com Leandro von Werra

E os intermediários também são muito bons, mas dá para notar claramente que o modelo 4B é muito importante para eles. Então a questão é, a gente devia competir com o QEM a cada iteração? Talvez, mas tem outras equipes agora, como a Allen AI, fazendo os modelos menores que são interessantes também.

IA Sob Controle - Inteligência Artificial
238: Por que a Hugging Face não quer ser um frontier lab, com Leandro von Werra

Então uma coisa que a gente tem trabalhado um pouco mais hoje em dia é desenvolver modelos aplicados a esses casos de uso que são interessantes. Um desses domínios é, por exemplo, ir para a ciência, que é um campo super interessante nesse momento, onde você pega esses modelos e tenta, pega os insights, vê se você consegue fazer coisas interessantes semelhantes, mas aplicadas especificamente às ciências.

IA Sob Controle - Inteligência Artificial
238: Por que a Hugging Face não quer ser um frontier lab, com Leandro von Werra

Então pode ser matemática, ou física, ou biologia, ou química. E o mais interessante é que é um campo que é tão amplo nesse momento que você pode escolher praticamente qualquer domínio e tem coisas interessantes que você pode fazer. E ao mesmo tempo, se você tiver sucesso, tem um valor muito grande para a comunidade ou até para a humanidade em geral, né? Se você conseguir melhorar ou acelerar as ciências.

IA Sob Controle - Inteligência Artificial
238: Por que a Hugging Face não quer ser um frontier lab, com Leandro von Werra

Isso é uma coisa que a equipe da Hugging Face está super animada também, porque eu acho que a gente tem muitos físicos e cientistas, então naturalmente a gente tende a se interessar por esse tipo de problema. Então é uma coisa que a gente está meio que trabalhando bastante nesse Mumpire, Beto. É engraçado que tudo o que você mencionou, eu tenho que falar que a gente está fazendo mais ou menos a mesma coisa que a Hugging Face está fazendo aqui no Barcelona Super Computing Center.

IA Sob Controle - Inteligência Artificial
238: Por que a Hugging Face não quer ser um frontier lab, com Leandro von Werra

Eu acho que uma outra coisa interessante é que se você conversar com pessoas que fazem pré-treinamento, por exemplo, às vezes quando você fala com as pessoas dos grandes laboratórios, até de uns laboratórios abertos que trabalham com pré-treinamento, você tem um pouco a sensação de que muitos deles estão realmente bem esgotados, porque nesse ponto você já passou um pouco da fase da novidade, do terreno novo, e está na fase da repetição mais intensa, onde todo mundo sabe o que você tem que fazer para ter um bom modelo.

IA Sob Controle - Inteligência Artificial
238: Por que a Hugging Face não quer ser um frontier lab, com Leandro von Werra

fazer o treinamento distribuído funcionar de um jeito muito suave. Então tem pessoas depurando bugs que são distribuídos o dia inteiro e estabilizando esses sistemas, o que é uma tarefa de engenharia bem interessante, mas também é extremamente estressante, porque você está lidando com enormes clusters de GPU que custam milhares de dólares a cada hora ou até a cada minuto em que eles estão sendo usados ou não estão funcionando.

IA Sob Controle - Inteligência Artificial
238: Por que a Hugging Face não quer ser um frontier lab, com Leandro von Werra

do lado dos dados é parecido, né? Você simplesmente tem que repetir, tem que construir os conjuntos de dados melhores, tem que rodar mais ablações e aí você repete isso o tempo inteiro. Então tem muita pressão e você tem que trabalhar intensamente.

IA Sob Controle - Inteligência Artificial
238: Por que a Hugging Face não quer ser um frontier lab, com Leandro von Werra

Então, eu acho que, naturalmente, muitas pessoas estão olhando um pouco para as coisas novas e, assim, certamente tem valor em continuar esse pré-treinamento. Não estou falando que as pessoas têm que parar de fazer isso. Eu acho que ainda é interessante, mas, ao mesmo tempo, não é a única coisa interessante que você pode fazer atualmente e pensar em novas aplicações onde você pode dizer talvez a gente não precise do laboratório N mais 1, que faz o pré-treinamento de aproximadamente o mesmo modelo que todo mundo.

IA Sob Controle - Inteligência Artificial
238: Por que a Hugging Face não quer ser um frontier lab, com Leandro von Werra

Mas talvez a gente possa trazer uma coisa um pouco mais única para a mesa. Eu acho que é uma perspectiva interessante. E eu acho que as ciências são um lugar meio natural para procurar isso, porque tem um benefício claro para todo mundo se você conseguir criar um modelo melhor.

IA Sob Controle - Inteligência Artificial
238: Por que a Hugging Face não quer ser um frontier lab, com Leandro von Werra

Vocês estão olhando para modelos de mundo ou é uma coisa que nesse momento não faz muito sentido para a Hugging Face? Até você pessoalmente, te interessa? Como é que está? Sim, eu acho que é interessante. Até agora a gente não teve um esforço muito ativo em desenvolver os nossos próprios role models. A gente tem pensado um pouco sobre isso e experimentado um pouco mais no domínio da robótica, que eu acho que é uma aplicação mais imediata. Se você tiver um modelo de mundo muito bom,

IA Sob Controle - Inteligência Artificial
238: Por que a Hugging Face não quer ser um frontier lab, com Leandro von Werra

Talvez você possa usar isso como simulador, treinar a política do braço robótico, tipo, alguma coisa dentro do seu World Model, depois levar isso pra fora e ver se ainda funciona no mundo real. Eu acho que é aí que eu vejo atualmente o maior interesse imediato, mas, de forma geral, eu acho que World Models são, sim, um tema interessante. Gente, você tem top aí.

IA Sob Controle - Inteligência Artificial
238: Por que a Hugging Face não quer ser um frontier lab, com Leandro von Werra

Tem sido bem interessante como empresa, porque a Hug & Face foi essencialmente uma empresa de software por quase 10 anos, onde tudo o que a gente fazia era construir produtos, ou fazer pesquisa, onde tudo é digital. E de repente, a gente está construindo um robô agora, então tem que encomendar peça, e a gente não está fazendo só um protótipo, então tem que encomendar milhares dessas peças.

IA Sob Controle - Inteligência Artificial
238: Por que a Hugging Face não quer ser um frontier lab, com Leandro von Werra

que tem que descobrir onde conseguir essas peças, e de repente você percebe que uma dessas peças tem uma oferta que é mais limitada pelo mundo, então você tem que rever, tem que resolver as coisas. A gente teve pessoas viajando pra China várias vezes pra entender como configurar essa cadeia de suprimentos.

IA Sob Controle - Inteligência Artificial
238: Por que a Hugging Face não quer ser um frontier lab, com Leandro von Werra

mas também tem sido uma coisa muito recompensadora. Agora a gente vê os vídeos de pessoas que estão abrindo a caixa dos robôs, eu não sei se você sabe, mas o robô vem desmontado, tem que montar. E no começo as pessoas ficaram um pouco tipo, mas pra quê? Por que montar? Ninguém vai querer montar o próprio produto? Fala isso pra Ikea!

IA Sob Controle - Inteligência Artificial
238: Por que a Hugging Face não quer ser um frontier lab, com Leandro von Werra

Ou o Lego. Exatamente. Mas na verdade acabou que as pessoas ficaram muito felizes em montar o próprio produto, montar junto com os filhos. Eu acho que é muito mais divertido brincar com uma coisa que você construiu do que porque você faz parte dessa jornada. E também ver as pessoas usando pra todos os tipos de coisas diferentes é legal. A ideia do Retimini também é ser mais como uma plataforma de aprendizado. Então você pode programar você mesmo. Você pode implementar a sua própria política, o seu próprio comportamento do que você quer que o robô faça.

IA Sob Controle - Inteligência Artificial
238: Por que a Hugging Face não quer ser um frontier lab, com Leandro von Werra

Então, de novo, a gente não está construindo um robô que muita gente está construindo, mas é um robô um pouco único. Mas, ainda assim, é muito interessante para muita gente que quer entrar em robótica, porque custa só algumas centenas de dólares, o que é muito dinheiro, de uma certa forma, mas também não é muito dinheiro para a indústria de robótica, onde você pode gastar 10 mil dólares por um robô normal, de tamanho médio, e algumas centenas de dólares para experimentar, é um ponto de entrada aceitável para muita gente.

IA Sob Controle - Inteligência Artificial
238: Por que a Hugging Face não quer ser um frontier lab, com Leandro von Werra

O que me deixa realmente impressionado é que se você colocar o Reach Mini com um modelo tipo um QN de 4 bilhões de barômetros ou do embarcado, a experiência é completa de uma Alexa, certo? Tipo, o modelo poderia, ou um Jarvis do Iron Man, é como se todas as capacidades estivessem lá agora.

IA Sob Controle - Inteligência Artificial
238: Por que a Hugging Face não quer ser um frontier lab, com Leandro von Werra

Eu acho que hoje em dia, na verdade, a gente nem tá tão limitado por GPU assim. Depende um pouco do que você quer fazer, né? Eu acho que se você quiser ser um laboratório de ponta, quer dizer, também não conta isso pra equipe, porque pra maior parte da equipe eu acho que sempre dá pra ter mais GPU, né? Ninguém vai falar não. Mas eu acho que, no geral, pra coisas que a gente quer fazer, a gente não tá tão limitado por GPU porque a gente não tá mais estritamente no regime de pré-treinamento.