Felipe Blanes
👤 SpeakerAppearances Over Time
Podcast Appearances
O nosso lab, eu não deixei isso claro, mas existe uma organização que chama AGI na Amazon, que cuida de todos esses modelos. A organização que cuida de Nova Act é o AGI Lab. Então, é uma área bem específica da Amazon, um time...
pequeno, focado nessa pesquisa de agentes. Então, a nossa visão, sim, a nossa visão é a gente realmente, pelo nome mesmo, a gente é um laboratório de AGI, então a gente realmente quer ter o melhor modelo, o modelo estado da arte, inclusive os nossos benchmarks que a gente colocou na reInvent,
focado, obviamente, em automação de tarefas em browser. A gente bateu o melhor modelo do mercado em vários benchmarks e a gente ficou muito próximo de todos os outros. Então, a gente já considera que a gente tem para essa atividade específica um modelo de estado de arte e o time continua ativamente trabalhando, principalmente nas áreas que a gente ainda acha que tem algum gap, mas o objetivo é esse, com certeza.
E um outro objetivo do nosso lab é... A gente realmente quer focar em resolver um problema, sabe? A gente não quer simplesmente fazer coisas que ficam muito legal numa demo. Então, alguns casos de uso que eu estava falando para vocês, não é super empolgante de falar. Assim, pô, eu estou fazendo QA de um site? Pô, eu estou indo para um site extraindo informação, né?
Não é super legal, não é uma coisa que numa demo as pessoas vão ficar extremamente impressionadas, né? Mas é uma coisa que realmente resolve o problema das empresas, né? Então é isso que a gente quer fazer. O nosso objetivo, Fabrício, no fim das contas, é esse, entendeu? É como que a gente cria alguma coisa que resolve problemas e não só cria um monte de demo bonita, né? Pra gente ficar colocando nos lugares.
Assim, dentro do meu dia a dia no trabalho, eu uso bastante Nova Act, né? Como eu falei, eu uso para automatizar algumas coisas que... Reunião, essas coisas. A gente tem uma plataforma interna de buscar sala de reunião. E eu tenho que marcar muita reunião, né? Por conta da minha função, eu tenho muita reunião. E sempre tem aqueles conflitos. Pô, a reunião marcou, não marcou. Eu preciso de uma sala de reunião aqui em Seattle e uma em São Francisco. É.
É muito tempo perdido. Então, tem scripts que automatizam isso. Eu estou usando bastante também uma ferramenta da Amazon. É um serviço na AWS que se chama Amazon Quick. É uma interface web que você consegue criar o que eles chamam de flows.
Então, Flows é um workflow que você faz simplesmente só colocando prompt e você consegue integrar com várias, várias ferramentas. Ele já tem integração feita com a Sun, a Outlook, acho que Gira. Então, eu consigo praticamente automatizar um monte de workflow interno meu com isso.
E ele também tem uma outra coisa que chama Space. E aí o Space é muito legal porque você consegue conectar com base de dados ou você colocar um monte de documento lá e ele vira um chatbot com todo aquele conhecimento. Então, quando eu começo a trabalhar em um projeto, por exemplo, eu começo a colocar coisa nesse Space. E aí depois que eu já estou com esse projeto rolando, eu consigo perguntar para ele. Falo assim, pô, aquela atividade, aquele milestone, quando que a gente concluiu?
Ah, foi na data tal. Pô, você lembra o documento que a gente fez tal coisa? Então, ele consegue já buscar tudo para mim. Fica super fácil. Então, eu uso bastante esses dois hoje em dia. E externo, assim, fora do horário de trabalho, eu, na verdade, tento brincar com praticamente tudo que está no mercado, porque isso também me ajuda no ponto de vista de saber o que a gente pode melhorar no nosso produto.
Então, eu tô brincando bastante ultimamente com o Codex, Cloud Code, pra ver como é que eles são. Eu gosto bastante dos dois. Mas eu acho que é mais isso que eu brinco hoje em dia. Já é bastante coisa. E essa questão do Cloud e da Antrop, como é que tá hoje em dia aí dentro da Amazon?
O Clod, de novo, eu acho que eu não consigo falar pela Amazon como um todo, mas para mim, dentro da minha organização, a gente simplesmente não tem motivo para usar eles, a gente tem os nossos modelos, a gente usa eles.
Eu sei que a forma que principalmente a AWS pensa, a gente vai ter os nossos modelos, a Amazon quer ter os modelos dela, mas a AWS sempre prioriza dar a opção aos clientes. Então, acho que tudo isso que você vê de parceria com o Tropic, parceria com outras empresas também, é sobre isso.
A gente vai fornecer os nossos serviços, a gente vai fornecer os nossos modelos como Amazon, mas a gente sempre quer dar opção para o cliente para escolher o que eles preferem. Então, você como cliente da AWS, você pode falar, pô, para essa situação eu acho que o Cloud é melhor, para essa situação o Nova é melhor, para essa eu vou usar a OpenAI.
Então, a AWS foca muito nisso, em dar opção para o cliente. Então, é mais nesse sentido que a Amazon pensa com essas parcerias, eu acho. Mas, internamente, eu diria que... Eu não uso, tá? Eu não uso. Eu uso os nossos modelos internos, internamente. Porque eles atendem totalmente o que eu preciso fazer e eu estou me divertindo bastante com eles e economizando tempo.
Porque quando você está automatizando alguma coisa, acho que o Marcos falou, né? Coisa de ficar monitorando. Ninguém quer ficar monitorando, né? Você quer ter confiança o suficiente de você colocar aquilo lá em produção e, cara, deixa lá, né? Vai rodar no fim de semana, vai rodar à noite e eu confio. Então, essa é a nossa principal métrica, com certeza. A gente tenta ao máximo focar em...
Dá maior reliability, né? Dá maior confiabilidade possível. Mas eu acho que esse é o principal ponto, Fabrício. O outro ponto, a gente também foca, claro, em melhorar a latência do produto, porque latência também é uma coisa importante, né? Quanto mais rápido for, mais você consegue rodar. Porém, latência, assim, não é uma coisa...
extremamente crítica. Por quê? Porque, como eu estava falando dos nossos casos de uso, você pode imaginar que a maioria das coisas estão rodando assíncrono. Então, coisas assíncronas não importam tanto para você se demorou 5 minutos ou demorou 7. Porque você está dormindo, provavelmente, quando isso está acontecendo. E você consegue rodar vários em paralelo. Eu diria que a principal métrica que a gente quer melhorar hoje é, com certeza, a confiabilidade.
Bom, tem duas coisas aí. Eu acho que, primeiro, do lado do cliente. Então, você é um cliente e você está usando o nosso produto. Então, toda a questão de observabilidade está disponível já no nosso produto. Então, o nosso produto está disponível na AWS. Então, se você for na AWS procurar Nova Act no seu console da AWS, você acha ele lá.
E dentro desse console você tem todos os indicadores de observabilidade. Então você consegue ver quantas vezes você rodou cada workflow, o que falhou, o que não falhou, quanto tempo que demorou para rodar. Então todas essas métricas que você está buscando como um usuário, você consegue pegar lá.