Menu
Sign In Search Podcasts Charts People & Topics Add Podcast API Blog Pricing
Podcast Image

IA Sob Controle - Inteligência Artificial

228: Amazon AGI Labs e modelos Nova 2, com Felipe Blanes

25 Feb 2026

Transcription

Chapter 1: What is the focus of Amazon AGI Labs and its models?

4.503 - 21.158 Marcus Mendes

Olá, bem-vindas e bem-vindos à edição de quarta-feira, edição de entrevista do IA Sob Controle, o seu podcast com overfitting de informações sobre o mundo da inteligência artificial. Eu sou o Marcos Mendes e tenho, claro, a se encontrar na semana por aqui, o Fabrício Carraro, viajante e poliglota.

0

21.158 - 45.965 Fabrício Carraro

host do podcast Carreiras Sem Fronteiras e Program Manager da Alura Fabrício. Tudo bem? E aí, Marcos? E aí, pessoal de casa? Bem-vindos e bem-vindas a mais um episódio. E eu acho que é hoje que a gente vai ir no laboratório que talvez vai descobrir a AGI. É isso mesmo, Marcos? Eu espero que sim. Seremos guiados pelo Filipe Blanes, que é Senior Technical Program Manager lá na Amazon AGI.

0

45.965 - 62.401 Felipe Blanes

Bem-vindo ao IA Sob Controle. E aí, pessoal, obrigado. Fala, Marcos. Fala, Fabrício. Um prazer estar aqui com vocês. Estava falando antes de começar a gravar, sou super fã do podcast de vocês, então é um prazer estar aqui e gravar e falar um pouquinho sobre o que a gente está fazendo lá na Amazon.

0

62.401 - 89.435 Marcus Mendes

Excelente, vai ser muito bacana. E para quem já reconheceu a voz, o Felipe participou recentemente do episódio do Carreiras Sem Fronteiras e o link vai estar aqui na descrição. Mas vamos lá, para muita gente, a gente fala, a gente costuma falar sobre a Amazon aqui, a gente falou sobre a... Eu costumo falar a Alexandra para não disparar a assistente de ninguém, a Alexandra Plus, os modelos Amazon Nova, que teve a Reinvent faz pouco tempo, até teve um bando de lançamento, a gente falou a respeito disso, mas talvez...

0

89.435 - 105.55 Marcus Mendes

Amazon AGI seja a primeira vez que muita gente está escutando falar a respeito. Quer comentar um pouquinho sobre essa divisão, o seu histórico com ela? Sim, sim. E primeiro, minha Alexa, eu falei o nome, não acredito. É inevitável. Então pode falar o nome dela, tá?

105.55 - 129.175 Felipe Blanes

Ah, tá. O pessoal que está escutando aqui o podcast, sabe, às vezes dispara sem querer, já manda mensagem para a mamãe, aí já viu, né? Exato. Mas é sobre Amazon AGI. Então, Amazon AGI, vocês nunca falaram, mas indiretamente vocês estão falando do trabalho que a gente está fazendo, porque, por exemplo, o modelo que você acabou de falar, o Amazon Nova...

129.175 - 150.134 Felipe Blanes

Ele é justamente o modelo, todos os modelos da família Nova são os modelos que são feitos dentro de Amazon AGI. Então, AGI é uma organização totalmente independente da Amazon que cria todos esses modelos. Modelos da família Nova, a gente também cria produtos que usam esses modelos. Então...

150.134 - 175.109 Felipe Blanes

Como o nome já diz, é a área que está buscando o ADI, é a área que cria todos os modelos dentro da Amazon. Então, a nossa ideia é criar esses modelos tanto para aplicações internas da Amazon, quanto para o público geral. Esse modelo, o Nova, ele está disponível no nosso site e também está disponível na AWS para todos os nossos clientes usarem.

175.109 - 190.786 Fabrício Carraro

É, Felipe, a gente comentou por cima um pouco disso lá no episódio do Carreiras Sem Fronteiras, mas para quem não escutou, a gente vai trazer aqui, porque também fala bastante sobre inteligência artificial. Esses modelos, os Amazon Nova, geralmente a gente...

Chapter 2: How do Amazon Nova models differ from competitors?

336.907 - 366.792 Felipe Blanes

Ele está disponível só para alguns países no momento. Então, essa é uma questão. No Brasil, os modelos ainda não estão disponíveis. Ele está disponível hoje em Estados Unidos, Canadá, México e alguns outros países pelo mundo. Mas o time está ativamente trabalhando para lançar em outros países, inclusive no Brasil. O Brasil é uma prioridade, inclusive para mim, principalmente para mim.

0

366.792 - 385.118 Felipe Blanes

Mas tem toda a questão de regulação de cada país, que a Amazon é muito, muito cuidadosa com isso. Vamos ter certeza que a gente atende todos os requisitos das legislações de cada país antes da gente fazer um lançamento. E esses modelos, o Nova 2 Lite, o Nova 2 Pro...

0

385.118 - 406.297 Fabrício Carraro

Eu estava vendo lá na página deles mesmo, que você consegue ver como que você pode utilizar, que tem texto, imagem, que são multimodais. Eu achei interessante que eles já têm também uma janela de contexto de um milhão de tokens, que é uma coisa que os modelos Claudio e Tropic chegaram agora, literalmente na última iteração do Opus, e que eles já foram lançados há algum tempo já com essa janela tão grande.

0

406.297 - 421.653 Fabrício Carraro

Então é basicamente essa mesma pegada, né? Se a gente fosse comparar, o Nova Pro é como se fosse o Gemini Pro, o Claudi Opus, o GPT Thinking, e o Nova Lite é o Gemini Flash, essa galera, né? Sonet. Exato.

0

421.653 - 447.893 Felipe Blanes

Exato. Então, o Lite, naturalmente, ele vai ser um modelo um pouquinho melhor, menor, bem mais rápido, comparado com o Pro e com o Omni. E também é um modelo bem barato. É um modelo que eu vejo muitos clientes usando pelo fato do custo-benefício dele é muito bom. Os benchmarks foram muito bons, que a gente anunciou na Reinvent. E se você olhar qual é o custo dele por token, você vai ficar...

447.893 - 467.738 Felipe Blanes

pô, vale, realmente vale a pena, é um modelo que vale a pena dependendo da aplicação que você tem, principalmente, né, de novo, você é uma empresa, você tá rodando alguma coisa ali no seu back-end, né, que ninguém tá vendo, né, e você só tá praticamente conectando os pontos ali no seu workflow, é um modelo super interessante pra isso, eu uso bastante pra isso. Boa, e...

467.738 - 485.845 Marcus Mendes

Tem o Nova 2, Nova 2, né? O Sonic também, que pelo que eu entendo, ele é, também, partindo da premissa de que é voltado pra empresas, é pra aquela geração de voz pra voz, modelo de voz pra voz e a conversacional pra, suponho, saque, coisa desse tipo.

485.845 - 508.677 Marcus Mendes

E também uma das coisas que não está disponível por aqui, que imagino que vocês estejam trabalhando para disponibilizar, mas tudo para ver que o foco mesmo é empresarial e vocês têm, dá para te perguntar, tem tudo que você possa falar? É claro, casos de uso bacanas que ilustrem, por exemplo, as possibilidades que dá para fazer com esses modelos, talvez até com a geração 2 que talvez nem na 1 desse para fazer e que agora está rolando legal?

509.167 - 535.002 Felipe Blanes

Cara, eu tenho muito caso de uso focado no produto que eu trabalho hoje. Então, se você quiser, talvez esse seja o gancho para eu começar a falar sobre ele. Vamos lá. Então, dentro dos modelos e produtos da família Nova, tem todos esses modelos que a gente conversou. Também tem o Ford. E o Ford a gente anunciou na Reinvent também, que é super interessante. É um produto que...

Chapter 3: What are the use cases for Amazon Nova in enterprises?

675.875 - 701.677 Felipe Blanes

eu tenho script para tudo isso. Eu não preciso mais ficar buscando sala de reunião manualmente, né? Eu já tenho um script que fica todas as minhas reuniões, ele já fica buscando sala de reunião para mim em todos os lugares que eu preciso. Mas a sua pergunta foi sobre... A gente pode falar mais sobre Nova Act, mas sobre os use cases. Então, um use case que a gente está vendo muita gente usar com Act...

0

701.677 - 720.965 Felipe Blanes

E eu não estou surpreso, é QA. Então, assim, tem muita, muita, muita empresa usando para fazer QA. Então, eu não sei quanto que vocês já tiveram que fazer QA de sites na vida de vocês, mas você tem duas opções, né? A primeira opção é faz manualmente.

0

720.965 - 741.265 Felipe Blanes

Que é totalmente desagradável, né? Extremamente desagradável de ficar todo dia ou toda vez que tem uma atualização de software rodando teste manual. E a segunda opção é você automatizar. Mas, quando você automatiza hoje com as ferramentas tradicionais de automação de teste...

0

741.265 - 771.252 Felipe Blanes

O grande problema que você cria é a manutenção desses testes é extremamente alta, né? Porque toda vez que você muda o seu site, você mudou um labelzinho ali no HTML do seu site e quebrou. O seu teste não serve mais para nada. E imagina se você está usando uma ferramenta como essa, o Nova Act, que em vez de você ter ali os comandinhos com HTML, qual que é o ID daquele elemento, não, você só escreve assim, clica no botão de comprar.

0

771.252 - 801.087 Felipe Blanes

Não vai quebrar, não importa se o botão mudou de lugar, se o botão mudou de cor, ele continua funcionando o seu script. Então é praticamente uma pessoa testando, mas que é um agente no fim das contas. Então tem muita gente usando para QA. Tem até alguns casos que são super interessantes. Então tem a Hertz de aluguel de carro. Eles são um dos nossos clientes que foram nossos parceiros de lançamento na reInvent.

801.087 - 818.587 Felipe Blanes

E eles estão fazendo o test, estão fazendo o QA de todo o site dele, então a parte principalmente o flow de reservar, fazer uma reserva de carro, eles fazem tudo isso, toda vez que eles têm uma versão nova de software, eles passam e rodam a nova Act para todos os principais casos de uso.

818.587 - 840.946 Felipe Blanes

Porque é o que eles falam, né? Eles falam, se eu ficar uma hora sem reservar carro, eu tô perdendo muito dinheiro, né? Então, eu não posso deixar isso acontecer. Outro parceiro nosso de lançamento, que é um exemplo bem interessante, é uma startup que chama Sola. Então, essa startup, eles falam que eles são RPA 2.0.

840.946 - 864.622 Felipe Blanes

Então, RPA é Repetitive Process Automation. Então, é automação de processos repetitivos. E eles são a evolução do tradicional. Então, eles praticamente usam diversas tecnologias mais recentes para automação de processo. E quando entra na parte de browser, eles usam a gente lá por trás dos panos, tomando todas as ações.

864.622 - 893.343 Fabrício Carraro

Então, assim, as pessoas me perguntam, pô, mas qual que é o caso de uso? Aí eu falo pra elas, cara, é simplesmente qualquer coisa que você faz no browser, né? É difícil eu falar quais são, mas é isso. E eu fiquei com duas perguntas agora disso que você trouxe. Você falou que ele é meio que um fine-tuning do Nova Lite, né? Essa questão de usar o Nova Lite, não o Nova Pro, que seria o modelo mais robusto, é por causa da latência, principalmente?

Chapter 4: How does Nova Act automate browser tasks?

1035.43 - 1064.827 Felipe Blanes

primeiro de maio. Então, primeiro, o modelo já vai ter que assumir que é 2026. Segundo, ele vai ter que abrir, ele vai clicar no date picker. Primeiro, ele vai ter que identificar. Pô, eu tenho que clicar naquela área de texto. Ele vai clicar naquela área de texto. Vai abrir o date picker. Ele vai ter que identificar em que mês que eu estou agora. Pô, eu estou em fevereiro. Então, significa que eu tenho que clicar naquela setinha do lado para ir para março.

0

1064.827 - 1089.734 Felipe Blanes

Na hora que ele vai para a setinha, ele tem que confirmar se funcionou. Pô, eu estou em março? Estou. E agora sim eu posso clicar no dia 1º. Então, não é uma ação, né? Na nossa cabeça como ser humano, a gente fica pensando, pô, é uma ação. É, escolhe 1º de março. Não, a gente teve que fazer, tomar pelo menos umas 6, 7 decisões para escolher uma data, né?

0

1089.734 - 1111.435 Marcus Mendes

Então, é bem complexo o Date Picker. Pois é. Tem um que eu deparei esses dias que, pra escolher o ano, você precisava adivinhar que se você clicasse no mês, ele faria tipo um zoom out de calendário pra você escolher qual que era o ano. Essa cara é muito... Tá bom, né? Deixa pra lá. E aqueles que você clica e depois você tem... É tipo origem e destino, né? O começo e o fim.

0

1111.773 - 1128.023 Felipe Blanes

você clica no primeiro, aí depois você já tem que imediatamente clicar na data de retorno. Só que se você clicar errado, aí já faz uma confusão. Você tem que dar. Estamos olhando para você, Google Flights. Exato.

0

1128.023 - 1151.767 Marcus Mendes

Excelente. E já que a gente está falando sobre essa parte de navegação autônoma, eu fiquei curioso sobre as suas impressões. Na verdade, nem é especificamente sobre nenhum dos modelos nova, então a gente pode falar rapidinho sobre isso, que eu estou genuinamente curioso. Sobre navegação autônoma para o grande público, a impressão que eu tenho é que quando isso era uma promessa, parecia super legal, que ia mudar o mundo. Aí lançou e traçou.

1151.952 - 1165.655 Marcus Mendes

E a gente fala que talvez seja porque é difícil as pessoas mudarem de hábito de navegador, mas o que precisa acontecer, na sua opinião, não como o Amazon, mas para isso de navegação agêntica e autônoma pegar? Porque parece que ninguém se importou, sabe?

1165.925 - 1187.035 Felipe Blanes

E, cara, um parênteses, tá, Marcos? Toda vez que a gente vai pensar em uma demo, eu sempre falo, não vamos fazer, tipo, reserva de voo. Porque eu sempre lembro de vocês falando de reserva de voo. É sempre a demo de todo mundo, né? Tá vendo, Fabrício? É assim que a gente faz a diferença. Exato.

1187.035 - 1210.306 Felipe Blanes

Mas eu acho, para mim, a ponte sobre o seu exemplo é, eu acho que, primeiro, as pessoas têm expectativa que máquinas vão ser mais rápidas do que elas. E, de maneira geral, para fazer a automação de uma atividade, elas ainda não são. Então, acho que esse é o primeiro ponto.

1210.458 - 1231.94 Felipe Blanes

O segundo ponto é, eu como ser humano, eu ainda quero estar dentro desse loop. Eu ainda não consigo confiar 100% para não estar dentro do loop para fazer qualquer coisa. Então, por exemplo, o exemplo mesmo da passagem aérea. A forma que eu olho passagem aérea é extremamente específica.

Chapter 5: What challenges do companies face with QA automation?

1370.787 - 1395.391 Felipe Blanes

É, pare e pense, é coisa que você não quer fazer, cara. É justamente coisa que você não quer fazer e precisa a gente fazerem. E qual que é o seu dia a dia, então, nesse projeto e em outros projetos que você esteja envolvido aí na AGI Labs da Amazon? Hoje eu trabalho diretamente com cliente, Fabrício. Então, a minha função é... Eu tenho um time de Solutions Architects e a nossa função é...

0

1395.391 - 1418.78 Felipe Blanes

É praticamente pegar esse produto que o nosso time de engenharia e de pesquisa está fazendo e ajudar os nossos clientes a aplicar. Então, o dia todo, conversando com o cliente, entendendo o que eles estão fazendo, quais são os use cases que eles têm, quais são os problemas que eles estão enfrentando, tentando ajudar, às vezes a gente consegue resolver o problema para o cliente,

0

1418.78 - 1440.953 Felipe Blanes

E às vezes não, e aí é o que a gente chama que é o feedback loop, né? Então a gente fecha esse loop de aprendizado, a gente tá o tempo todo falando com o cliente, entendendo o que eles precisam, e a gente vai alimentando todo o nosso time de engenharia, time de pesquisa, falando, pô, é pra esse lado que a gente tem que ir, é aqui que os nossos clientes estão precisando de mais ajuda.

0

1440.953 - 1462.638 Felipe Blanes

Ajuda, mas também, por exemplo, se o modelo não funcionou, não deu certo naquele caso de uso que o cliente precisava, vocês também vão no time e falam, ó, melhora isso, faz um fine tuning, dá uma nova versão? Também, exatamente. É praticamente assim, é fechando o ciclo de requisição de funcionalidades novas ou de alguma coisa que não está funcionando direito.

0

1462.638 - 1488.001 Felipe Blanes

Então, existe isso também para o nosso time mais de Science, é muito falando, o modelo está falhando aqui, o modelo não está indo muito bem aqui, para eles fazerem coisas para as próximas versões melhorarem. Inclusive, sobre essa parte do modelo, eu sei que vocês gostam de saber dessa parte, uma coisa que a gente faz bastante, a gente usa bastante o Reinforcement Learning, que é aprendizado por reforço,

1488.001 - 1508.69 Felipe Blanes

E isso daí é tudo público, tá? Então, tudo que a gente colocou no nosso lançamento na Reinvent, a gente fala um pouquinho disso. Mas a gente tem uma coisa que a gente chama de gyms, que são as academias. Então, no nosso time de pesquisa, eles ficam fazendo sites.

1508.69 - 1530.813 Felipe Blanes

Sites fictícios, diferentes sites, tudo que vocês podem imaginar de site fictício e você coloca esse modelo para ficar treinando, para ficar clicando, navegando, navegando esse site e aí o retorno de cada tentativa do modelo é assim, você fez certo, você fez errado, você fez certo, você fez errado essa atividade e ele vai melhorando, ele vai melhorando ao longo do tempo.

1530.813 - 1550.422 Felipe Blanes

Então, colocando nessa parte do meu trabalho, o que eu faço hoje, então vamos supor que tem clientes meus falando, pô, o Date Picker não está funcionando, não está funcionando legal. Então, esse é o feedback que eu mando para eles, para quê? Para eles começarem a criar mais gyms, mais academias,

1550.422 - 1574.738 Felipe Blanes

para treinar esse caso de uso, essa aplicação específica. Então, não são cópias de sites, são sites totalmente fictícios, mas que tem todas essas áreas que a gente precisa que o modelo melhore. Então, se você precisa que o modelo fica treinando em drop-down, a gente vai fazer um monte de site de aplicações fictícias de drop-down.

Chapter 6: How is feedback integrated into model development at Amazon?

1715.662 - 1731.625 Felipe Blanes

Eu apresentava um produto e as pessoas falavam assim, ah não, acho que eu não tenho nenhum caso de uso para isso. Pensa bem, eu tenho quase certeza que você tem, eu acho que qualquer pessoa tem, entendeu? Não é possível que não tem nada que você faz toda semana.

0

1731.625 - 1757.917 Felipe Blanes

que você gostaria de automatizar. E aí tinha um trabalho maior de discovery, de fazer um trabalho de sentar com o cliente, explorar quais são os processos da empresa e achar um caso de uso. Hoje em dia não, eles já chegam muito mais, ah, meu caso de uso é esse, eu quero fazer uma automação nesse processo de compra, blá, blá, blá, me ajuda a resolver esse ponto que eu estou tendo problema.

0

1757.917 - 1779.905 Marcus Mendes

E nessa veia, eu suponho, por exemplo, a pessoa fala assim, não, não tem nenhum caso de uso, você fala, eu imagino que tem, afinal você trabalha, né? E a pessoa ter essa, não é nem o zero expectativa, mas ela nem pensar que isso é uma coisa que daria para automatizar, é porque é uma falta de confiança de que é uma coisa que dê para fazer, é aquilo, e também colado nisso assim, quando...

0

1779.905 - 1794.89 Marcus Mendes

Vocês implementam, começam a implementar, quanto tempo você percebe que demora até a pessoa de fato falar, putz, eu posso agora deixar isso rodar sozinho, sem ficar ali acompanhando, porque basta um tropeço para a confiança cair bastante, especialmente nesse começo.

0

1795.126 - 1815.865 Felipe Blanes

Cara, eu acho que a primeira coisa é... Primeiro, eu acho que esse tipo de produto é muito visual, né? Então, a partir do momento que você começa a mostrar uma demo ou você mostra um protótipo simples, já começa a clicar, sabe, na cabeça da pessoa, já fala, ah, calma, tem uma ideia aqui, tem uma ideia ali.

1815.865 - 1840.688 Felipe Blanes

Então, acho que esse é o primeiro ponto. O segundo ponto sobre a confiança, o que eu vejo é, as pessoas geralmente elas começam com casos de uso que são menos críticos na operação dela, para ganhar confiança dessa forma. Então, eu não vou começar com aquele meu processo super crítico que se falhar esse agente, minha empresa para.

1840.874 - 1857.513 Felipe Blanes

Não, eu vou começar naquele caso que é um pouquinho mais simples, se falhar não tem problema, não tem nenhum cliente que vai ser diretamente impactado. Eu vou criando outros casos de uso, um pouco mais complexo e um pouco mais envolvidos na parte mais crítica do processo da empresa.

1857.682 - 1882.201 Fabrício Carraro

E a gente está agora, Felipe, em 2026, comecinho de 2026, quando a gente vê, assim, acelerou muito, eu acho, a velocidade de lançamento dos modelos de fronteira. Quando a gente fala de Gemini, lançou o 3 Pro, que agora nós somos o melhor modelo do mundo. E aí agora, literalmente, dois meses depois, eles eram o pior modelo dentre os top, porque já tinha lançado...

1882.201 - 1906.568 Fabrício Carraro

o Cláudio Opus 4.6 e depois o GPT Codex 5.1, 5.3, GPT 5.2 Thinking, Pro, não sei o que e tal. A ideia dos modelos novos da Amazon é chegar no nível desses caras, no nível, eu digo, de treinamento, de benchmarks, de popularidade, falando também, pensando...

Chapter 7: What are the future plans for Amazon AGI Labs in 2026?

2054.005 - 2082.473 Marcus Mendes

Ou também não é de fazer uma coisa super generalista, talvez? Sim, é. Exato. No nosso caso específico, a gente está querendo resolver problemas bem específicos. Agora, chegando perto lá, mais para o finalzinho do episódio, eu vou fazer uma das minhas perguntas clássicas também de curiosidade, que é perguntar como é que você tem usado, seja os modelos Nova para os seus próprios fluxos, ou seja, sem citar concorrentes, outros modelos para o seu dia a dia. Como é que tem sido o seu uso, sua adoção dia a dia?

0

2082.693 - 2110.722 Felipe Blanes

Assim, dentro do meu dia a dia no trabalho, eu uso bastante Nova Act, né? Como eu falei, eu uso para automatizar algumas coisas que... Reunião, essas coisas. A gente tem uma plataforma interna de buscar sala de reunião. E eu tenho que marcar muita reunião, né? Por conta da minha função, eu tenho muita reunião. E sempre tem aqueles conflitos. Pô, a reunião marcou, não marcou. Eu preciso de uma sala de reunião aqui em Seattle e uma em São Francisco. É.

0

2110.722 - 2129.639 Felipe Blanes

É muito tempo perdido. Então, tem scripts que automatizam isso. Eu estou usando bastante também uma ferramenta da Amazon. É um serviço na AWS que se chama Amazon Quick. É uma interface web que você consegue criar o que eles chamam de flows.

0

2129.639 - 2149.012 Felipe Blanes

Então, Flows é um workflow que você faz simplesmente só colocando prompt e você consegue integrar com várias, várias ferramentas. Ele já tem integração feita com a Sun, a Outlook, acho que Gira. Então, eu consigo praticamente automatizar um monte de workflow interno meu com isso.

0

2149.012 - 2177.243 Felipe Blanes

E ele também tem uma outra coisa que chama Space. E aí o Space é muito legal porque você consegue conectar com base de dados ou você colocar um monte de documento lá e ele vira um chatbot com todo aquele conhecimento. Então, quando eu começo a trabalhar em um projeto, por exemplo, eu começo a colocar coisa nesse Space. E aí depois que eu já estou com esse projeto rolando, eu consigo perguntar para ele. Falo assim, pô, aquela atividade, aquele milestone, quando que a gente concluiu?

2177.243 - 2203.737 Felipe Blanes

Ah, foi na data tal. Pô, você lembra o documento que a gente fez tal coisa? Então, ele consegue já buscar tudo para mim. Fica super fácil. Então, eu uso bastante esses dois hoje em dia. E externo, assim, fora do horário de trabalho, eu, na verdade, tento brincar com praticamente tudo que está no mercado, porque isso também me ajuda no ponto de vista de saber o que a gente pode melhorar no nosso produto.

2203.737 - 2223.869 Felipe Blanes

Então, eu tô brincando bastante ultimamente com o Codex, Cloud Code, pra ver como é que eles são. Eu gosto bastante dos dois. Mas eu acho que é mais isso que eu brinco hoje em dia. Já é bastante coisa. E essa questão do Cloud e da Antrop, como é que tá hoje em dia aí dentro da Amazon?

2224.021 - 2238.061 Felipe Blanes

O Clod, de novo, eu acho que eu não consigo falar pela Amazon como um todo, mas para mim, dentro da minha organização, a gente simplesmente não tem motivo para usar eles, a gente tem os nossos modelos, a gente usa eles.

2238.128 - 2259.442 Felipe Blanes

Eu sei que a forma que principalmente a AWS pensa, a gente vai ter os nossos modelos, a Amazon quer ter os modelos dela, mas a AWS sempre prioriza dar a opção aos clientes. Então, acho que tudo isso que você vê de parceria com o Tropic, parceria com outras empresas também, é sobre isso.

Chapter 8: How can developers participate in the upcoming hackathon?

2415.215 - 2441.675 Fabrício Carraro

E como vocês fazem o monitoramento de tudo isso? Quando você coloca, o cliente coloca para rodar, na verdade. Na verdade, quando a gente roda, nos testes que eu faço, por exemplo, ou no mercado mesmo, geralmente é algum serviço. Um Langfuse, um Langsmith, algo nesse sentido, que é usado para fazer essa questão da observabilidade. De quanto demorou, quanto custou e tudo mais. Já está integrado isso no sistema também? Ou vocês usam um externo, cada cliente usa o seu?

0

2441.675 - 2463.848 Felipe Blanes

Bom, tem duas coisas aí. Eu acho que, primeiro, do lado do cliente. Então, você é um cliente e você está usando o nosso produto. Então, toda a questão de observabilidade está disponível já no nosso produto. Então, o nosso produto está disponível na AWS. Então, se você for na AWS procurar Nova Act no seu console da AWS, você acha ele lá.

0

2463.848 - 2483.187 Felipe Blanes

E dentro desse console você tem todos os indicadores de observabilidade. Então você consegue ver quantas vezes você rodou cada workflow, o que falhou, o que não falhou, quanto tempo que demorou para rodar. Então todas essas métricas que você está buscando como um usuário, você consegue pegar lá.

0

2483.187 - 2504.416 Felipe Blanes

Não como um usuário, como o administrador daquele workflow, você consegue pegar tudo lá. Do nosso lado, a Amazon e a AWS levam muito a sério essa questão de dado. Então, como você deve imaginar, eu não tenho acesso a absolutamente nenhum dado dos clientes. Então, a gente não consegue monitorar

0

2504.416 - 2527.231 Felipe Blanes

Se os workflows dos clientes estão sendo bem-sucedidos ou não, o que a gente consegue fazer é, primeiro, tentar criar essas gems que eu falei, tentando refletir o melhor possível casos de uso reais. E a gente também tem o... a gente roda nosso próprio evaluation, né? A gente roda os nossos testes antes de fazer o release de qualquer modelo.

2527.231 - 2546.688 Felipe Blanes

E quando a gente roda esses testes, a gente tenta medir para saber qual é a performance disso, está melhorando, está piorando? Então, é tudo tentando refletir o melhor possível os dados do cliente, sendo que a gente não tem acesso aos dados dos clientes.

2546.688 - 2571.393 Felipe Blanes

Uma coisa que eu faço do meu lado, como eu tenho um relacionamento com muitos clientes, alguns dos meus clientes, eles estão abertos de abrir mais sobre o que eles estão fazendo e me dar alguns dados. Falar, pô, Felipe, olha, estou rodando esse prompt aqui e esse prompt não está funcionando muito bem. Então, tenta usar esse prompt, parte do seu IVAL, né?

2571.393 - 2595.71 Felipe Blanes

Então, tem alguns clientes que eles fazem isso comigo, mas não é uma coisa que a gente faz em escala porque a gente não tem acesso aos dados. E falando em 2026, uma última pergunta minha aqui, o que a gente pode esperar desse ano ainda de vocês? Bom, do que você puder falar, obviamente, né? Mas o que dá para esperar? Cara, essa é uma ótima pergunta. Acho que as principais coisas que a gente quer fazer...

2595.71 - 2620.195 Felipe Blanes

e eu acho que eu quero fazer também, pessoalmente, são duas áreas. Melhorar o nosso produto do ponto de vista de confiabilidade. Então, acho que você deve esperar alguns releases novos do nosso modelo, algumas funcionalidades nossas do nosso produto, focado em melhorar a performance dele. E a outra coisa também é focar em...

Comments

There are no comments yet.

Please log in to write the first comment.