Fabrício Carraro
👤 SpeakerVoice Profile Active
This person's voice can be automatically recognized across podcast episodes using AI voice matching.
Appearances Over Time
Podcast Appearances
T6, qual é a lógica do T6? Ele é um modelo que foi treinado para primeiras interações. Eu não conheço outro modelo no mundo que tenha sido treinado para esse caso tão específico. Foi muito específico. Por quê? Nós percebemos que a maior parte das pessoas tem uma certa impaciência com a IA dependendo da primeira resposta.
Então a gente notou que além da impaciência na primeira resposta, a gente notou que a coisa mais comum da pessoa impaciente com a resposta é a qualidade do prompt. A pessoa faz um prompt realmente muito, muito, muito, muito fraquinho e exige que a IA seja mágica na resposta. Então o que a gente fez no teste 6? A gente fez uma arquitetura onde aqui no fim eu ainda tenho o roteamento, ainda vou sempre escolher a melhor IA de acordo com a pergunta.
Mas, quando o cara manda a pergunta, eu tenho um modelo, que foi um projeto de fine-tuning mesmo, otimizado, para ler o que o usuário manda, olhar para o outro modelo e falar, não, calma, ele não quis dizer isso aqui não, essa pontuação estava errada. Porque ele quis dizer, e aí esse modelo do meio faz a anatomia do prompt.
E aí o resultado é bizarro, é muito bom. Mas para primeiras interações, porque na continuidade acaba sendo uma dor de cabeça. Vou dar um caso que o nosso modelo T6, ele não performa bem. Você manda um texto e fala, faz um resumo desse texto. Já deu problema.
Porque o primeiro modelo, ele vai tentar resumir o texto. Ele não vai passar o texto inteiro no prompt pro outro, entendeu? Então ele foi um modelo treinado pra esse tipo de tarefa específica, né? Pra tentar ajudar ao máximo em situações muito simples. E ele realmente é muito útil.
Então eu fico alternando entre esses dois. Porque como aqui no fundo eu tô sempre usando um modelo que é top pra performance dali, eu fico assim, se é uma coisa do dia a dia, alto. Se é um projeto maior, que eu ainda não parei pra fazer, tô com preguiça de fazer anatomia de pronto, só jogo ele faz pra mim, entendeu?
Mas normalmente a gente vê isso, como na TAS, depende de como a plataforma está sendo estruturada, tá? Na TAS, eu não tenho nenhum tipo da minha parte de tecnologia sensível à injeção de prompt, né? Está tudo numa camada anterior. Então, o que eu tenho de guardrail ali para o usuário, eu já tenho todos os contratos assinados, então só entra numa plataforma...
modelos que garantem que não vai ter treinamento e modelos que obviamente vão ter a base de segurança de ponta, como a gente imagina, certificados e coisas do tipo. Ok. Então, quando eu penso em guardrails, eu penso em guardrails principalmente performáticos para o meu usuário, porque quando ele cria um agente,
é dele, é privado. Quando ele quer compartilhar, ele decide dentro da task, ele vai compartilhar ali, por exemplo, dentro do time dele ou dentro do workspace dele. Então, como já tem bastante segurança na própria estrutura da ferramenta, e no caso corporativo, a gente consegue isolar cada setor tem um workspace diferente,
E é claro, a gente tem até nível de permissionamento para, sei lá, o funcionário só pode usar IA de texto. É curioso, mas isso foi um pedido muito grande das empresas que trabalham com a gente para... Acabava sempre uma galera, às vezes sem noção, que teve um cara que gastou 2 mil dólares numa empresa gerando foto de vampiro de cueca. É.
O sujeito entrou na conta corporativa e fez 2 mil dólares de gasto numa noite de vampiro de cueca. Aí a empresa precisava de guard rails mesmo, falou, cara, não, só libera IA para texto para o time, ponto final, e a gente foi trabalhar em cima disso. Então os guard rails normalmente que a gente constrói são para a própria orquestração agêntica. Então, por exemplo, o cara pede uma IA de vision e a IA selecionada não tem vision.
ele pede uma IA por exemplo para vou dar um exemplo para um function calling precisa fazer uma busca e a IA não tem function calling então a gente tem que fazer todo o guardrails de orquestração multiagente que é inclusive de context length né que é problemático às vezes o cara tá lá na frente já tem uma conversa enorme troca para o modelo que tem 32k de
de context length, então tem uma série de coisas que a gente tem que fazer, né, e aí em relação a segurança de conteúdo mais sensível mesmo, aí sim, aí tem que construir bons guardrails, vou dar um exemplo, geração de conteúdo adulto, esse tipo de coisa, tentativa de injeção de prompt, aí a parte de segurança em si, aí já está desde o início da plataforma, é aquela meio que obrigação, vamos falar assim, né.
o vampiro de cueca foi ótimo né cara, que loucura ai meu Deus, mas vamos lá engraçado foi a gente auditando isso gente, eu não acredito que o cara vai gastar tanto dinheiro só pra isso, porque se o cara tivesse pelo menos querendo fazer uma história em quadrinho um vídeo
É só foto, não tem como entender. Acho que primeiro esse caso da reserva foi interessantíssimo, porque o caso da reserva vem antes do Dano Barana Pro, vem antes da capacidade do modelo editar imagens com alta qualidade. Então, para a gente executar muito bem o projeto da reserva, foi necessário que a empresa transformasse o seu estúdio. Então, por quê? Porque a primeira parte é, não podemos permitir que a IA altere a roupa da reserva.
Então, para não alterar a roupa, precisamos trabalhar com máscara e precisamos de um modelo que respeite muito bem máscara. Logo, GPTs, modelo do tipo, não serve. Um modelo que respeita mesmo. É absurdamente quadrado em relação a isso. Cara, quando a gente foi gerar a máscara,
Pequenas variações de luminosidade faziam com que uma máscara, um segment anything, qualquer girador de máscaras do tipo, não performasse tão bem. Qual foi a solução? Não alterar a IA, não alterar a tecnologia, mas mudar o ambiente. Trabalhamos melhor a iluminação do estúdio e transformamos todos os manequins em bonecos filhos do Shrek. Todo mundo pintado de verde. Sabe aquele colão de cameraman? Verde.
A gente vestiu todos os manequins da reserva de colante de câmera V, de câmera Man, e funcionou perfeitamente. Aí, todo o estúdio preparado para um photoshoot em Conha. Isso foi sensacional. Sensacional. Realmente, a galera lá vestiu o chapéu de queremos transformar um business com Conha. Funcionou super bem, sabe? Tem vários outros casos também que eu acho que foram...
fantásticos assim, em termos de como a galera foi meio que criativa na implementação. Um dos casos, esse eu só não posso abrir o nome da empresa, é uma universidade, eles têm a visão de que os professores serão os donos dos agentes e não mais os professores. Na visão deles, não cabe mais o professor dar aula do jeito que dá atualmente. Então o que aconteceu?
Os professores viraram gestores dos agentes, então é como se fosse assim, a camada técnica faz os agentes, o pessoal organiza, o professor vai, obviamente, usar um agente à exaustão,