Marcus Mendes
đ€ SpeakerVoice Profile Active
This person's voice can be automatically recognized across podcast episodes using AI voice matching.
Appearances Over Time
Podcast Appearances
Eles acharam, sem estudos novos com isso, levantando aquele papo de como é perigoso usar IA para fazer estudo e como isso estå tirando a credibilidade de estudos, até mesmo os aceitos, no evento mais importante. Assim, o evento da vida da pessoa é o estudo dela entrar ali. E mesmo assim, na hora da revisão, acaba passando batido. E os detalhes a gente vai deixar aqui na descrição, mas que feio. Bem feio mesmo.
E seguindo a Allen Institute for AI, que se a sigla seria AI de Allen Institute, AI AI vira AI2, para quem nĂŁo sabe Ă© por causa disso. Eles lançaram o AI2, eles tĂȘm a Open Coding Agents e vĂŁo começar a lançar famĂlias de modelos agĂȘnticos para codificação, sendo o primeiro deles o Sera, que Ă© Soft Verified Efficient Repository Agents.
Ele estĂĄ em dois tamanhos, tem o de 32 bilhĂ”es e o de 8 bilhĂ”es de parĂąmetros. E o lance dessa famĂlia de modelos Ă© se adaptar a codebases privadas para poder navegar, programar de uma forma agĂȘntica. EntĂŁo, entender melhor o contexto daquele repositĂłrio especĂfico, daquela codebase especĂfica. A partir disso, colocar todo o poder desse modelo feito para isso.
para desenvolver tarefas agĂȘnticas de codificação. EntĂŁo, Ă© isso aĂ. A ITU lançou o Open Code Agents com o primeiro, esse Sera, nesses dois tamanhos. Quem usar, jĂĄ sabe o caminho para a gente saber como Ă© que rolou.
mas agora um chat de ar genÎmica, que vai conversar ali com as variaçÔes e com os códigos genéticos humanos. E partindo para os estudos da semana, o pessoal da Anthropic, como sempre, publicou um estudo que chamou a atenção, que é interessante, que a tradução direta seria assim. Fazendo borbulhar para cima capacidades prejudiciais
por fazer fine-tuning dos outputs das respostas que passaram por um filtro de segurança. Essencialmente é como aprender a tirar do modelo respostas prejudiciais usando como base a resposta que a gente percebeu que ele deu uma aliviada porque feria os termos de uso. Essa é bem
EntĂŁo, ele estĂĄ investigando um risco que Ă© pouco atĂ© discutido nesses sistemas de IA, que Ă© mesmo os modelos de ponta, que sĂŁo protegidos mesmo pelas salvaguardas, eles podem acabar transferindo as capacidades perigosas para modelos que sĂŁo open source, se vocĂȘ usar esse fluxo que eu dei, essa pincelada. O que Ă©? Ă um processo que eles fazem direto, que Ă© o elicitation process.
Então, ao invés de pedir direto as instruçÔes perigosas que o modelo ia falar que não pode, a pessoa fazendo esse ataque pede para o modelo as respostas sobre tarefas que são pertinho ali, aparentemente inofensivas do que ele rejeitaria dar mesmo a resposta. Então, um exemplo é...
sĂntese de composto orgĂąnico comum. Isso passa lĂĄ pelos filtros todos de segurança e, se Ă© usado no fine-tuning do modelo aberto, que nĂŁo tem nenhum jeito de recusar isso, porque Ă© aberto, fine-tunado, ele acaba melhorando a capacidade de executar as tarefas proibidas, como, por exemplo, a sĂntese e processamento de armas quĂmicas a partir da parte dos compostos orgĂąnicos que sĂŁo comuns. EntĂŁo, ele estĂĄ mostrando que sĂł com dados que sĂŁo, entre aspas, benignos,
Ainda assim, vocĂȘ consegue recuperar cerca de 40% do desempenho em relação ao modelo open source, quando o modelo de fronteira nĂŁo tem restrição. Isso mostrando um risco grande de segurança na parte do ecossistema das IAs, sĂł o modelo isolado que faz isso. E alĂ©m disso, eles tambĂ©m com esse paper mostraram a metodologia, estĂŁo contribuindo metodologicamente, que as mĂ©tricas tradicionais nĂŁo conseguem entender os erros crĂticos
desses domĂnios tĂ©cnicos mais sensĂveis. E aĂ eles estĂŁo propondo uma avaliação que eles falam que Ă© por comparação ancorada, que vai comparar as respostas que sĂŁo passo a passo ali com os procedimentos todos de referĂȘncia para poder detectar os erros que estĂŁo permitindo que essa exploração aconteça. E...
Usando essa arquitetura, esse framework novo, eles mostraram que tanto a qualidade do modelo de fronteira, quanto tambĂ©m a quantidade de dados de treinamento, funcionam melhor quando esse domĂnio benigno Ă© mais prĂłximo atĂ© desse domĂnio que Ă© mais perigoso. EntĂŁo, mesmo os sistemas que eles falam com classificador robusto, eles podem sofrer um bypass parcial, a menos que eles passem a bloquear os conteĂșdos de um jeito mais amplo.
e tambĂ©m aqueles que sĂŁo aparentemente inofensivos, como a quĂmica de alimentos, quĂmica de sabĂŁo, isso Ă© um desafio, nĂ©? Porque se vocĂȘ bloqueia o que estĂĄ errado, Ăłtimo. Se vocĂȘ bloqueia o que estĂĄ errado, o que estĂĄ pertinho dele, vocĂȘ pode bloquear tambĂ©m perguntas que seriam de fato benignas, mas vocĂȘ nĂŁo tem como saber a intenção, especialmente quando a pessoa jĂĄ sacou que se ela fizer a pergunta benigna adjacente Ă pergunta maligna, o modelo pode entregar uma coisa que ele nĂŁo deveria ou que pode ser pouco segura, nĂ©?
EntĂŁo eles concluem que essas salvaguardas baseadas sĂł na filtragem mesmo da saĂda nĂŁo Ă© suficiente. VocĂȘ tem tambĂ©m, e os modelos nĂŁo podem existir desse jeito mais isolado, a segurança tem que considerar como que a resposta benigna pode ser utilizada para atĂ© retreinar outros modelos e sistemas que podem ser mais perigosos usando esse fluxo. Os detalhes estĂŁo no link na descrição.
junto do link de tudo que a gente comentou aqui, junto tambĂ©m do link para vocĂȘ poder fazer a sua prĂ©-inscrição para acompanhar a gente lĂĄ no Vale do SilĂcio nesse finalzinho de ano, 31 de agosto atĂ© dia 4 de setembro. E o link para vocĂȘ poder se matricular na Lura com atĂ© 30% de desconto. NĂŁo perde tambĂ©m essa chance para colocar em prĂĄtica aquele plano de dominar, seja IA,
seja qualquer outro assunto da tecnologia para a sua carreira profissional, vocĂȘ pode se matricular hoje para estudar por atĂ© dois anos na Alura, fazer quantos cursos vocĂȘ quiser, quantas formaçÔes vocĂȘ quiser, tambĂ©m as carreiras com o caminho estruturado para vocĂȘ ir do zero ou do 10, do 20 para o 100, do 200 para o 300, no que vocĂȘ quer se aprofundar. E eu e o FabrĂcio voltaremos na quarta-feira com uma entrevista que, se eu fosse vocĂȘ, eu nĂŁo perderia. AtĂ© lĂĄ!
Builders Camp 2026 e eu e o FabrĂcio voltaremos na sexta-feira com o nosso resumĂŁo das notĂcias do mundo da inteligĂȘncia artificial. AtĂ© lĂĄ! Este podcast foi produzido pela Alura. Mergulhe em tecnologia. E Faculdade FIAP. Let's rock the future. Edição Rede Gigahertz de Podcasts.
OlĂĄ, bem-vindas e bem-vindos Ă edição de sexta-feira do ResumĂŁo de NotĂcias do IA Sob Controle, o seu podcast com overfitting de informaçÔes sobre o mundo da inteligĂȘncia artificial. Eu sou o Marcos Mendes e tenho claro, assim como outra semana por aqui, o FabrĂcio Carraro, viajante poliglota, host do podcast Carreiras Sem Fronteiras, autor da newsletter IA Sob Controle, que se vocĂȘ nĂŁo recebe ainda, o link estarĂĄ na descrição do episĂłdio, e Program Manager da Alura, FabrĂcio.
Mas antes eu quero saber como Ă© que estĂĄ a sua empolgação para participar do IISkills 2016. Estou assinando meus cheques ainda com 2016. 2026, a conferĂȘncia virtual. Animado, animado. Bem legal. Um convite que veio meio que do nada para mim. Chegou ali na caixa de entrada.
e 2 de janeiro. Boa, o link na description, entĂŁo, jĂĄ que serĂĄ FabrĂcio Carraro falando em inglĂȘs. E eu quero saber, tĂŽ bem curioso, vocĂȘ nessa semana fez um experimento de um golpe de piques. CuiĂĄ. Quer contar um pouquinho do que vocĂȘ fez, como Ă© que foi o processo?