Florian Barbaro
đ€ SpeakerAppearances Over Time
Podcast Appearances
Le but, c'est de crĂ©er des modĂšles qui soient les plus lĂ©gers possibles, mais qui ont les mĂȘmes capacitĂ©s que de gros, gros modĂšles et qui permettent justement d'ĂȘtre capables de dĂ©tecter si un texte, une image, un audio ou une vidĂ©o soient gĂ©nĂ©rĂ©s par l'intelligence artificielle.
Et par exemple, si on prend un texte généré par une intelligence artificielle, pour qu'il soit généré, le modÚle va maximiser certaines probabilités et donc ça va inclure une linéarité dans le texte généré.
En fait, ça va ĂȘtre des patterns comme ça qu'on va ĂȘtre capable de dĂ©tecter pour savoir si c'est humain ou plus probablement gĂ©nĂ©rĂ© par une intelligence artificielle.
Oui, le but, c'est qu'on a commencé à travailler.
On a été parmi les premiers à détecter ce type de technologie il y a maintenant plus de trois ans.
Et au moment oĂč, justement, en novembre 2022, GPT est sorti et en 2023, on a vraiment dĂ©veloppĂ© nos premiers modĂšles.
Et le but, en fait, c'est de prendre ce que j'ai pu apprendre durant mon doctorat.
pour dĂ©velopper des modĂšles qui soient lĂ©gers, basĂ©s sur des modĂšles mathĂ©matiques et qui puissent ĂȘtre robustes justement aux nouveaux modĂšles qui sortent sur le marchĂ© ?
Est-ce que ça marche, sincÚrement, aujourd'hui ?
En étant transparent, on a vraiment des bons résultats chez les clients.
Notamment, par exemple, on travaille avec un assureur, on arrive à avoir vraiment des bons taux de précision.
Mais c'est quoi les bons taux de précision ?
Donc là , par exemple, l'assureur en question, on est arrivé aux alentours de 93-95% de taux de détection.
C'est des taux qui sont vraiment bien.
Et aprÚs, il faut savoir aussi que, par exemple, la détection est trÚs difficile.
Et donc, en fait, il faut l'adapter au use case du client et surtout Ă sa chaĂźne d'information.
Parce que ce qu'on voit, c'est que, par exemple, quand on parle avec des assureurs,
ou avec des banques ou d'autres grandes entreprises.
Chaque entreprise va avoir son systÚme d'information avec son traitement des différents contenus.
Et donc, en adaptant aux diffĂ©rents types de traitement des contenus, on va ĂȘtre capable d'adapter les modĂšles pour avoir des meilleures prĂ©cisions.