Patrick Pérez
👤 SpeakerAppearances Over Time
Podcast Appearances
Et il n'a plus qu'à choisir.
Alors, si une des quatre réponses, il y en a quatre à l'écran pour des histoires d'ergonomie, si une des quatre est déjà lui convient, il n'a plus qu'à cliquer.
Et instantanément, il y a sa voix qui parle et qui...
qui met en voie la réponse.
S'il n'est pas complètement content, il veut préciser, réfléchir, il y a une autre partie de l'interface qui permet assez simplement de diriger avec un mot-clé qu'il n'a qu'à choisir dans une liste de mots-clés, etc.
Donc, ça prend un peu plus de temps.
Mais vraiment, la gageure ici, c'est que
ça soit en moyenne beaucoup plus rapide que de devoir taper lettre par lettre, même avec, de façon prédictive, avant de faire la stèse vocale.
Et ça change complètement le type de discussion accessible, en fait.
Il y en a certaines qui sont juste trop laborieuses ou trop coûteuses en énergie si on doit taper le texte intégralement.
La brique textuelle, c'est un modèle à LLM, un modèle de langage open source sur étagère, qui est de très bonne qualité, c'est important.
On sait ce que c'est ou pas ?
Là, dans la démo actuelle, mais ça pourrait être interchangeable, c'est Quenon.
Et les briques, nous, les briques de transcription et de synthèse, c'est vraiment un de nos savoir-faire, parce qu'il faut que ça soit robuste, de très bonne qualité, extrêmement rapide.
C'est vraiment une de nos fiertés.
Et puis, il y a tout l'assemblage, la conception de l'interface, qui est très importante, évidemment, pour que ça soit aussi facile à utiliser que possible, aussi quand les gestes commencent à devenir plus difficiles.
C'est un système avec plusieurs briques d'IA et de la glue entre les différentes briques.
Alors, elle est déjà disponible.
C'est vraiment de l'open source.
Alors, évidemment, c'est un peu technique à installer.