Lucas Perraudin
đ¤ SpeakerAppearances Over Time
Podcast Appearances
Donc, en fait, pour faire le mĂŞme service, ils ont besoin de dĂŠpenser trois fois plus d'argent.
Donc leur taux de burn rate, leur taux de consommation de l'argent qu'on leur donne, il augmente pour faire la mĂŞme chose.
Oui, mais leurs components de coste, ils montent aussi.
Il y a un moment, on se parle de telle montĂŠe des coĂťts.
Oui, mais c'est diffĂŠrent.
Ăa, c'est un coĂťt stratĂŠgique.
Donc, juste tout ça pour dire qu'aujourd'hui, ils brÝlent 2 milliards par mois.
ou 3 milliards par mois, pour faire la mĂŞme chose avec le mĂŞme taux de compute ?
Pas forcĂŠment.
En fait, le problème, si on veut rentrer dans les dÊtails, c'est que pour faire du contexte, on fait des matrices et à chaque fois, c'est une fonction carrÊ.
En fait, plus je mets d'informations et le besoin de mĂŠmoire que j'ai, il augmente au carrĂŠ.
Donc, tu as Google qui, d'un côtÊ, essaie de faire de la compression là -dedans et tu as tous les autres qui achètent de la mÊmoire.
Mais le mur, c'est ce qu'on appelle le mur des GPU, il est inĂŠluctable.
En fait, dans l'ĂŠlan qu'on a de consommation d'IA aujourd'hui,
Pour faire la même chose, ça va leur coÝter trois fois plus cher.
Le coĂťt du changement pour l'utilisateur est relativement faible.
Pour ĂŠviter l'inflation des coĂťts, ils ont tuĂŠ Sora qui consommait beaucoup.
Ils ont dĂť vraiment faire des choix, des prioritisations qui font mal.
Ils ont dĂť faire.
Il y a Cohen ?