Alexander Klöpping
👤 SpeakerAppearances Over Time
Podcast Appearances
Het is de eerste keer dat er net zoveel hype is over een Gemini-release als over Chachapati of Claude. En het internet staat vol indrukwekkende demo's. We zagen bijvoorbeeld hoe een programmeur in één prompt een complete 3D-LEGO-editor bouwde, waarmee je blokjes heen en weer kan slepen.
Is de chief AI scientist van DeepMind. Die aan Gemini vroeg. Bouw een beautifully simple game. That plays itself. En hij deed dat gewoon. Je hoeft Twitter maar door te scrollen op dit moment. En het is één lange brei aan mensen. Die dat ding allemaal boeiende dingen laten programmeren. Wat maakt tot nu toe het meeste indruk op jou? Van wat mensen ermee gemaakt hebben?
We gaan het dadelijk hebben over de benchmarks en ook over hoe Google dit gedaan heeft. Maar toch nog even bij wat mensen ermee kunnen. Het model is beter in schrijven geworden, zie ik de hele tijd terugkomen. Wat heb jij daarvan gezien? De teksten zijn prettiger om te lezen en voelen professioneler. Het is wel zo dat in de algemene zin Gemini een vrij saai model is. Saai?
En eigenlijk is die routing, waar we het met GPT 5.1 ook over hadden, in Gemini ook meegebakken. Je hebt nu een soort van bepaald journalistiek genre als het gaat over AI-artikelen. Dat zijn een soort vibe-checks. Dat zijn dan bekende mensen die wat weten over AI en die dan het gaan gebruiken en dan laten weten hoe het voelt. Wat grappig, grappig.
Ethan Mollick, die doet altijd dit soort grappige vibechecks. En hij had een screenshot van een tweet van zichzelf uit 2022. Waarin in die tweet schreef hij iets van... Ik heb het GPT-3 nu voor het eerst geprobeerd. En het is grappig, want het kan een gedichtje schrijven. Het was echt blessed from the past. Het kan een gedichtje schrijven, het kan een tekst samenvatten.
En hij kan zelfs uitleggen hoe je... En dan had hij een vergelijking of een heel raar idee voor een spelletje. Dus dat is een bedacht spelletje. Een beetje zoals een pelikaan op een fiets. Gewoon zo'n absurd iets. Idee voor een raar spelletje. En dat had hij uitgeschreven. Dat screenshot had hij gevoerd aan Gemini 3. Dus het oorspronkelijke screenshot met die tekst daarin. En de datum daarin, et cetera.
En toen, als het prompt daarbij was...
Iets van we zijn best ver gekomen sinds deze tijd. Doe iets om te laten zien hoeveel verder je gekomen bent. En dat ding praat daar op een heel leuke manier op terug. Die zegt dan iets als ja, dit was wel een gekke tijd in AI. Want ja, ik kon op dat moment echt alleen maar teksten schrijven. Inderdaad, ik kon wat zinnen achter elkaar construeren.
In feite kan ik nu dat spelletje wat ik daar alleen nog maar kan beschrijven... kan ik nu maken. Dat ga ik nu voor je doen. En dan vervolgens dat ding even aan het pruttelen. En maakt hij oprecht een mooie game die werkt. Die precies is wat Ethan Mollick in 2022 liet construeren. In tekst door dat ding. Waarmee hij natuurlijk wil zeggen...
We hebben nu de neiging om te kijken naar de pelikaan zit iets beter op de fiets. Dit is natuurlijk een metafoor voor hoe wij AI gebruiken in ons werk en we hebben de neiging om nu met een loop te kijken naar de veranderingen per maand.
En hij zegt, het feit dat dit ding nu dit maakt... deze volledig werkende game... op basis van deze screenshot van deze tweet... zegt iets over de... Ja, het is ook een beetje de moving goalposts. Dus dat we iedere keer eigenlijk de lat schuiven... en kijken vanuit het nu. Terwijl, als je nou terugkijkt wat het in 2022 kon...
gedichtjes schrijven... hebben we zeker niet stilgestaan. Voor de nerds onder ons... laten we het even over de benchmarks hebben. Gemini 3 Pro haalt 37,5%... op Humanity's Last Exam. Dat is een test die bedoeld is...
bedoeld was om jarenlang uitduigend te blijven. Een test die mensen goed kunnen maken, maar die voor robots heel lastig was. Nou, we zijn nu alweer op 37,5, dus dat kunnen we weer een nieuw ding gaan maken. Twee keer zo snel ongeveer dan dat de makers hadden geanticipeerd. Want voor de duidelijkheid, het hele Humanities Last Exam is opgebouwd uit vragen die gekocht zijn, namelijk...
Het is een ander ding waar Gemini 3 anders in is dan andere modellen. We zitten in een tijdperk, denk ik wel eens, wat je het beste kan beschrijven als een soort van command line interface tijdperk. Het MS-DOS tijdperk van AI modellen. Wij kijken naar een knipperende cursor op een wit scherm. We moeten zelf maar gokken wat dat ding kan doen.
Gemini 3 neemt daar een stap in, want die bouwt on-the-fly interactieve interfaces op basis van wat je vraagt. Dus het model maakt een soort van werkende mini-apps terwijl je kijkt. Als je bijvoorbeeld een handgeschreven recept van je oma uploadt in het Chinees, dan kan Gemini 3 dat voor je ontcijferen, vertalen en kan er dan een vormgegeven ding van maken.
Ja, het is een soort van grappige tussenfase waarin we nu dus nog steeds normale dingen kunnen vragen en gewend zijn dat we dan tekst of hooguit een tabel terugkrijgen als we een taalmodel vragen om ons te helpen met iets. En dat we nu met Gemini een soort van tussenstap hebben voordat het een echte volwaardige app is, dat je in ieder geval een interface krijgt om informatie makkelijker tot je te nemen.
dat je nu begint te zien dat 18 modellen steeds meer rijkere resultaten kunnen geven. Dus niet terugpraten in stukjes tekst, maar terugpraten in stukjes interface. Ja, dus dat als je dingen vraagt over hypotheekinfo bijvoorbeeld, dat die dan gelijk een soort van interactieve calculator erbij maakt, omdat dat nou een betere manier is om iets uit te leggen dan een voorbeeld. Met een paar sliders erin. Precies, dat dat beter is dan een voorbeeldsom in tekst te laten zien.
Het is eigenlijk wat ik iedere week hier met allerlei vage metaforen probeer te doen. Ja, precies dat, maar dan visueel. Visuele metaforen. Dus wie is er ingetraind? Ik las ook, film een tenniswedstrijd... en dan analyseert het je techniek en verwijst die verbeterpunten aan. Ja, dit heeft ook weer mee te maken dat...
Ja, dat is echt flink. Je zei net, het is eigenlijk een beetje gissen naar wat ze nou precies gedaan hebben. Want dat is opnieuw gebakken from the ground up. En ze zeggen wel wat dingen in die modelcard over hoe dit nou zo is gekomen. Maar veel is ook geheim. Maar we weten dat het model...
tientallen zoekopdrachten achter elkaar doet... en dan resultaten combineert uit verschillende bronnen... en zo analyses maakt zonder de draad kwijt te raken. En waar eerdere modellen dus verdwenen in die langere redeneringen... kan Gemini 3 focus houden. Heb je een idee hoe het kan dat dit is gelukt? Dat langer focus houden? Of blijft dat dan onderdeel van de secret sauce? Goeie vraag. Ik denk dat...