Wietse Hage
👤 SpeakerAppearances Over Time
Podcast Appearances
Ja, langer werken zonder af te dwalen. En ik denk dat een deel van die magic is wetenschap. Want er wordt publiek tussen onderzoekers tussen die labs gepubliceerd... over check hoe wij onze agents lang kunnen laten draaien. En een deel is secret sauce. Dit is een beetje abstract. Voor een programmeur is het heel praktisch dit. Want Gemini 3 programmeert ook weer beter. Wel interessant dat je dit zegt. Van alle benchmarks...
scoort Gemini het minst spectaculair op SWE, de software benchmark. Dus waar Entropic helemaal gekozen heeft om door te optimaliseren op software, heeft Google daar niet per se door geanalyseerd. Het is wel zo, maar daar gaan we het straks nog heel even over hebben, dat hun anti-gravity scaffold, dus dat is een soort cloud code van Google, een stuk software om Gemini heen, dat als je dat stuk software, dat hebben ze tegelijk uitgebracht met Gemini, dus ze hebben een
Een model uitgebracht en een laag om het model heen. Dat heet Anti-Gravity. En dat Anti-Gravity is een soort cursor, een soort windsurf. Het is concurrent eigenlijk voor die tools. En de cursor van Google, dus Anti-Gravity, in combinatie met Gemini, scoort wel heel goed op die software benchmarks.
Oké, dus wacht, er is een... Dus wat is anti-gravity? Het is misschien toch goed om even te... Ik moet het niet introduceren als ik het niet uitleg. Nu is het zo dat veel softwareontwikkelaars... werken bijvoorbeeld in Visual Studio Code. Dat is een IDE, daar staat je code in. Daar type je normaal...
Ja, we lachen erom. Ja, je typte je code. Toen mensen nog typten. En daar hebben mensen dan Copilot in. Dat is niet de Copilot die de meeste luisteraars kennen, maar de GitHub Copilot. En die doet mee in jouw softwareproces. Dus de WordPerfect voor ProgMirge. Daar zit ook een Copilot in. Copilot in WordPerfect. Fantastische metafoor. Ja.
Dat die combinatie van die Copilot en WordPerfect wordt ook als een pakketje geleverd door bijvoorbeeld partijen als Cursor of Windsurf. Dan installeer je WordPerfect, zit die Copilot er meteen in. Het is een prettige metafoor om op door te bouwen. Google heeft daarin nu gezegd, wij forken ook. Dat betekent dat je eigenlijk een kopietje maakt van WordPerfect, want dat is open source in dit geval. En we brengen een eigen ding uit. Er is nu een cursor vanuit Google en die heet Anti-Gravity. Een eigen programmeer.
Omgeving. Absoluut, ja. Alle tools, de hele riem met alle hamers en zagen eraan voor de ontwikkelaar. Die programma's nodig hebben. Ja, de toolkit. Wat is er speciaal aan anti-gravity? Twee dingen. Ten eerste is het specifiek gebouwd om te praten met Gemini. Dus Gemini weet van anti-gravity en anti-gravity weet van Gemini. Dat zijn de beste maatjes. Ja.
Dus het blijkt ook als je die combineert, dat duo, dat ze krachtiger zijn dan dat het model was. Dus dan scoren ze ineens ook beter op die benchmark. Maar de benchmark ging dan eenmaal over het naakte model. Het is vals spelen als je daar een app op bouwt op dat model. Mensen waren allemaal verbaasd, ontwikkelaars, van hoe kan Google nou niet geoptimaliseerd hebben op dat? Nee, je moet eigenlijk die combo gebruiken, de duo, en dan krijg je pas spectaculaire zaken.
Wat is er nog meer spectaculair in anti-gravity? Dit hadden we al wel in experimenten gezien, maar nog nooit zo diep geïntegreerd als Google het heeft gedaan. Stel, jij gaat een website maken waar je kan chatten met een karakter uit Harry Potter. In een soort Harry Potter chat. Dan typ jij in, ik wil een Harry Potter chat hebben. Dan gaat dat ding rondjes draaien. En op een gegeven moment zegt hij, nou klik hier maar. Dan kan je naar je Harry Potter website. Daar ga je dan heen en dan denk je, oh dat ding is gaaf.
Jij bekijkt hem als mens. Dit is de oude situatie. Jij bekijkt die Harry Potter chat als mens en zegt dan... ik vind hem eigenlijk niet zo mooi. Kun je nog wat leuke gezelligheid toevoegen? En die knop, ik kan hem amper aanklikken, man. Wat een klein knopje. Dat moest jij dan doen. Dus jij was de human in the loop die het visuele resultaat kreeg... van wat die chat had gemaakt, die AI. En dan moest je aan die AI gaan vertellen wat er niet aan klopte. Wat hebben ze in Anti-Gravity gedaan? Gemini kijkt mee in de browser.
Dit is wat ze dan noemen full circle agenda development. Oftewel het testen van de applicatie die gemaakt wordt. Zowel visueel als interactief. Doen alle knopjes het. Ja, en ziet het er een beetje prettig uit. Is nu ook toegevoegd aan de cirkel. Ja, ja. En dus kan je eigenlijk zeggen in jouw initiële prompt. Kan je een Harry Potter soundboard voor me maken. Dat er esthetisch prettig uitziet. En dat goed te gebruiken is door mensen die het minder makkelijk vinden. Om te tappen op hun iPad bijvoorbeeld. Ja.
En dan zie je dus ook in die thinking trace, oh, ik heb de knoppen wel klein zijn, want ik had de opdracht eigenlijk om ze groot, ik ga ze groter maken. Hé, ik zie dat ze groter worden. Dus het visueel resultaat. En dit werd al door andere ontwikkelaars, zoals het gaat, zelf aan elkaar geknoopt, die cirkel. Maar Google zegt nu eigenlijk, dit zit standaard in anti-gravity. Ja, waardoor de eerste versie wat je opgeleverd krijgt alweer beter is dan wat je standaard in lovable of zo krijgt.
Ja, en dat is ook een beetje in de trend van wat je nu bijvoorbeeld, even terugkomend op de pelikaan. Een van de dingen die mensen met die pelikaan op die fiets gingen doen, is tegen AI-modellen zeggen, hier, kijk nou eens naar die pelikaan man. Er is een screenshot van de pelikaan erin. En als je nu ziet wat jij gemaakt hebt, wat je dus niet wist.
En dit is eigenlijk iets wat we in eerste instantie voor het eerst te zien kregen in OpenAI's Deep Research Agent. Die heette toen nog geen agent, maar gewoon Deep Research Mode. Oftewel, ga maar zelf een beetje dit internet op, op zoek naar bronnen en maak een mooie synthese. Desk Research Agent was het eigenlijk. Ja, research voor je doen. En dat was de eerste agent en ik denk ook de makkelijkste agent, met aanhalingstekens, voor OpenAI om te bouwen. Gewoon een beetje research doen.
Toen had je aan de andere kant van het spectrum de computer use agents. Oftewel, ga maar een beetje rondklikken op mijn computer. Dat is tot nu toe allemaal een beetje testen, beta en loopt vaak een beetje in de soep. We hebben nu eigenlijk een tussenvorm dat die bedrijven aan het zeggen zijn, wacht even.
Kunnen we niet een soort specialised agents maken... die we standaard meeleveren in onze tooling? Bijvoorbeeld een Gmail agent. Dus die is goed op de hoogte van hoe Gmail werkt... en hoe je Gmail aanstuurt. Dat weet Google goed, want het is vanuit Google natuurlijk. En dan zeggen, oké, wij durven eigenlijk... we gaan niet dat ding laten rondklikken in jouw Gmail. Dat is een beetje te grof op Pixel Data. We laten hem met Gmail praten... en we geven hem een goede omschrijving van Gmail. En dan kan die eigenlijk best wel gave taken oplossen. En je zou kunnen zeggen dat wat nu in...
de Google Maps app met Gemini in Google Maps... en Gemini Home, dat je nu steeds meer gaat zien... agentic scaffolds, zoals we dat zo mooi noemen... die gespecialiseerd zijn op specifieke taken en software. En dit kan best wel krachtig zijn. En dit is een beetje ook de droom van heel veel mensen. Kan je mijn mailbox even opruimen? Ja, natuurlijk. Naast de vaatwasser inruimen, denk ik... de verzoek nummer één wat we hebben aan de AI Overlords. Kun je mijn e-mail oplossen...
Ja, dat is je gevoel nog bij OpenAI is alleen heerschappij. Zoals dat toch nog wel eventjes voelde een paar maanden geleden. Openen de aflevering met OpenAI is opgezet uit angst voor Google. En dat die angst misschien een beetje waar bleek. Wat we nu zien gebeuren, in ieder geval wat ik denk dat er gebeurd is...
Ik pak even de metafoor van de zelfrijdende auto. Zelfrijdende auto's zijn vooralsnog bestaande auto's van Jaguar. Dus Google, Waymo koopt een auto bij Jaguar. En daar plakken ze dan allerlei AI op. Dus er worden een soort ski-box op het dak gezet. Aan de zijkant ductapen ze er nog even een paar LiDAR-sensors. En het stuur blijft er ook gewoon in zitten. Het is overduidelijk een oud-paradigma-auto, uitgebreid met nieuwe spulletjes. En AI is er tegenaan geplakt, als het ware.
Wat je bij andere zelfrijdende autobedrijven ziet, en Google zal dat zelf met Waymo ook gaan doen, is dat het een soort driving pods worden. Een soort kleine busjes waar je tegenover elkaar zit, waar geen stuur meer in zit, waar de voor- en de achterkant hetzelfde zijn. Noem het allemaal maar op, omdat je eigenlijk zegt, als we een auto opnieuw zouden ontwerpen, wetende wat we met AI kunnen, dan zit daar op zijn minst geen stuur meer in.