Wietse Hage
đ€ SpeakerAppearances Over Time
Podcast Appearances
Want wat we eigenlijk zeggen is, wij zitten vast in de tijd als mens. Terwijl die modellen door twee keer zoveel computerkracht te geven, kunnen ze twee keer zo snel werken. Dus meten hoe lang een model met een taak bezig is, heeft geen zin. Want dan zeg je hier, Codex 5 kan zeven uur werken. En dan volgende week drieënhalf uur. En de week daarna de helft daarvan. Dus we moeten alles terugbrengen naar real human time de hele tijd. Ja.
Ja, niet na zeven uur gaf hij het op, maar hij heeft het wel zeven uur geprobeerd. En het is gelukt. Meer taken die tot zeven uur duren, zijn geslaagd. Zo zou je hem kunnen zeggen. Omdat het best wel zo is dat taken die...
Mogelijk wel gehaald zouden kunnen worden. Dit model niet gehaald worden. Omdat het model niet meer doorgaat. Dat klinkt even heel suf wat ik nu zeg. Maar je kan natuurlijk zeggen. Laat dat model gewoon langer doorgaan dan. Boeien. Laat hem gewoon dagenlang denken.
Die hele gedachtetrand, dat noemen we wel agentic. Ja. En dat kan je tot zeven uur achter elkaar doen. Ja, en hoe langer ze dat kunnen doen, hoe dichterbij allerlei andere menselijk werk komt. Omdat vaak, kijk, het is allemaal leuk en aardig, maar als je deze modellen niet autonoom kan laten draaien zonder dat jij constant ze in de gaten moet houden, dan zijn wij alsnog de blokker. Ja.
Als wij heel de tijd het handje vast moeten houden van die modellen... dan zit je nog steeds vast aan de menselijke tijd en attentie, zeg maar. Dus het nieuws, en daar wilde ik hem toch even benoemen... van, ik vind twee dingen interessant. Dat OpenAI ervoor kiest om een model te forken richting een codingmodel. Boeiend. Waarom doen andere partijen dat? Nog niet. En dat inmiddels toch wel, cynisch zou je kunnen zeggen...
Dit is de benchmark waar we nu nog aan vasthouden... dat op veel andere benchmarks... weinig grote stappen gemaakt worden de laatste zes maanden. Maar...
Dan bedoel ik dus, hoe lang kan in een loop, want dat is in essentie wat een agent is, een model in een loop, itererend zichzelf in leven houden en iets oplossen, dat dat maar blijft stijgen nog steeds. En ik wil dan toch even gezegd hebben, in AI 2027, die inmiddels volgens wat dingen die ik las, opgeschoven is naar AI 2029. Ja, dit is inderdaad, ja. Word ik toch even gezegd? Ja, laten we daar even op terugkomen, maar ja.
Die houden heel erg in de gaten hoe lang kan een model in een loop, oftewel een agent, zichzelf in leven houden en daadwerkelijk ook taken oplossen. Ja, want jij zegt het al eventjes, het moment waar AI 2027 naartoe werkt...
Nou ja, sowieso is er in de tekstmodaliteit, om het even chique te zeggen, namelijk dus de taalmodellen, zijn minder grote sprongen gemaakt. GPT-5 was niet zo'n grote sprong als GPT-4 destijds was. In de andere modaliteiten, video en stilstaand beeld, enorme sprongen. CEO3, Genie3, Nanobanana, noem het allemaal maar op. Hele best wel bizarre sprongen in AI gemaakt. Ja.
Omdat er... De ARK Challenge. We hebben het destijds gehad over de ARK AGI 1. Die werd toen gebeat. Toen vroeg jij me letterlijk in die aflevering... dan zijn we er nu toch. Nu die gebeat is. Toen kwam ARK 2 uit. Toen was een beetje de sfeer van...
Die blazen ze ook nog even weg, zeg maar, in twee, drie maanden. Nou, die hangt nu uit mijn hoofd op 27 procent. Dus die werd niet zo ineens weggeslaagd, blazen door O4-testing of O5-experimental secret. Er heerste een beetje een sfeertje op een gegeven moment. Daar zaten wij toen met z'n tweeën ook wat meer in van... Tjongejonge, die benchmarks blijven maar vallen. De sprongen blijven maar herhalen. Is het nu een soort van exponentieel aan het worden? Nou...
Inmiddels zijn die gevoelens een beetje getemperd. Ik moet wel zeggen, want ik krijg deze vragen ook vaak van mensen. Hoe zit je er nu bij? Valt het allemaal wel mee? Nou ja, luister, Gemini 2.5 Pro, VO3 en Genie 3, die zijn hartstikke nieuw hoor. Als in, zo lang is het ook allemaal niet geleden.
Kijk, ik zou zo zeggen, als we over een maand of zes of zo hier nog steeds zo zitten te kletsen over... Het is het Gemini 2.6, VO 3.1, dat daar een soort van... Marginale verbetering. Ja, dan zou ik zeggen, oké, nu moeten er wel wat voorspellingen en scenario's aangepast gaan worden. Die rekende op binnen twee tot drie jaar revolutie, want...
De reden waarom je het nu 2029 zegt... is omdat de ontwikkeling op het gebied van taalmodellen zelf... minder snel gaat dan jij aannam een half jaar geleden. Het is niet per se dat ik 2029 zeg. Het is dat degenen die 2027 riepen... nu naar 2029 toe aan het schuiven zijn. En die hebben een aantal...
Key markers, indicators moet ik zeggen, die ze in de gaten houden. Eén daarvan is hoe lang kan een model in een loop, ergo een agent, een taak uitvoeren. Waar we het net over hadden. Ja, daar viel GPT-5 een paar weken. Tegen. Ja, maar die viel wel mooi nog op de grafiek. Oké. Dus dat was op zich. Ja. Maar er zijn, zeg maar, er zijn...
Geen Nobelprijs winnende papers uitgekomen. Het soort van het spektakel wat je zou verwachten... aan signalen vanuit de verschillende labs en research... die zijn er nu niet. Het is redelijk rustig allemaal. Marginale, lineaire vooruitgang. Dat kan gewoon een soort lol zijn in de tijd. Maar het kan ook zo zijn dat we hier over zes maanden zitten en zeggen...
Het hele idee van de tekstmodaliteit en daarin de taalmodellen... zijn redelijk uitontwikkeld nu. Dit is het maximale wat we eruit hebben weten te persen. En alle volgende innovatie moet gaan komen uit scaffolding... samenwerken tussen modellen, modelensembles en allerlei andere trucage. Waarvan ik zou zeggen...
Als jij wat meer richting de groep neigt. Ja, taalmodellen zijn uitontwikkeld. We zitten al op 90% van wat ze kunnen. En die laatste 10% gaat ons nog vijf jaar kosten. En die gaan ons nooit brengen naar die...
Super of Artificial General Intelligence. Dus gelijk aan en boven menselijke technologie. Dan zou ik nog steeds zeggen. Oké, dan is eigenlijk de vraag. Moet er een hele nieuwe uitvinding daarnaast gedaan worden? Wat een beetje die François Collet zegt van de Arc Challenge. We moeten hele nieuwe wetenschap gaan uitvinden. En dat duurt niet een paar maanden. Daar zijn we wel weer jaren mee bezig. Dus we zijn op een soort...
maximum beland. Aan de andere kant... heb je, en dat is wel de groep mensen... waar ik wat meer naartoe neig... we kunnen nog heel veel om die taalmodellen... heen bouwen aan scaffolding. Waardoor het een soort bandje wordt... met allerlei functies. En het is het... Gemini gaat praten met Vio, die praat met Genie... en zo samen gaan we toch nog stappen maken. Maar toch... de vibe is een beetje... minder optimistisch, als ik het samenvat... dan dat het twee jaar geleden was...