Wietse Hage
👤 SpeakerAppearances Over Time
Podcast Appearances
Dat stop je er dan allemaal in. En dan ga je eigenlijk database vragen, feiten vragen stellen aan een model dat patronen herkent. Dus zie het als ieder orgaan in een menselijk lichaam heeft een verschillende functie.
En op het moment dat jij aan jouw motorcortex van jouw brein vragen gaat stellen... die bijvoorbeeld jouw visuele cortex eigenlijk hoort te beantwoorden... en het lukt jouw motorcortex, die eigenlijk met beweging bezig is de hele dag... toch om een visueel antwoord te geven... als neuroloog, als je ernaast staat, denk je...
wauw, dat dat deel van het brein zo knap is... dat hij zelfs een soort data terug kan geven... terwijl het helemaal geen database is. Dus wat ik met heel veel woorden probeer te zeggen... taalmodellen zijn voorspelmachines... die op basis van statistiek... eigenlijk een hele grote bubs met data... terug kunnen compressen als een soort zipvijl... in een bestand waarin ze in patronen dingen opslaan... en niet in lijstjes. Dus je hebt niet een lijstjesdatabase... maar een soort spinnenweb van gewichten en patronen.
dat het die modellen... die eigenlijk dus alleen maar... een spinnenweb van patronen hebben... lukt als jij vraagt... wie zijn de drie dochters van Willem-Alexander? Dan is de kans dat hij dat probeert uit te vinden... aan de hand van de historie... van Nederlandse meisjesnamen in het Koningshuis. Want zo doet hij het. Niet een database waar die drie namen staan. Nee.
Hij moet het als het ware soort intuïtief gaan gokken op basis van alle Nederlandse cultuur die langs dat ding is gegaan, die hij eigenlijk niet mocht opslaan, maar op een manier moest opslaan van probeer nou de gelijkenissen te zien tussen alle koningshuizen in Europa, zodat je een stukje data kan opslaan, waardoor je eigenlijk iets kan zeggen over de structuur van koningshuizen. Ja, hij doet eigenlijk een statistische voorspelling in plaats van dat hij feiten opdreunt.
Ja, het is alsof je een kind die nog nooit een muziekinstrument heeft gespeeld... heel veel pianomuziek laat horen. Maar zegt, je mag de bladmuziek niet mee naar huis nemen. En dan twee keer Mozart of zo. En daarna vraag je aan dat ding, speel eens Mozart na. En dan speelt hij een soort half-valse Mozart. Ik sta daarnaast te klappen met tranen in mijn ogen. Hoe kan dit spinnenweb half-valse Mozart spelen? En iemand anders staat ernaast. Haha, is dit nou superintelligens? Nou, ik zou je zeggen...
op het moment dat je die half laffe Mozart spelende spinnenwebben... gaat koppelen aan het oude paradigma van computeren... namelijk databases, namelijk MCP, toolcalling. Roep even de database op van het Koningshuis, de website. Scan die tabel en haal daar gewoon die drie namen uit. En dat kan die inmiddels.
Nou ja, in essentie wel. Omdat wat je uiteindelijk krijgt is... Kijk, wat ik nu al een aantal keer heb gezien, tijdens mijn lezing ook, dan leg ik uit. In eerste instantie heb je een soort stochastic parrot. Dus een kansberekening-papagaai die bluft allerlei data. Dat is wat de meeste gratis gebruikers van ChatGPT hebben ervaren. En ook nu nog met GPT-5, want die valt heel de tijd terug op mini. Wat zo'n kleine babyganaal-papagaai is eigenlijk. Nou, die is in essentie...
Goed in Sinterklaas gedichten schrijven. Maar snapt niet wat de volgorde van de provincies van Nederland is. Als die er al in staan. Want in mini staan waarschijnlijk alleen maar de landen van Europa. In patroon opgeslagen ongeveer. Kan die redelijk gokken. Dus jij denkt dan wat knap van dat kleine ding. Dat die nog een soort provincies uit weet te krijgen. De gebruiker die denkt gewoon. Terecht, dat is prima. Want Sam Altman zegt in interviews AGI. En jij krijgt de provincies niet eens uit GPTV. Dus ik snap hem. Ik ga toch een beetje proberen om uit te leggen. Want ik denk dat.
Wat denk ik voor mij zo belangrijk is, waarom ik me hier lichtelijk over opwind, waarom ik me getriggerd voel over... Het is een safe space. Ja, oké, ik kan het even vertellen. Want...
Als jij aan GPT-5 vraagt op je app, op je telefoon... Doe mij eens de twaalf provincies van Nederland in de juiste volgorde. En er komen er twaalf uit waarvan drie verzonnen in de verkeerde volgorde. En jij pakt erna een kop tegen, gaat in de tuin zitten, doet een diepe zucht en denkt... Nou, valt allemaal wel mee.
absoluut verkeerd gekarakteriseerd. Je hebt een soort... kalmte en zekerheid aan jezelf gegeven... over wat er de komende jaren gaat komen... die absoluut niet terecht is. Absoluut niet. Want wat je eigenlijk hebt gedaan... is gepraat met een bluffend taalmodel...
die blijkbaar op dat moment geen toolcalling mocht doen. Dus die mocht het internet niet op. Nou, dan krijg je dus al hele rare lijstjes. Mocht hij het internet wel op, trekt hij zo uit Wikipedia... die twaalf provincies. Dus dan heb je dat al opgelost. Als hij dan nog mag reasonen ook, agentic... dan kan hij nog zijn eigen werk bekijken. Denken, voelt dit als de twaalf provincies van Nederland? Nee, ik denk het niet. Ik ga even het internet op. Dus je moet reflectie hebben... plus de mogelijkheid om oude databases uit te zoeken. Als je die ensembles laat werken...
Dan komt daar waarschijnlijk een lijst van provincies uit... met een korte reflectie erop en een wedervraag aan jou met... wat probeer je eigenlijk te testen bij mij, vriend? Dit weet ik wel. En ik denk dat...
Als jij een taalmodel geïsoleerd van de oude klassieke databases... zoals het internet zelf en allerlei andere databanken... vragen gaat stellen wat eigenlijk feitelijk informatievragen zijn... die in databases staan. En dan zegt, als die dat niet kan, is die dom. Dan denk ik, nee, dan is die niet goed verbonden met de rest van de context.
En een beetje context geven op een slimme manier aan een papagaai is al opgelost. Doen we al. Want de vraag die ik niet kon beantwoorden was... waarom kan een taalmodel niet vertellen wat hij niet weet? Dat is een hele mooie, een van de allergrootste academische vraagstukken ook. Want bijvoorbeeld in het geval van GPT-5 is het aantal hallucinaties lager geworden. Dat is prettig, want daar eigenlijk is die...
Gelderland of Golderland of Galderland... is een hallucinatie-vraagstuk. Want ik weet het eigenlijk niet. Ik weet niet dat ik het niet weet. Ik doe wel iets wat lijkt op een provincie. En zo hallucineert hij dus... de stappen om Chachapiti op te zeggen.
Ja, en ik denk dat, kijk waarom die dat niet weet, is omdat het uiteindelijk een statistisch model is die geen grond heeft in de daadwerkelijke realiteit. Het is een kopie van de realiteit in informatie. En kijk, er zit wel een predictability score aan die gokjes. In dit geval alle tokens die eruit komen hebben een bepaalde score, maar je kunt ook op een metaniveau scoren.
Dus wat je kan doen is zeggen... als je niet zeker bent, ga het internet op. Maar dan is nog steeds de vraag... die als je niet zeker bent vraag... die moet je dan eigenlijk in 100% van de gevallen... goed kunnen beantwoorden. Wil jij een model krijgen die wel... de vragen van Raoul Heertjes kan beantwoorden? En ik denk wat mij...
Kijk, de vraag is, als jij een robot ziet omvallen, zeg maar, als iemand een steentje op de straat legt en een robot loopt en die valt in één keer daarna in het water of zo en iedereen gaat er omheen staan lachen en nou, moet je maar zien wanneer deze mijn baan vervangt, zeg maar. Dan is het wel belangrijk om te snappen hoe fundamenteel