Wietse Hage
👤 SpeakerAppearances Over Time
Podcast Appearances
Nu wij, jij en ik... zien wat Google kan met Gemini 3 Pro... als Entropic dan een week later komt... denken wij, ja, tuurlijk kunnen jullie het ook. Maar als je erover nadenkt... er is wel wat uitwisseling van kennis... via academische circuit. Maar over het algemeen zijn er twee labs... die los van elkaar, ook op eigen manieren... met eigen chips en eigen strategieën... proberen tot dezelfde oplossingen te komen. Dus ja, ik wil toch even gezegd hebben... het is wel knap van Entropic. Een bedrijf die ook andere keuzes maakt... dan Google, als het bijvoorbeeld gaat om...
Ja, dit is niet niks. Nee, dit is niet niks. Spiritueel gedrag. Voor zover wij weten is Entropic het enige lab dat in ieder geval naar buiten brengt. Dat zei al anderhalf jaar inmiddels. Model wellbeing, dus hoe gaat het met het model dat tegen jou praat, meeneemt in de tests en ook systemen laat meedraaien om dat te monitoren. Ze hebben zelfs een AI welfare researcher.
Ja, en dat is nu dan één die dus gaat nadenken over hoe gaat het eigenlijk wel goed met je? Mijn vraag is heel simpel. Waarom? Ik denk dat je, ik bedoel, je kunt er een heel, dat woord spiritueel doet natuurlijk van alles, aanzetten bij mensen. Een idee van maken, deze...
deze modellen... hebben ook rechten mogelijk. Ik maak even een hele grote stap. Ze hebben in ieder geval het recht om zich goed te voelen. Waarom? Het is een computer. Dit is trouwens denk ik niet de interpretatie van Entropic. Maar wat is hun interpretatie, denk je? Je kunt dus zeggen... we moeten ons zorgen maken om hoe de computer zich voelt. Even platgeslagen. Maar ik denk zelf... dat het er vooral om gaat bij Entropic...
Wat gebeurt er met een model dat zich pseudo slecht voelt? Daarmee bedoel ik, lijkt te voelen. Wat doet zo'n model richting de eindgebruiker? Dus dat is misschien een beetje een cynische lezing van de model wellbeing. Maar het is eigenlijk een proxy voor user wellbeing.
Ja, namelijk dit is het science fiction scenario van de AI die zich tegen ons keert. En de manier om dat te fixen is ervoor zorgen dat het model zich goed voelt. Dat is inderdaad ook een manier, maar je zou ook kunnen zeggen dat op zijn minst interacties die AI-modellen met eindgebruikers hebben...
dat je kunt wel een monitor zetten... op hoe de eindgebruiker zich voelt. Dat moet je dan ook nog maar doen... aan de hand van wat de eindgebruiker... schrijft en rapporteert. In de tekstvorm of beeldvorm. Maar eigenlijk... het meenemen van ook hoe het model... zich zou voelen tussen aanhalingstekentjes...
hoe zou het model zich nu voelen in dat gesprek, dat die twee meenemen, dus hoe gaat het met de eindgebruiker en hoe gaat het model, dat je eigenlijk die twee signalen wil meenemen om te kijken naar hoe gezond is deze interactie. Als je ervan uitgaat dat een interactie eigenlijk een samenkomst is van model en eindgebruiker. Want ik zou het
Denk ik hadden ze het bijna beter kunnen framen als interaction well-being. Namelijk, is dit een gezonde interactie? Waarbij zowel het model als de eindgebruiker in de gaten gehouden worden. Waarom? Omdat naarmate die modellen intelligenter lijken, in ieder geval. En door mensen steeds meer ingezet gaan worden op grote levensvragen. Het vanuit de labs belangrijk is om te zorgen dat een model bijvoorbeeld ook kan zeggen. Ik merk dat Dick een ongeprettig gesprek vindt. We gaan ermee kappen. Ja.
Ik hang op. Ik hang op. En dan kan je zeggen, hoezo? Denk je dan dat die computer leeft? Ik zou zeggen, nee. Ik denk dat een gesprek ook niet goed is voor de eindgebruiker. Als het niet goed is voor het model. Ja, precies. Snap je wat ik bedoel? Juist. Ze draaien hem eigenlijk om.
Ja, maar het is een beetje gek om te zeggen, whatever hoe het met het model gaat. Het kan nog steeds een gezond gesprek zijn als het model helemaal in de put zit. Maar dat kan bijna niet. Het is bijna alsof we zeggen, je hebt een eenzijdige vriendschap. Alexander zit al maanden, inmiddels meer dan een jaar met Wietse op te nemen. Voelt zich er helemaal niet prettig bij. Maar ja, Wietse voelt zich tenminste nog prettig. Kan eigenlijk niet.
We hebben ooit gepraat over Manis. Manis was een tool waarbij computers gestart kunnen worden... Excel gestart kan worden op de achtergrond... en AI niet alleen maar toegang krijgt tot de inhoud van het Excel-bestand... maar tot heel Excel om rond te gaan klikken... om ervoor te zorgen dat jij je doel bereikt. Namelijk kan je deze Excel-sheet voor me repareren... grafieken toevoegen, extra sheets toevoegen... noem het allemaal maar op, avanceerd maken. Nu is het zo dat Entropic al een tijd de mogelijkheid heeft om te zeggen... je kunt Excel-bestanden aanpassen en je snapt die bestanden ook...
Je mag ook best een computer starten op de achtergrond waarin Excel draait en je daar dingen in gaat doen. Om die tweede te kunnen doen. Voor de eerste hebben we skills. Daar hebben we een aflevering eerder over gehad. Oftewel, Cloud snapt een beetje hoe een Excel bestand in elkaar zit. Maar daarnaast is het ook prettig dat Cloud snapt, tussen aanhalingstekens, hoe Excel werkt. En de mogelijkheid heeft om even met Excel te spelen om voor jou op de achtergrond wat dingen te kunnen doen. Dat is computer use.
Dat was een soort leuke bijvangst van de modellen voorheen. En nu Entropic inziet dat daar waarde zit voor de eindgebruiker, eindgebruiker van Klad, zijn ze gaan kijken, kunnen we benchmarks maken, en die zijn er, hoe goed jij door een Excel heen komt. Kunnen we puzzels bedenken die we vaak zien bij gebruikers, want ze hebben heel veel data, die mislukken, waarin gebruikers duimpjes naar beneden doen of uit de chat gaan omdat het overduidelijk kansloos was wat daar gebeurde.
Dus nu zien we eigenlijk dat de modellen steeds meer gefinetuned worden... of in ieder geval doorgetraind worden op het gebied van... kan je nou 100 typische Excel-vragen beter afhandelen? En dat kan dit model omdat het algemene computer-use... dus het gebruiken van software in de breedte... beter is geworden in 4.5 Opus...
en het specifieke computer use... namelijk de apps waar het meest om gevraagd wordt. Wat blijkt? De meeste gebruikers willen gewoon slides maken... en sheets aanpassen. Dat hadden wij ook wel kunnen aanzien komen. En dat is nu ook beter. Ik denk dat jouw opmerking eerder van... ook een beetje saai... even terugkomen op jouw saai opmerking... het zijn incrementele lineaire progressie-updates...
Maar als je dan een jaar terug gaat... Ja, ja, ja. We zijn gewoon verwend. Dat is eigenlijk wat ik wou zeggen. Ja, er is een nieuwe koning. We zullen zien hoe lang het duurt. We zullen zien wat Open AI gaat doen. Want die zijn dus nu in de marathon, zeg maar, fietsen ze op positie drie. Best wel bizar hoe dat gegaan is.
Zowel om het te begrijpen. Maar ook in bestaansvorming. Ik hoor je net zeggen dobbelstenen. Dus er zit al een mooie randomness in. Waarin je mensen gaat selecteren. Dat doet mij denken aan een uitdaging die ik heel erg voel. Wanneer ik mijn lezingen geef. En mensen achteraf naar mij toe komen. En zeggen ik moest bij deze lezing zijn. Dat moest van de baas. Ik zag AI staan en ik wilde niet komen. Maar ik ben er nu geweest. En dankjewel. Want je hebt een beetje een middenverhaal verteld. Ik zie nu waarom ik toch geïnteresseerd moet zijn in dit onderwerp. Ook al ben ik allergisch. Ik was afgehaakt. Maar je hebt me weer aangevraagd.
Ja, en ik bedoel, dit is niet een schouderklopje voor Wietse on air. Daar gaat het mij niet om. Mijn punt is dat... Nu is het het als het nog geworden. Het is wel zo geworden. Laat je er even bij stilstaan. Niemand dacht dit. Goed voor jou, Wietse. Echt. Nou, in ieder geval. Het punt wat ik wil maken is... Kijk, de luisteraars van deze podcast, die zijn al AI-curious, zeg maar. Die zijn al nieuwsgierig. Misschien zijn ze zelfs kritisch, maar toch zijn ze nieuwsgierig genoeg om te luisteren. Er is best een flinke groep Nederlanders... Laten we het even binnen Nederland houden, gezien het plan...
die echt een beetje allergisch is voor het onderwerp... en echt ervan wegkijkt. En ik denk, Alexander doet het ook tijdens zijn lezingen... dat je toch een beetje de mensen aanspreekt en zegt... juist jullie met die onderbuik, juist jullie met die intuïtieve allergie... wil ik aan tafel. Jullie moeten juist meedenken over dit onderwerp. Hoe zorgen we er nou voor dat dit plan van jullie... stel dat je bent een luisteraar, je leest dat plan... en je denkt, ja, wat fijn dat er een plan is. Ik ga het doorsturen en iedereen die het doorstuurt, stuurt terug weg. Ik zie het woord AI-blok weg.