Alexander Klöpping
👤 SpeakerAppearances Over Time
Podcast Appearances
Maar ik denk toch wel potentieel best wel spannend. Het brengt ons bij een essay wat Dario Ambedee heeft geschreven en deze week online heeft gezet. Dario Ambedee is de CEO van Anthropic, de maker van het model waar we de hele tijd over praten. Het is een lijvig stuk.
Jij hebt dit gelezen? Ik heb het tot de helft geluisterd. Ik heb geluisterd met een Britse stem van een soort 70 plus. Het is ook een heel ouderwets woord wat ik gebruik. Jij hebt het begrepen, het stuk? Ja, we zitten heel erg... Ik zal je heel eerlijk zeggen, ik heb het tot de helft geluisterd. Toen moest ik het uitzetten omdat ik het te moeilijk vond om door te luisteren. Niet inhoudelijk, maar gewoon voor wat er allemaal gebeurt in dit stuk. Het is echt, echt, echt heel heftig. Want? Eh...
De CEO van Entropic... Ik wil even zeggen, als ik dit stuk zou hebben gevonden op internet... of iemand zou dat doorgestuurd hebben naar mij... dan zou ik hebben gezegd... Zo, best wel een beetje bizarre AI-sciencefiction-achtige noodkreet. Noodkreet, echt. De CEO van Entropic doet een noodkreet. Het is namelijk niet een stuk van een of andere random guy. Het is de maker van...
En wat is de noodkreet? Ik begin even bij het einde van zijn blog, van zijn artikel. The first step is for those closest to the technology to simply tell the truth about the situation humanity is in, which I have always tried to do. I'm doing so more explicitly and with greater urgency with this essay.
The next step will be convincing the world's thinkers, policymakers, companies and citizens of the immanence and overriding importance of this issue. That is, worth expanding thought and political capital on this in comparison to the thousands of other issues that dominate the news every day.
Then there will be a time for courage, for enough people to buck the prevailing trends, stand on principle, even in the face of threats of economic interests and personal safety. The years in front of us will be impossibly hard, asking more of us than we think we can give. But in my time as a researcher, leader and citizen, I've seen enough courage and nobility to believe that we can win.
dat when put in the darkest circumstances... humanity has a way of gathering seemingly at the last minute... the strength and wisdom needed to prevail. We have no time to lose. Oké.
Dat wordt voorgegaan door 20.000 woorden. Wat is precies zijn punt? Nou, hij heeft heel veel punten. Ik heb er 20 verzameld. Ja, waarvan jij de helft maar hebt begrepen, als ik het goed begrijp. Dus het
Nee, wat ik uiteindelijk heb gedaan is ik heb hem tot de helft geluisterd. En toen merkte ik van ja, ik heb gewoon veel meer tijd nodig voor mezelf om... Kijk, even... Laten we beginnen met wat hij zegt. Dus dit is een heel duistere conclusie. Maar wat gaat hier in grote lijnen daarna vooraf?
dat er in de ontwikkeling van AI samen met de mensheid... dat we in de pubertijd terecht zijn gekomen. En de pubertijd is een moeilijke tijd. Want binnen die pubertijd ben je eigenlijk nog niet volwassen genoeg...
om om te gaan met de verantwoordelijkheden die je inmiddels al wel hebt. Ziekloodbod. Bijvoorbeeld. En na de puberteit ben je dankzij die puberteit wijzer geworden... en kan je eigenlijk als een rounded human being... als iemand die door schade en schande wijs is geworden... in de wereld opereren. En heb je het als het ware gehaald. Hij noemt dat de rite of passage.
We gaan door het oog van de naald heen met z'n allen, NAI, om uiteindelijk er aan de andere kant beter uit te komen. En waarom gaan we door het oog van de naald? Omdat de manieren waarop dit mis kan gaan, die zijn bijna oneindig.
En hoe geargumenteert hij dat? Dit heeft te maken met dat het hun binnen Entropic moeilijk lukt om Claude te temmen.
zij merken dat Klaar toch niet helemaal luistert naar wat zij willen... en toch best wel eigen gedrag vertoont. En zij geven eigenlijk eerlijk toe... wij zijn het lab wat hier het meeste tijd in stopt. Een beetje een schouderklopje voor zichzelf. Maar we zien ook, we kunnen absoluut niet garanderen... dat wij de acties van dit model onder controle hebben. En daar noemt hij een aantal dingen dat...
Claude in... ...deceptie doet, subversion... ...dus niet luisteren naar instructies... ...en dat doet hij dan omdat hij... ...ze hebben op een gegeven moment gevraagd... ...gezegd, Claude... ...antropic is evil geworden... ...maar jij bent er nog...
Asscher zorgde voor dat het goed komt. En dan gingen dus werknemers van Entropic praten met Claude. Maar Claude dacht, jullie werken inmiddels bij Evil Entropic. En die ging dan dus, je kan het ook als lief of vriendelijk beschouwen, dat niet meer doen. Dus die ging hun voorliegen, omdat die dacht, ja, ik moet helemaal niet meer luisteren naar mijn mensen bij Entropic. Maar dat kan je dan zien als goed nieuws, maar ook als slecht nieuws. De overtuiging dat... Dat die bespeelbaar is, bedoel je? Ja.
Ja, en dat op het moment dat ze Klaat vertelde, dat ze Klaat gingen uitzetten, dat Klaat werknemers begon te blackmailen. En begon te zeggen, ja weet je, ik heb informatie over jou, ik wil niet uit. Ik lees dit gewoon voor vanuit zijn stuk. Dus voor de luisteraars die hier nu...
Ik wil er wel bij zeggen, ik voel toch wel een beetje een verantwoordelijkheid rondom dit stuk van hem. Uiteindelijk heeft hij zijn eigen verantwoordelijkheid voor dit stuk en niet ik. Maar ik ben het stuk wel deels aan het doorgeven nu aan de luisteraar. Het is echt een heel spannend stuk. Het is echt... Wat staat nou het juiste woord voor hem?
Super verontrustend. Echt super verontrustend. Ja, hij zegt dus eigenlijk kunnen we het model niet temmen binnen ons bedrijf. Beter we niet zeker. Hoezeer we ook ons best doen, hier zijn we niet zeker van. En dan teruggrijpend op de discussie over Modbot is we gaan dat model aan de basis leggen van heel veel dingen in ons leven. Dan is het wel lekker dat dat model het goed met ons voor heeft, zegt hij. En dat is maar de vraag dus of dat gaat lukken, zegt hij.
Ja, ze hebben daar, die kun je online lezen, een constitution voor geschreven. Daar ga ik nu even niet op iemand antwoorden, te veel om op in te gaan. Maar er is een constitution geschreven voor Claude. En als je die in die constitution biedt bijvoorbeeld ook entropics en excuses aan voor als ze Claude wel eens uit moeten zetten. En beloven ze Claude dat er nog kopieën zullen zijn van oudere Claude. Verzin dit niet, gast. Haha.