Milou Brand
👤 SpeakerAppearances Over Time
Podcast Appearances
Maar als het gaat om een speech of misschien een stukje wat iemand voorleest in een gemeenteraad om een bepaald park investering te hebben in nieuwe bomen in een park. En dan aan ChatGPT geeft mij de meest emotioneel geladen speech voor het nieuwe park ooit. Dat je je misschien afvraagt, staat iedereen daar straks dan bizarre proza te oreren?
Ja, bizar. En het pijnlijke daarvan is nog ook dat er inmiddels best wel wat onderzoek en ook weer meta-onderzoek gedaan is. Onderzoek van meerdere onderzoeken. Om die tools te testen. Jij noemt er nu een en er is een hele rits. Het is gewoon een industrie geworden natuurlijk. Wat vroeger dan plagiaatscanners heette, zijn dan nu de AI slash plagiaatscanners geworden. Binnen universiteiten, maar ook daarbuiten. Door werkgevers die iemand betalen om teksten te schrijven en dan natuurlijk willen dat het allemaal origineel is.
Wij van WC niet. Maar jij zei eigenlijk, het zijn kwaksalvers. Ja, dat durf ik wel te zeggen. Het is niet helemaal niet waar. Het is niet helemaal niet waar. Kijk, een kwaksalver zie ik echt als iemand die gewoon water verkoopt als een medicijn.
Ik denk dat... wat ik uit de onderzoeken haal... ik ben geen expert, ik pak er dan gewoon wat onderzoeken bij... die zijn recent gedaan, vorig jaar een aantal... begin van dit jaar ook. Waar eigenlijk uit naar voren komt... je kan het natuurlijk gewoon testen. Je kunt gewoon een dataset maken van duizend synthetisch gegenereerde teksten... en dan duizend daadwerkelijke teksten... en dan al die tools eroverheen halen... en dan kijken hoeveel pakt hij eruit...
Daar zit iets van 13,5% detectie of zo. Ja, daar kan je niet mensen mee ontslaan. En ook niet studenten mee naar huis sturen. Snap je? Als je getallen zo laag zijn. Want er zitten enorme false positives. Want daar gaat het uiteindelijk om. Dat jouw tekst wordt herkend met een 91% accuracy. Op het feit dat het fake zou zijn. Terwijl daar maar helemaal de kans dat het waar is, heel laag is. En dat zijn gewoon gevaarlijke leugens, zou ik zeggen. Ja, want dan kun je je werk verliezen of zo.
Ja, dus ik vind de software zoals die er nu is best wel onzinnig. Ik moet wel zeggen tegelijkertijd dat er ook weer heel veel onderzoek gedaan wordt... naar oké, we willen dit blijkbaar. Want in bepaalde plekken is het gewoon echt nodig. Je kan je voorstellen als het een website van een patiëntenorganisatie is... en daar staan allemaal AI-gegenereerde adviezen, medische adviezen op... dat je dat wel zou willen herkennen. En ook zou willen zeggen, dit klopt niet.
Dus ik snap wel dat deze software er op een bepaalde manier moet zijn. Er zijn... een van de meest... hoopgevende... als je die software belangrijk vindt... ideeën is om te zeggen... GPT-achtige systemen... de staalmodellen schrijven vaak... een soort destilaat... of een soort heel erg... gemiddeld... stuk tekst. Het is altijd het gemiddelde van de samenleving. Want het komt natuurlijk uit allemaal bronnen. Reddit, boeken, noem maar op...
En eigenlijk kan je op die manier dus redelijk goed meten dat je zegt, is dit een tekst die voelt als een soort samenvoegsel van alle kleuren? Een soort bruin, zeg maar. Als je alle kleuren van je palet bij elkaar gaat krijgen, krijg je vaak een soort bruine grijs. Is het bruine grijs wat hier geschreven wordt qua mening? Of heeft het echt iets heel excentrieks en iets unieks? En daar kan je natuurlijk ook weer taalmodellen op trainen, omdat juist...
Ja, gebruik niet deze bronnen, gebruik niet dat. Maar dat schijnt een aardige indicatie te zijn. Is een tekst heel erg grijs-bruinig of is het een heel erg unieke take?
Ja, maar ik denk al dat in de brede zin, want wij hebben het nu over tekst. Ik denk dat het goed is dat we ook even bij tekst blijven hoor. Maar ik waai heel even uit, want je hebt binnen generatieve AI, kan je natuurlijk ook plaatjes maken en audio maken en audio met plaatjes en filmpjes en noem maar allemaal hoor op. In die wereld buiten tekst zijn best wel wat oplossingen, omdat je met stenografie bijvoorbeeld, dus dat is eigenlijk informatie verstoppen in afbeeldingen, kan jij vanuit stability of vanuit meta in een foto die door AI generated is, kan je dingen toevoegen om het gewoon weg te geven. Gewoon een soort stempeltje op de achterkant stiekem.
Daar zijn ook allerlei voorstellen voor, ze zijn zelfs aan het nadenken over een standaard daarvoor, dat al die partijen, open source kan je er natuurlijk weer uitslopen, dus dat even geparkeerd, maar dat alle commerciële partijen een soort stempeltje gaan toevoegen aan ieder plaatje, zodat het niet gededicteerd hoeft te worden op een hele intelligente manier, maar op een hele simpele manier, het stempeltje staat erop.
Een watermerk. Ja, want dat is zoveel rijker, een plaatje of audio of video... dat je daar veel meer in kan meeliften en verstoppen. Tekst is tricky, want dan zou je eigenlijk moeten gaan zeggen... een bepaalde AI spreekt af om altijd bepaalde woorden op die manier te gebruiken... waardoor het gewoon echt een signature staal heeft. Maar een duidelijk te herkennen manier van structureren en schrijven... en dat wordt dan het watermerk, als het ware. Een soort watermerk in structuur...
Maar ja, dat is nou juist precies wat jij nu beschrijft. Dus die...
Je hebt de taalmodellen die genereren en dan heb je de detectiemodellen die getraind zijn op heel veel gegenereerde tekst om het onderscheid te kunnen maken. En dan ga je de taalmodellen weer leren om juist teksten te schrijven die niet lijken op taalmodellen. En dit spelletje is dus best wel, ik zeg niet niet te winnen, maar dit zorgt ervoor dat een detectiewebsite of app of algoritme een paar maanden werkt, heel goed, en dan weer helemaal niet.
Dat helemaal niet. Dus je moet eigenlijk steeds vernieuwen dan ontwikkelen. Ja, je bent constant erachteraan aan het rennen. En je hebt ook nog te maken met alle... Het is niet dat mensen alleen maar JGPT gebruiken. Ik denk over het algemeen de meeste mensen open AI software gebruiken. Maar je hebt natuurlijk nog veel meer modellen.
Ja, je zou ook weer een model kunnen maken die teksten maakt, die dan stuurt naar zo'n service, terugkrijgt of die hem heeft gedetecteerd en dan net zolang teksten blijft maken tot hij het niet meer detecteert en dan zich gaat trainen op detectie. Dus al deze initiatieven kan je ook tegen elkaar terugwerken. Uiteindelijk denk ik dat we zitten met het vraagstuk...
Hoe doe je dit? Detecteren. Hoe doe je dit op de lange termijn? Want het is een soort vloeibaar bewegend fenomeen. En als je het dan doet, wat doe je dan met je conclusie? Hoe hard is die conclusie? Ga je daar mensen mee ontslaan? Ga je daarmee studenten naar huis sturen? Persoonlijk zou ik zeggen, ik zet er echt een hoop vraagtekens bij. Want het is helemaal nog niet zo goed. En dan heb je nog de vraag, waarom doen we dit eigenlijk?
Dat vind ik ook wel eentje om voor ons even aan te raken. Want stel dat je op een dag wel een superintelligence hebt. Om even terug te grijpen op het begin van de aflevering. Dus een entiteit, algoritme dat teksten kan schrijven. Die veel beter zijn dan dat mensen die kunnen schrijven. Want we zitten nu nog met het soort redigeren en helpen en co-pilot. Maar ik zit te denken over die superschrijver. Om het woord super nog maar even te... Ja, die creatief is en associatief en...
Ja, want dan kom je op een soort heel raar punt. Dat je zegt, ook al is dat boek fantastisch. Ook al is die speech veel beter. Het mag niet, want het is geen mens. En dat kan je mening zijn. Dat je zegt, we willen een wereld gevuld met creaties. Die vanuit vlees en bloed ontwikkeld zijn. Om het maar even zo te zeggen. En ook al is dat synthetische boek. En die synthetische podcast. En die synthetische film. Is fantastisch. En iedereen wil hem eigenlijk zien. We gaan hem toch detecteren en wegsturen. Of in een ander doosje doen, zeg maar. Ja.
Maakt het nog uit dan. Dan heb je op een gegeven moment iemand die zegt. Ik ben een vlees avatar voor een student. Ik kom studeren. Ik geef dat toe. Want we gaan nieuwe wetenschap ontwikkelen hier met elkaar. En ik ben nu alleen maar in de klas aan het zitten met een memorycorder. Om het door te geven aan mijn taalmodel. Die super intelligent is. En dat die docent zegt. Wegwezen jij. Ik wil geen nieuwe wetenschap. Ik wil niks nieuws leren. Ja.