Menu
Sign In Search Podcasts Libraries Charts People & Topics Add Podcast API Blog Pricing

Edwin Rijgersberg

👤 Speaker
60 total appearances

Appearances Over Time

Podcast Appearances

AI Report
Het Nederlandse taalmodel: GEITje ft. Edwin Rijgersberg | ✨ Poki

Nee, een voorbeeld waarvan we het weten is dus van Lama 2, van Meta. Daar hebben ze gezegd, ook het 7 miljard model, dat kostte ze uit mijn hoofd 180.000 GPU. Oké. Dus dan heb je het over honderdduizenden tot miljoenen euro's. Ja, zo grappig hè, dat dan het toevoegen van een taal dan zo'n fractie is op het geheel.

AI Report
Het Nederlandse taalmodel: GEITje ft. Edwin Rijgersberg | ✨ Poki

We hebben het vaak al een paar keer open source gehad. Maar is het een hele vrije open source licentie die erop zit? MIT ofzo, wat zit erop? Ja, het is Apache 2.0. Net zoals Mist. Ja, je hebt hem overgenomen eigenlijk. Of niet aangepast eigenlijk, de licentie. Niet aangepast. Dat betekent, kort gezegd, dat je het voor bijna alles mag gebruiken zoals je wil. Dus commercieel, niet commercieel. Je mag het kopiëren, je mag het verkopen als je daar zin in zou hebben. Nou, namens alle bedrijven in Nederland zeg ik dankjewel.

AI Report
Het Nederlandse taalmodel: GEITje ft. Edwin Rijgersberg | ✨ Poki

Ja, dat is wel weer nog een gift, ja. Maar ik bedoel, jij hebt ja al mailtjes gehad van commerciële partijen die zeggen, joh, we gebruiken geitje te gek. Bedankt man, ons product is nu ineens AI-infused. Nou, geitje heb ik net voor de kerst vrijgegeven, dus het is nog vrij pril. Maar ik heb wel al contact gehad met mensen die zeggen van, we zijn ermee aan het experimenteren. Waar gebruiken mensen het voor? Wat hoor je nu?

AI Report
Het Nederlandse taalmodel: GEITje ft. Edwin Rijgersberg | ✨ Poki

Om te spelen, om chatbots te maken. En te kijken hoe die vergelijken met ChatGPT. Samenvatten is altijd een zeer belangrijke taak waar mensen graag large language models voor gebruiken.

AI Report
Het Nederlandse taalmodel: GEITje ft. Edwin Rijgersberg | ✨ Poki

Ik heb zelfs gehoord dat iemand aan het kijken is of die suggesties kan doen voor mensen hun cv, hoe ze dat beter zouden kunnen presenteren. Je kunt je voorstellen dat een cv is gedeeltelijk, is dat gestructureerde data gedeeltelijk ongestructureerd.

AI Report
Het Nederlandse taalmodel: GEITje ft. Edwin Rijgersberg | ✨ Poki

En zo'n taalmodel, als je die juist prompt, dan kan je eigenlijk zoveel laten analyseren. Je kan bijvoorbeeld kijken, is het toegankelijk taalgebruik? Of heb je concrete voorbeelden genoemd van de projecten die je gedaan hebt op je werk? Dat soort dingen.

AI Report
Het Nederlandse taalmodel: GEITje ft. Edwin Rijgersberg | ✨ Poki

Ja, dat is zeker waar. Dat ben ik ook met je eens. Ik denk dat het een combinatie is van entaal en de cultuur. Maar je ziet ook, ook als je zo'n chatbot niet wil gebruiken als een soort van Wikipedia-vervanging, maar als je hem echt taken wil laten doen, dan zie je dat die cultuurkennis ook helpt. In mijn demo van Geitje Chat, een van de voorbeelden die je daar hebt, is het samenvatten van een artikel.

AI Report
Het Nederlandse taalmodel: GEITje ft. Edwin Rijgersberg | ✨ Poki

En dat artikel gaat over een kartel van wortelverkopers... die hebben een boete gekregen van de ACM. Maar wat grappig is, in dat hele artikel staat nergens vermeld... wat de ACM is, of waar de afkorting voor staat. Dat is de Autoriteit Consument en Markt. En je ziet dus als je mist er al dat aan het samenvatten... dat hij dat niet voor je gaat uitschrijven, wat de ACM is. Maar Geitje, het is nog gastisch, af en toe wel, af en toe niet... maar die weet in elk geval dat...

AI Report
Het Nederlandse taalmodel: GEITje ft. Edwin Rijgersberg | ✨ Poki

Ja, je moet een naam geven aan je model. Dat is een beetje traditie. Ik had hem ook mistral doorgetreden om Nederlands kunnen noemen. Ja, saai. Maar dat is saai. Dus je hebt in de wereld van de taalmodellen al sinds een jaar of vijf begon het eigenlijk met Bert, de Bert generatie. Je had model Bert van Google, je had Ernie, je had Big Bird, zeg maar Pino. Dat was een hele generatie van onderzoekers.

AI Report
Het Nederlandse taalmodel: GEITje ft. Edwin Rijgersberg | ✨ Poki

Van onderzoekers van verschillende bedrijven of universiteiten die allemaal met elkaar meegingen in een soort van thema van naamgeven. En toen de tijd is er dus ook een Nederlandstalige variant van Bert getraind door Wietse de Vries van de Universiteit Groningen. Die moest ook een naam verzinnen en die had hem toen Bertje genoemd.

AI Report
Het Nederlandse taalmodel: GEITje ft. Edwin Rijgersberg | ✨ Poki

Met het idee van die uitgang je, dat maakt alleen duidelijk dat het Nederlands is. Nou, de karakters van Sesamstraat waren denk ik een beetje op. Dus de trend nu is de lama's. Sinds het metal met lama is gekomen. Toen kwam daar een alpaca, een giana, een vicuña. En toen waren de lama-achtigen op. Maar in dat thema wilde ik een beetje doorgaan.

AI Report
Het Nederlandse taalmodel: GEITje ft. Edwin Rijgersberg | ✨ Poki

Mijn oorspronkelijke plan was om Geitje te baseren op Lama. Maar voordat ik ermee aan de slag ging, toen kwam Mistral uit. Of Mistral, zoals jullie het noemen. Wij denken dat dat beter is. Ja, dat is beter. Mistral. Ik ben het nou ook zo gaan noemen, Mistral. Wij weten het niet.

AI Report
Het Nederlandse taalmodel: GEITje ft. Edwin Rijgersberg | ✨ Poki

Maar goed, dat is dus een wind in Frankrijk. Dus ik dacht nou, is er nou een wind in Nederland waar je je taalmodel naar kan vernoemen? Dus ik heb nog gedacht aan de Noordwester of Westenwind. Maar ja, Westenwind was geloof ik een soapserie in de jaren negentig. Ik dacht, weet je wat, ik hou het op een dier. Het is niet zo'n heel groot taalmodel, dus het moet een beetje een klein schattig dier zijn.

AI Report
Het Nederlandse taalmodel: GEITje ft. Edwin Rijgersberg | ✨ Poki

Nou, wat is er nou beter dan een geit? Een geit kan je heel veel dingen voeren, heel veel data voeren en dan begint hij te blaten, zeg maar. Nou, dat vond ik wel een mooie beschrijving van een taalmodel. Het is geitje geworden. Wat was nou het meest bevredigende moment tijdens het werken aan geitje?

AI Report
Het Nederlandse taalmodel: GEITje ft. Edwin Rijgersberg | ✨ Poki

Ik denk dat het meest bevredigende moment was dat ik Geitje had getraind. En dat hij het deed. Want dat was nogal een risico. Want voor hetzelfde geld is hij in een keer heel dom geworden. Of heb ik hem toch niet goed Nederlands geleerd. En hoe ging dat dan? Nou ja, je maakt dat touwmodel, je traint het. En dan kan je het gebruiken om gewoon zinnen af te maken.

AI Report
Het Nederlandse taalmodel: GEITje ft. Edwin Rijgersberg | ✨ Poki

Dus dan ga je wat dingen proberen. Ga je je bassinalie aanproberen. Je gaat wat testjes proberen die je in de benchmarks tegenkomt. Dat soort dingen. Maar wat nog leuker werd toen ik er ook een chatbot van getraind heb. Dan moet je hem nog eventjes doortrainen op voorbeelden van chatgesprekken. Zodat hij zich gaat gedragen als een goede chatbot.

AI Report
Het Nederlandse taalmodel: GEITje ft. Edwin Rijgersberg | ✨ Poki

Toen ik daar tegenaan aan het praten was, hij kende Bas in Adriaan, hij kan wat logisch redeneren over dieren en over geiten en over auto's en hoe die verschillend zijn en dat soort dingen. Toen dacht je yes. Oké, top, het is gelukt. De GPU's zijn uit, het model is er. Nu kan ik verder kijken naar de toepassingen hiervan. Komt er een nieuw geitje?

AI Report
Het Nederlandse taalmodel: GEITje ft. Edwin Rijgersberg | ✨ Poki

Dat is een goede vraag. Het is nu aan de community, denk ik. Ik heb Geitje het basismodel getraind. Iedereen kan het gebruiken om allerlei toepassingen. Ik heb met de beschikbare data een zo goed mogelijk chatbot getraind. Maar daar is nog heel veel winst mogelijk. De echt goede chatbots zijn getraind met veel meer voorbeelden van chatgesprekken. Die zijn ook met...

AI Report
Het Nederlandse taalmodel: GEITje ft. Edwin Rijgersberg | ✨ Poki

Met voorkeuren getraind in de preferences, dat hij echt onderscheid kan maken tussen goede antwoorden en slechte antwoorden. Ik denk dat we daar de komende weken of maanden uit de open source community wel wat leuke dingen uit gaan krijgen. En dan mijn laatste vraag is, voor de luisteraar ben jij een tovenaar, maar voor mij eigenlijk ook, want ik kan dit niet.

AI Report
Het Nederlandse taalmodel: GEITje ft. Edwin Rijgersberg | ✨ Poki

Ik denk dat je het best kan beginnen door te oefenen. Het is eigenlijk helemaal niet zo heel ingewikkeld. Als je die programmeercode ziet, dat valt eigenlijk best wel mee. Je hoeft niet enorm hard te kunnen rekenen aan wiskunde of dat soort dingen. Dat wordt allemaal voor je gedaan. Er zijn cursussen, Hugging Face heeft een aantal cursussen waaronder. Een NLP cursus, een Natural Language Processing cursus. Volgens mij laten ze daar gewoon alle soorten taalprocessing langskomen...

← Previous Page 3 of 3 Next →