Menu
Sign In Search Podcasts Charts People & Topics Add Podcast API Blog Pricing

Wietse Hage

👤 Speaker
7454 total appearances

Appearances Over Time

Podcast Appearances

AI Report
Alexander kan eindelijk programmeren + DeepSeek haalt Amerikaanse modellen in + de 'ziel' van Claude gelekt

Als je gewend bent geraakt aan wat een Gemini kan, dan komt dit in de buurt. Ik moet wel zeggen dat benchmarks is natuurlijk sowieso een beetje een vraagteken. Want hoeveel van de benchmarks belandt in de modellen? Dus de modellen zijn op een gegeven moment goed in de test als het ware. En het is zelfs, dat kwam ook een beetje uit het interview van Dwarkesh... wat jij hebt laten samenvatten door je eigen tool...

AI Report
Alexander kan eindelijk programmeren + DeepSeek haalt Amerikaanse modellen in + de 'ziel' van Claude gelekt

is dat Ilja Sutskever zei... we zijn aan het overfitten. Heel veel van de partijen zijn zo druk met benchmarks... die willen zo graag goede grafieken... dat ze eigenlijk vergeten dat het uiteindelijk gaat... om wat de eindgebruiker heeft aan die modellen... en niet hoe goed de grafieken zijn. Dan nog doe ik dus even mijn vibecheck bij DeepSeek... en dacht ik, oké, grappig... ze kunnen weer aardig meekomen met de rest van het veld.

AI Report
Alexander kan eindelijk programmeren + DeepSeek haalt Amerikaanse modellen in + de 'ziel' van Claude gelekt

Ja, ik denk dat... Kijk, het is wel even een aantal nuances. Want dat er op de achtergrond bij bijvoorbeeld Amerikaanse... maar ook Europese bedrijven gebruik gemaakt wordt van die Chinese modellen... daar zou je uit kunnen halen... oh, roepen ze dan gewoon de servers van DeepSeek in China aan... en gaat mijn data daarheen? Dat is niet waar dit over gaat. Dit gaat over het pakken van de modellen die DeepSeek vrijden wil. Het letterlijk downloaden van het model...

AI Report
Alexander kan eindelijk programmeren + DeepSeek haalt Amerikaanse modellen in + de 'ziel' van Claude gelekt

En dan draai je op eigen infrastructuur. Dus Airbnb huurt ergens een stuk datacenter. Installeert daar, zeg ik even zo, de DeepSeek modellen. En daar gaat dan de data tussenheen en weer. De servers van Airbnb en de eindgebruiker. Maar op de achtergrond maken ze gebruik van de intelligentie... die uit de modellen van DeepSeek komt die zij geïnstalleerd hebben.

AI Report
Alexander kan eindelijk programmeren + DeepSeek haalt Amerikaanse modellen in + de 'ziel' van Claude gelekt

De voordeel daarvan voor hun is dat je die afhankelijkheid kwijt bent van de grote frontier labs. En dat je die modellen nog kunt gaan doortweaken. Je kunt een beetje op maat gaan maken. Je kunt gaan kijken, kunnen we niet een kleiner model gebruiken? Nog kleiner, om te zorgen dat de snelheid omhoog gaat en de kosten naar beneden.

AI Report
Alexander kan eindelijk programmeren + DeepSeek haalt Amerikaanse modellen in + de 'ziel' van Claude gelekt

En jouw vraag, gebeurt dit vaker? Absoluut, omdat je uiteindelijk, als jij een restaurant hebt waar je de pizzadeeg letterlijk uit een klein Italiaans dorp haalt, maar je merkt dat je met wat ander deeg kan meemengen en het smaakt ongeveer hetzelfde. Ja, dat is eigenlijk ondernemen.

AI Report
Alexander kan eindelijk programmeren + DeepSeek haalt Amerikaanse modellen in + de 'ziel' van Claude gelekt

in KPN datacenters hebt draaien om allerlei gevoelige data... waarvan je niet wil dat dat op de Amerikaanse server staat... met AI te bewerken. Het is misschien wel goed om nog even terug te gaan. We hadden de Lama-modellen van Meta. We hebben eigenlijk na Lama 4 niks meer gezien. Het is een soort stil bij Meta nu. De Lama's waren de eerste voorbeelden van vooral speelgoed destijds.

AI Report
Alexander kan eindelijk programmeren + DeepSeek haalt Amerikaanse modellen in + de 'ziel' van Claude gelekt

Maar toen ook al waren er een aantal bedrijven die dachten, nou, als we die lama nog een beetje doortrainen op specifieke dingen, dan kunnen we daar misschien wat mee. Er zit waarde in. En wat je eigenlijk nu ziet, dit is ook de roddel, ik zeg er even het woord roddel bij, in de wandelgangen rondom de Mistral modellen. Hoeveel van dat model is eigenlijk een beetje diepziek?

AI Report
Alexander kan eindelijk programmeren + DeepSeek haalt Amerikaanse modellen in + de 'ziel' van Claude gelekt

Jij hebt het nu over bedrijven die diepziek draaien. Maar je hebt natuurlijk ook AI-labs onderling... die elkaars kunstjes zien. Doordat het open modellen zijn. Dus op een gegeven moment krijg je op z'n minst... academische wetenschappelijke invloeden... vanuit de diepziek paper in de Mistral-modellen. Dus Chinese innovatie in Europese modellen en vice versa. Maar je kunt ook kijken...

AI Report
Alexander kan eindelijk programmeren + DeepSeek haalt Amerikaanse modellen in + de 'ziel' van Claude gelekt

Hoeveel stukjes zijn niet gewoon echt één op één overgenomen? Hiermee zeg ik niet, Mr. Al3 is hetzelfde als Diepziek V3. Dat niet. Maar er zijn overlappen. En er wordt nu een beetje gezocht. Daarom is het nog een roddel van... Kunnen we niet alle mooie stukjes bij elkaar plakken? Om het heel schattig te zeggen, een wereldmodel te maken. Niet een worldmodel, maar een model van de wereld. Een VN-model. Ja, een VN-model.

AI Report
Alexander kan eindelijk programmeren + DeepSeek haalt Amerikaanse modellen in + de 'ziel' van Claude gelekt

Al met al is het nu boeiend ook voor mij om te zien... omdat ik bekijk die open modellen... vooral vanuit een soort individuele democratisering van AI. Ik kan het draaien op mijn eigen smartphone. Terwijl het element wat ik nog wat minder zag... tot een jaar geleden... ik zag dat Mistral aangeboden werd bij Microsoft in Azure. En dat de GPT open source modellen van OpenAI... gingen draaien bij grok met een Q. Dat ik dacht, wacht even...

AI Report
Alexander kan eindelijk programmeren + DeepSeek haalt Amerikaanse modellen in + de 'ziel' van Claude gelekt

is die open source ethos, het feit dat de modellen te downloaden zijn... is niet enkel en alleen voor hobbyisten die schattig dat thuis doen. Nee, het is ook mogelijk om ze commercieel in te zetten... als belangrijk stukje denken in jouw bedrijf en software. En dat vind ik wel een interessante nieuwe ontwikkeling als je kijkt...

AI Report
Alexander kan eindelijk programmeren + DeepSeek haalt Amerikaanse modellen in + de 'ziel' van Claude gelekt

Open source gaat over zoveel meer dan alleen maar je kunt het openmaken, je kunt er zelf mee spelen. Het gaat ook over, dit geeft bedrijven de mogelijkheid om intelligentie in te kopen op een andere manier dan enkel tokens aan te schaffen bij Anthropic en OpenAI. Denk je dat volgend jaar normaal, als we hier over een jaar weer zitten, dat het dan normaler is geworden om open source modellen te gebruiken?

AI Report
Alexander kan eindelijk programmeren + DeepSeek haalt Amerikaanse modellen in + de 'ziel' van Claude gelekt

Ik denk het wel, omdat dit eigenlijk ook een beetje is wat open source sowieso is. Dat heel veel, ook als je naar de instellingen gaat van je Android of iOS toestel, kan je bij About gewoon zien wat voor open source er allemaal in zit. Ook bij Apple en Google. Android is deels open source. Maar toch, ik gebruik standaard nu allemaal gesloten modellen voor alle belangrijke dingen. Ah, jij bedoelt als eindgebruiker.

AI Report
Alexander kan eindelijk programmeren + DeepSeek haalt Amerikaanse modellen in + de 'ziel' van Claude gelekt

En ook wel de tussen apps die ik gebruik. Ook de Airbnb app inderdaad. En al die andere apps die ik gebruik. Ik kan me heel goed voorstellen dat zonder dat jij dat echt door hebt. Er allerlei open source modellen draaien aan de achterkant. In bepaalde processen. In apps waar jij niet eens merkt dat dat aan het gebeuren is. Jazeker. Want het is gewoon economisch gezien interessant.

AI Report
Alexander kan eindelijk programmeren + DeepSeek haalt Amerikaanse modellen in + de 'ziel' van Claude gelekt

Wat zit daar dan tussen? Waarom tien? Je kunt ze hebben die beter zijn met beeld, minder goed met tekst. Die wel kunnen reasonen en niet kunnen reasonen. En zo kan je een beetje per taak, zeg maar. Dus de allerkleinste bijvoorbeeld, die kan objecten herkennen in plaatjes. En die draait zelfs in je browser. Dus je opent een website. Dat model wordt ingeladen vanaf die website op jouw lokale computer. Je doet je webcam aan, je houdt een appel in beeld en hij zegt ik zie een appel.

AI Report
Alexander kan eindelijk programmeren + DeepSeek haalt Amerikaanse modellen in + de 'ziel' van Claude gelekt

Maar dan kan je niet zeggen, kan je me nog een leuk gedichtje vertellen? Kan je doen, maar dat is een matig gedicht. Dus zo zie je eigenlijk dat aan de hand van een beetje de toepassing. Dus wil je het edge, oftewel aan de rand van het internet. Dat is iemands eigen toestel. Dus in de browser, op de rand. Enkel om objectjes te herkennen, want iemand is met Lego bezig. Of wil je reasoning doen en wil je wat meer nadenken. Maar, en dat is wel een interessante...

AI Report
Alexander kan eindelijk programmeren + DeepSeek haalt Amerikaanse modellen in + de 'ziel' van Claude gelekt

En hoeveel kennis heeft dat kleine modelletje nodig? Want als je zeg maar een goede denker hebt, dus een model dat redelijk kan redeneren, maar eigenlijk weinig weet en jij zorgt dat die kennis er op tijd aan toegevoegd wordt op het moment dat het nodig is, kan je best wel wegkomen met die kleine modellen ook. Dat is een beetje waar we volgend jaar hopelijk wat meer van gaan zien.

AI Report
Alexander kan eindelijk programmeren + DeepSeek haalt Amerikaanse modellen in + de 'ziel' van Claude gelekt

Jij kan bijvoorbeeld eigen emojis maken. Dan zeg je, doe deze drie emojis tot een nieuw emoji maken op iOS. Dat is een heel klein modelletje die dat specifiek lokaal voor jou doet. Als je zegt, kan je deze tekst voor mij corrigeren, gaat het door een tekstcorrigeerdingetje heen. En eigenlijk wat Mistral nu doet, dankzij Mistral kan je nu een beetje onder de motorkap kijken van wat er bij die grotere partijen ook allemaal leeft. Namelijk expertmodelletjes toegespitst op bepaalde taken en doelen.

AI Report
Alexander kan eindelijk programmeren + DeepSeek haalt Amerikaanse modellen in + de 'ziel' van Claude gelekt

En daarom is het ook logisch dat Mistral dat hele boeket naar buiten gooit nu. Want dat is eigenlijk ook wat de klanten vragen. Dit is ook aangestuurd op wat zij voelen dat de markt verlangt. Namelijk mooie, gefinetunede minimodelletjes. Ja, het zou het zijn als we hier niet meer over hoeven na te denken. Dat je gewoon een ChatGPT-achtige app hebt die dan voor jou zegt... ik ga dit naar Mistral brengen, deze vraag. Want dat kan echt prima. Ja.