Wietse Hage
👤 SpeakerAppearances Over Time
Podcast Appearances
Heel indrukwekkend. Wij hebben allebei allerlei voorbeelden langs zien komen. Ik heb er ook heel veel mee gespeeld. Ik heb een deel van onze kerstkaart. Mijn vriendin doet ieder jaar een kerstkaart schilderen. Een mens, mijn vriendin. Toen zei ik, ik heb wel een paar aanpassingen die ik zou willen maken aan jouw schilderij. Toen dacht ik, dat doe ik even met Nano Banana Pro. Het was echt fantastisch. Want het heeft eigenlijk alles behouden. Maar je kon hem gewoon aan draaien. Het is echt dat soort Photoshop waar je mee kan praten. Ja.
Maar die ook context kent. Namelijk in boulderhallen is magnesium is kalk. En dat dingetje daarbij doet je toch een beetje. Ja, ik vind het toch wel een chat GPT momentje. De eerste chat waar jij mee kon praten voor beeld. Dus het lijkt, Nano Banana Pro lijkt een soort iteratie op eerdere beeldgeneratie. Ja, want we zijn inmiddels voor mid-journey gewend. En natuurlijk DALI waarin chat GPT kwam.
Plaatjes genereren met tekst. Maar wat stokte er dan? Wat was daar nog mis mee in vergelijking met dit? Ik kreeg een berichtje van iemand die had mij een jaar geleden een berichtje gestuurd. Ongeveer een jaar geleden. Kan dit nu met AI? En dat ging er eigenlijk over productfoto's van objecten die gewoon in een witte ruimte staan. De leverancier die maakt dan in een witte lightbox een productfoto. Van een kinderwagen bijvoorbeeld. Ja.
Maar die wil je eigenlijk combineren met dat die in een kamer staat, die kinderwagen. Dat is al wat gezelliger. Dan zie je hem bij jou thuis als het ware. En je wil dat er iemand achter die kinderwagen staat. Dat het een beetje leeft. Dus een jaar geleden zei hij, kan ik dit even dan, wat een compose heet. Toen zei ik, ja, je kunt het proberen. Maar dat was allemaal een beetje matig. Zeker wil die achtergrond toevoegen. Dat kon al wel, ook in die eerdere modellen. Maar dan een soort, hier heb je de ingrediënten.
Niet eens waar het moet staan, maar gewoon maak het maar gewoon. Zoals een mens intuïtie heeft. Dat kon niet. En daar kwam nu eigenlijk in één keer een goed plaatje uit. Dus die persoon appte mij ook van, blijkbaar kan dit nu in iets. Maar je lijkt te zeggen dat hij beter de ruimte begrijpt. Dat hij beter begrijpt wat er op de foto te zien is.
Ja, en een soort van... Kijk, als je even de stapjes neemt. Jij zei net mid-journey. We gaan afbeeldingen genereren aan de hand van tekst. En daar komt een schattig plaatje uit. Dan wil je in tekst op een t-shirt? Kansloos. Dat is wat AI een jaar geleden of iets langer een jaar geleden was. Want tekst lukte niet. Toen ging tekst op een gegeven moment een beetje lukken. Dat konden we op zich al.
Maar als het dan een A4'tje was of die tekst moest ook ergens over gaan, dan lukte het weer niet. En iedere keer hadden mensen denk ik een intuïtie bij tekst. Namelijk wat ChatGPT inmiddels kon. Het web opgaan, andere zaken erbij zoeken. Logische dingen doen. Met logisch bedoel je eigenlijk...
Als je tegen een mens zegt, smeer eens een boterham met pindakaas, dan gaat hij niet met zijn hand in die pot die pindakaas op zijn gezicht smeren of zo. Iedereen snapt dan, het moet op de boterham. Allemaal aannames en eigenlijk die soort van context die vaak miste. Dus je vroeg hem een plaatje en dan moest je lachen omdat je dacht, dat is nou niet helemaal wat ik bedoelde.
En jij zegt dan, doe maar Duits. Dan pakt die bestaande typografie, wat eigenlijk in dat blikje verwerkt zit, dat wordt dan Duits. Dat is al best wel bizar. Dat hij dat kan, bedoel je? Ja, en dan de ingrediëntenlijst klopt met de vertaling van de ingrediënten naar Duits. In een volgorde, die past binnen hetzelfde stukje tekstvakje. En er worden allerlei dingen daar gedaan. Alsof je kan dubbelklikken op die tekst en het kan bewerken. Alsof je de layers nog actief hebt in Photoshop. Ja, ja, ja.
Maar dit hoeft allemaal niet. Je hoeft niet te klikken. Je vraagt het gewoon en het komt wel goed. En als je dan zegt, doe maar Thai, dan gaat hij in de Thaise leestekens. En het blijft een mooi geheel. En dat is vooral, het is niet meer, de tekst is er een soort van ongemakkelijk opgeplakt. Nee, er wordt een soort DNA van de originele vormgever wordt als het ware herpakt en erin gestopt. En dat gaat echt 98% van de tijd goed. Dat is wel indrukwekkend. Ja.
En het kan dus ook zo zijn als het bijvoorbeeld in Duitsland zo is dat een ingrediënt altijd net even een andere naam heeft. Dat omdat er een stap tussen zit voordat het beeld gegenereerd wordt, dat er ook nog wat onderzoek gedaan wordt op de achtergrond. Ja, is dat hoe het werkt? Absoluut. Dus eigenlijk, daarom duurt het plaatjes genereren met Nano Banana Pro best wel lang. Omdat het thinking gewoon aangaat. Gemini 3 Pro in thinking mode gaat op de achtergrond eerst eens even nadenken over wat jouw opdracht eigenlijk is. Oké.
En daardoor, mijn gemiddelde generaties die ik heb gedaan, dus plaatjes die ik heb gemaakt in Anabrana Pro, 70 seconden, 90 seconden. En je kan ook de hele ding meelezen. De gebruiker wil dat ik dit doe, maar klopt dat dan wel? Even kijken of die ingrediënten in het Duits ook zo genoemd worden. Hij wil thai, kan ik die karakters wel destilleren? Ik zoom even in op die karakters. Dat kan je helemaal meelezen. Het is een reasoning beeldmodel. Dat is wel echt nieuw. Met ook nog eens Gemini 3 Pro erachter. Dus het is een soort double whammy.
Nee, je merkt bijvoorbeeld als je... Ik zag een ander mooi voorbeeld. Iemand die zei... Ik heb hier een menukaart van een India's restaurant. Kan je de gerechten erbij zetten als plaatjes? Dat is alleen maar een textuele menukaart. En dan zie je dus in die reasoning trace dat hij zegt... Oké, ik kan een aantal van deze gerechten al genereren. Want ik heb die... Dat durf ik wel aan, zeg maar. Maar een aantal van deze gerechten ken ik eigenlijk niet. En dan gaat hij dus online zoeken naar voorbeelden van hoe die gerechten eruit zien. Om daar een synthese van te maken. Om een gerecht te renderen. Om bijvoorbeeld...
vervolgens de tekst in de menukaart... zo op te schuiven... dat er plaatjes naast passen. En dan rendert die, en dat is ook een hele belangrijke... op een hoge resolutie als je dat wil. Hoog genoeg om hem of op een tv-scherm... of om een printje ervan te maken. Een drukwerk ervan te maken. Want het drukwerk maken...
Die stap, ik moet eerlijk zeggen dat ik, als ik hem eigenlijk bekijk, nu Nano Banana Pro, dan zou ik de mensen die een half jaar tot een jaar geleden met beeldgeneratiemodellen hebben gewerkt en toen tegen limieten aanliepen van het is niet scherp, ik kan het niet printen, de teksten kloppen niet, het houdt niet, bla bla bla.
Google heeft gewoon die hele wishlist, ik zou echt zeggen 90% van die featurelist afgecheckt nu. Het zit er allemaal in. En omdat dan ook nog Gemini 3 Pro erachter zit, wat op zichzelf al een heel erg indrukwekkend model is, voelt het echt, echt anders. En ik moet eerlijk zeggen, ik ben al een beetje gewend geraakt. Ook ik ben een soort van verwend geraakt.
Maar als je dan kijkt met dat voorbeeld van Zhang, de eredivisie scorers op zo'n bord waar wij... Tuurlijk staan er ook Rotterdamse helden op. Dat gaan we gewoon vanuit. Die zitten er om me heen als het ware. Maar als het dan allemaal samenkomt, dus het samenkomen van een aantal krachtige puzzelstukken... is dat in die nieuwe puzzel, in die nieuwe ensemble, toch wel weer heel erg indrukwekkend hoor.
En wat is de laatste 10% dan? In de vijf dagen test, wat ben je tegengevallen? Wat ik nu dus nog merk, en ik had het hier ook over met een aantal mensen. AI-gegenereerde beelden, die naïef gegenereerd zijn, zeg ik even. No offense aan de mensen die die maken. Oké, ik ga het nog concreter maken. Cartoons, dus striptekeningen eigenlijk. Van die windows met daar plaatjes in.
Ik zie het. Meteen. Dat het AI is bedoel je? Absoluut. Jij ook. Ik denk als ik nu probeer het AI steltjes voor je te halen van zo'n stripding. Het is een soort Comic Sans fontje. Het is een Comic Sans. Het is dat fontje. Het ChatGPT fontje. Je ziet het gewoon. En die poppetjes hebben allemaal een soort van meh middelmatig met alle respect cartoon steltje. Wat er tussen een 3D render en een cartoon in zit ofzo. Het is echt middelmatig. Maar dat hoeft helemaal niet.
Dat hoeft helemaal niet. Als jij nu zeker met nanobanana pro zegt, oké, ik wil dat je dit fondje gebruikt. Ik wil dat je een cartoonstijl uniek verzinnen houdt, een unieke cartoonstijl. Je hoeft niet te kopiëren van een ander. Dan kan jij nu al, om eerlijk te zijn, denk ik eigenlijk dat je die laatste 10% als soort kenner bijna kunt overwinnen. Dus ik bedoel eigenlijk met die laatste 10%.