Christian Lutz-Weicken
👤 SpeakerVoice Profile Active
This person's voice can be automatically recognized across podcast episodes using AI voice matching.
Appearances Over Time
Podcast Appearances
Aber genau, wir gehen mal schnell durch.
Wir sind ja auch schon in der 40.
Minute, sehe ich gerade, so roughly.
Das Z-Image-Base-Modell ist endlich rausgekommen.
Das ist das vielversprechendste offene Modell seit Stable Diffusion XL.
Stable Diffusion ja danach irgendwie eigentlich so ziemlich abgekackt, muss man sagen.
Also da ist nicht mehr viel gekommen und haben sich dann auch in irgendwelchen
Lizenz Eskapaden selbst in den Fuß geschossen, sodass die ganzen guten Entwickler eigentlich zu Black Forest Labs gegangen sind.
Z-Image von Tongi Labs aus China, jetzt mal wieder ein cooles, offenes Basismodell und destilliert, also das heißt, man kann da schön Feintunes und Loras drauf trainieren und das Ganze sieht sehr vielversprechend aus.
Nee, das war das destillierte Modell, das sogenannte Z-Image Turbo.
Ist auch ein sehr gutes Modell, aber das ist halt destilliert.
Das heißt, da kannst du zwar auch Loras und so Sachen für anlernen, aber das ist bei Weitem nicht so flexibel, weil das halt schon destilliert ist.
Und da kannst du auch nicht coole Fight-Tunes von machen und solche Sachen.
Auch ein sehr gutes Modell, das Z-Image-Turbo, aber nicht zu vergleichen mit dem, was jetzt das Base-Model bringt.
Damit sind jetzt Tür und Tor geöffnet, dass das irgendwie die nächsten ein, zwei Jahre darauf aufbauende Sachen getraint und gemacht werden können.
Wie viel Videoram braucht man dafür, für Z-Image-Base?
Gute Frage.
Das kann ich dir aus dem Kopf gar nicht sagen.
Das Turbo-Modell war extrem klein.
Das hatte, glaube ich, nur vier Milliarden Parameter.