Jan-Keno Janssen
👤 SpeakerVoice Profile Active
This person's voice can be automatically recognized across podcast episodes using AI voice matching.
Appearances Over Time
Podcast Appearances
Also die kleinste Variante läuft bereits ab 4 GB VRAM, dann ohne das LLM, was den Text generiert, aber dann könnt ihr trotzdem auch schon Musik machen.
Das Modell unterstützt über 50 Sprachen, ist mit legal lizenzierten Quellen trainiert, was auch signifikant ist, weil das ermöglicht euch quasi einen halbwegs rechtssicheren kommerziellen Einsatz der Generierung.
Was noch?
Es hat eine MIT-Lizenz, also könnt ihr quasi fast alles mitmachen.
Von wem kommt das?
Auch die aus China?
Ja, die Firma heißt, glaube ich, Ace einfach.
Also das ist, glaube ich, nicht Alibaba, Tencent und Konsorten.
Aber das weiß ich tatsächlich gar nicht.
Was ich weiß, ist, dass ein Comfy-Workflow schon gepublished ist und ihr das direkt runterladen könnt und den lokal bei euch benutzen könnt oder auf Comfy Cloud oder anderen Cloud-Hostern, wo man Comfy-UI-Instanzen hochfahren kann.
Kann man das Stand heute sofort nutzen?
Ja.
Ist auf jeden Fall cool.
Also die Beispiele, die ich gehört habe, würde ich sagen, nochmal ein deutlicher Qualitätssprung zu Hartmüller, was schon ganz okay war, aber was auf jeden Fall noch nicht ganz mit Zuno und Judio vergleichbar war.
Ja, das ist ja so eine krasse ethische Diskussion, die eh auch bei uns hier auch mal ein bisschen aussteht.
Wir haben jetzt ja auch schon oft über Bildgenerierungsmodelle gesprochen, wo ja das Gleiche gilt, also dass halt Stile von Künstlern einfach hemmungslos abgekupfert werden und irgendwelche
sehr untalentierten Leute sich auf einmal im Internet mit ihrem künstlerischen Output brüsten und sich selber als Künstler bezeichnen.
Und die Grenze ist da schwimmend, finde ich.
Also ich mache auch gerne selber Musik.
Ich liebe Musik machen und ich mache das auch einfach, weil mir das Spaß macht.