Du verwendest einen veralteten Browser. Es ist möglich, dass diese oder andere Websites nicht korrekt angezeigt werden. Du solltest ein Upgrade durchführen oder einen alternativen Browser verwenden.
Danke für die INFOs, schaue ich mir morgen mal an.
Anbei mal ein anderes Basismodell:
Cosmos Predict2 2B t2i - via ComfyUI - einfach über den Startworkflow zu installieren.
ComfyUI braucht oftmals sehr viel mehr input was genaue Beschreibung angeht.
Außerdem auf den Checkpoint / das Modell welches man nutzt.
Man kann mit den Loras auch übertreiben, dann wird einem nur Pixelmatsch ausgegeben.
So ganz verstanden habe ich es noch nicht, aber ich nutze "trigger" Wörter bei den Loras.
Bei vielen die man herunterladen kann sind vordefinierte Triggerwörter in der Beschreibung hinterleg. Das hilft wirklich ungemeint
Es gibt noch ein stärkeres Modell von Nvidia.
cosmos_predict2_2B_t2i.safetensors - 3,8GB - gestern verwendet
cosmos_predict2_14B_t2i.safetensors - 27,8GB - heute verwendet (17 Milliarden Parameter).
An dieser Stelle findest du externe Inhalte von Youtube. Zum Schutz deiner persönlichen Daten werden externe Einbindungen erst angezeigt, wenn du dies durch Klick auf "Alle externen Inhalte laden" bestätigst:
Ich bin damit einverstanden, dass mir externe Inhalte angezeigt werden. Damit werden personenbezogene Daten an Drittplattformen übermittelt. Für mehr Informationen besuche die Datenschutz-Seite.
Mal etwas "realitätsnäher".
Prompt für das ursprüngliche Bild:
A proud fisherman standing in a peaceful lake in the mountains, holding a 1-meter-long pike he just caught. The fisherman is dressed in weatherproof clothing, smiling widely. The background features a clear blue sky and majestic mountains, their reflection mirrored in the calm water. The atmosphere is tranquil, with gentle waves around the boat. The pike looks strong and vibrant, glistening in the sunlight.
Anschließend wieder mit Wan img2Vid animiert, diesmal aber einen Refiner, einen Detailer und einen Upscaler dazu genommen.
Das sieht man ganz besonders in den ersten paar Bildern, wie aus dem "Pike" der vorher eher weniger einer war, dann ein größerer sehr farbenfroher Hecht wird (etwas übertrieben).
Gesamtdauer von der Erstellung des Bildes bis zum Video waren circa 1 1/2 Stunden (mit neustarten der Workflows, da mir der VRAM ausging )
Für die Erstellung zu Hause und für den eigenen Nutzen ist das mit Wan schon echt klasse.
Die Qualität von Online AI Generatoren wie z.B. das von Google, erreicht man natürlich nicht und auch nicht in der Geschwindigkeit und auch ohne Ton.
Dafür ist man allerdings frei in der Erstellung, da die Filter (verbotene Wörter) nicht vorhanden sind, welche die Onlineplattformen einbauen müssen.
Ja frisst. Und wenn man alles direkt in einem Rutsch abarbeiten will bräuchte man mindestens 96GiB an VRAM (mit / bei entsprechend hoher Qualität natürlich).
Das leeren vom Cache oder des VRAM (das bei mir nötig ist) macht es schwieriger direkt alles umzusetzen.
Und natürlich ist das Google Pendant besser, hat ja auch eine viel größere Rechenkapazität und entsprechend hohe eintrainierte Bilder in der Datenbank.
DAS wäre mal ein Einsatzgebiet für eine Radeon Pro SSG. Nur leider basiert die noch auf einer Radeon Fury, mit entsprechend wenig Dampf heutzutage.
Eine Neuauflage wäre cool.
Aber ja, wenn man wirklich Videos erstellen möchte, die entsprechend hohe Qualität und Laufzeit haben, dann braucht man Unmengen an GPU Power.
Wenn man sich dann bei YT diese aufpolierten "Trailer" von angeblich bald kommenden Filmen ansieht, die KI erstellt sind (und auch noch echt super aussehen) dann will ich nicht wissen, was da für ein Stromverbrauch hinter steckt.
Für den Heimanwender der mal eben ein Bild aufpolieren will (alte Fotos digitalisieren und die Details verbessern etc) reicht das aber aus.
Man lädt ja ungern seine privaten Fotos zum verbessern hoch.
Fusion von Goku und Vegeta durch Potara Ohrringe (Vegetto / Vegito) in "Reallife" Version.
Und weil das ganze mich ein wenig gewurmt hat, habe ich es in einer zweiten Version mit original Soundfile hinterlegt, leider ist die Soundfile zu kurz geraten.
Die Qualität ist jedenfalls angestiegen mit der neuen WAN 2.2 Version. Ich arbeite noch etwas dran und schaue mal was da noch so geht.
An dieser Stelle findest du externe Inhalte von Youtube. Zum Schutz deiner persönlichen Daten werden externe Einbindungen erst angezeigt, wenn du dies durch Klick auf "Alle externen Inhalte laden" bestätigst:
Ich bin damit einverstanden, dass mir externe Inhalte angezeigt werden. Damit werden personenbezogene Daten an Drittplattformen übermittelt. Für mehr Informationen besuche die Datenschutz-Seite.
Leider ist nach einem Jahr meine RTX 4060 verstorben, Garantiegedöns ist angefragt...
Zum Glück hatte ich noch eine GTX 1650, welche aber im Vergleich selbst mit Juggernaut XL v12 extrem langsam ist.
Dennoch hier mal wieder ein "Lebenszeichen" von mir:
Promts: "Oil painting, a captivating cat figure made of shimmering amber, with delicate and intricate flowers perfectly integrated into her form. Her head is shaped like a fox's, exuding elegance and mystique. She has a voluptuous body with wide hips sculpted in graceful curves. Behind her, a bright, radiant light shines, casting a shimmering, ethereal aura around her translucent body of amber and flowers. The scene is enchanting and surreal, blending natural beauty with an air of divine radiance."
Hab mal wieder versucht meinen Avatar zu vervollständigen. Gemini hat den Körper aufgefüllt aber bei den Flügeln immer nur Mist produziert. Also die nachträglich mit Google Foto überarbeitet.
Hab mal wieder versucht meinen Avatar zu vervollständigen. Gemini hat den Körper aufgefüllt aber bei den Flügeln immer nur Mist produziert. Also die nachträglich mit Google Foto überarbeitet.Anhang anzeigen 1502883
Leider läuft meine neue RTX 5060 (AT für meine verstorbene RTX 4060) NICHT mit Forge UI (welches übrigens seit Monaten leider nicht mehr weiter entwickelt wird). Daher muß ich mich nun mit ComfyUI anfreunden. Kennt jemand eine aktuelle kompatible Oberfläche auf Basis von A1111 ? Invoke.Community.Edition z.B. bietet nicht den vollen Funktionsumfang.
So, bin fündig geworden. Für (schnelle) SDXL Bilder habe ich fooocusrtx508090 gefunden. Für FLUX und SD3.5 kann ich ComyUI verwenden. Anbei ein Fooocus Testbild via Juggernaut XL v12, saubere Arbeit, keine Übersättigung oder Pixelfehler. Läuft ! Testprompt: cat in garden.
a detailed matte painting of a river running through a forest, magical forest background, by Thomas Kinkade, by mark keathley. Erstellt mit Juggernaut XL v12 via FooocusRTX50xx.