Bilderthread Der K.I. Bilderthread

Erster Versuch mit ComfyUI - via FLUX.

ComfyUI_00033_Hama.png

*
 
Erster Versuch mit ComfyUI - via FLUX.

Anhang anzeigen 1499284
*
Wenn du mit ComfyUI arbeitest, dann kannst du deine Bilder mit Wan2.1 und T2V oder I2V direkt in einem Workflow animieren lassen falls du willst.

Die Ergebnisse sind echt wahnsinnig gut (siehe Spoiler von deinem Bild).

Eingebundener Inhalt
An dieser Stelle findest du externe Inhalte von Youtube. Zum Schutz deiner persönlichen Daten werden externe Einbindungen erst angezeigt, wenn du dies durch Klick auf "Alle externen Inhalte laden" bestätigst: Ich bin damit einverstanden, dass mir externe Inhalte angezeigt werden. Damit werden personenbezogene Daten an Drittplattformen übermittelt.
Für mehr Informationen besuche die Datenschutz-Seite.
Ich bin immer wieder fasziniert was damit alles möglich ist.
 
Wenn du mit ComfyUI arbeitest, dann kannst du deine Bilder mit Wan2.1 und T2V oder I2V direkt in einem Workflow animieren lassen falls du willst.

Die Ergebnisse sind echt wahnsinnig gut (siehe Spoiler von deinem Bild).

Eingebundener Inhalt
An dieser Stelle findest du externe Inhalte von Youtube. Zum Schutz deiner persönlichen Daten werden externe Einbindungen erst angezeigt, wenn du dies durch Klick auf "Alle externen Inhalte laden" bestätigst: Ich bin damit einverstanden, dass mir externe Inhalte angezeigt werden. Damit werden personenbezogene Daten an Drittplattformen übermittelt.
Für mehr Informationen besuche die Datenschutz-Seite.
Ich bin immer wieder fasziniert was damit alles möglich ist.
Könnte man damit auch z.B. ein Bild von hier:


Animieren? Das die Züge fahren und der Dampf sich bewegt?
 
WAN 2.1 Image to Video - insgesamt 32GB werden gerade geladen ... :ugly: Mit Text to Video habe ich gestern schon "rumgespielt". Was ist festgestellt habe ist, daß ComfyUI teils ganz andere Bilder als Forge UI erzeugt, obwohl Modell und Grundeinstellungen gleich sind.
 
Ja, die Komplexität ist oft weitaus höher.

Ich weiß nicht ob es an Comfy liegt, aber ich bin begeistert davon.

und @RyzA
Eingebundener Inhalt
An dieser Stelle findest du externe Inhalte von Youtube. Zum Schutz deiner persönlichen Daten werden externe Einbindungen erst angezeigt, wenn du dies durch Klick auf "Alle externen Inhalte laden" bestätigst: Ich bin damit einverstanden, dass mir externe Inhalte angezeigt werden. Damit werden personenbezogene Daten an Drittplattformen übermittelt.
Für mehr Informationen besuche die Datenschutz-Seite.

Das ist auf die schnelle mit 24 Steps (für Realismus werden oft 50 - 100 genutzt) entstanden.

Workflow sieht dann so aus:

Linke seite, Model, Loras, Prompts, unten das Ausgangsbild (erste Zeile bei den Prompts sollte stehen was im Bild zu erkennen ist, zweite Reihe was danach passieren soll, das bringt die besten Ergebnisse meiner Erfahrung nach).

Beim Prompting sollte man auch so genau wie möglich vorgehen. Der Textencoder (Clip) ist hier sehr wichtig, wie bei Flux wird auch hier mit einer extra Database gearbeitet (multilingual) du kannst es also auch auf deutsch schreiben, englisch ist aber weitaus einfacher für die KI.
1752575659079.png

Dann wird alles eingeladen und dann kommt der Sampler, wenn dieser fertig ist, wird es Decoded.
Frameinterpolation für mehr FPS (Länge 81 a 16 Bilder multipliziert mit 2 ergibt am Ende ein 5 Sekunden langes 30 FPS Video).
1752575740469.png


Die Frameinterpolation ist wichtig, weil einem der VRAM sehr leicht ausgehen kann.
Je detailreicher das Ausgangsbild, desto länger dauert es beim Sampling.

Ganz rechts im Bild ist dann die "Vorschau" zu sehen, man kann es mit einem Rechtsklick auf "open Preview" im Vollbild anzeigen lassen (entsprechend der Auflösung des Videos), im loop laufen oder direkt auf "save Preview" klicken, dann kannst du es speichern.

Man kann zusätzlich im Wan2.1 dann noch das video erweitern. Da muss man "last frame" auswählen, aber ich arbeite selbst noch daran es genau hin zu bekommen.

Nachtrag:

Ich empfehle euch, erstellt euch erst das Bild und dann mit img2vid das Video erstellen, es braucht weniger Ressourcen und geht mehr auf details ein.
 
Zuletzt bearbeitet:
Ja, die Komplexität ist oft weitaus höher.

Ich weiß nicht ob es an Comfy liegt, aber ich bin begeistert davon.

und @RyzA
Eingebundener Inhalt
An dieser Stelle findest du externe Inhalte von Youtube. Zum Schutz deiner persönlichen Daten werden externe Einbindungen erst angezeigt, wenn du dies durch Klick auf "Alle externen Inhalte laden" bestätigst: Ich bin damit einverstanden, dass mir externe Inhalte angezeigt werden. Damit werden personenbezogene Daten an Drittplattformen übermittelt.
Für mehr Informationen besuche die Datenschutz-Seite.

Das ist auf die schnelle mit 24 Steps (für Realismus werden oft 50 - 100 genutzt) entstanden.

Workflow sieht dann so aus:

Linke seite, Model, Loras, Prompts, unten das Ausgangsbild (erste Zeile bei den Prompts sollte stehen was im Bild zu erkennen ist, zweite Reihe was danach passieren soll, das bringt die besten Ergebnisse meiner Erfahrung nach).

Beim Prompting sollte man auch so genau wie möglich vorgehen. Der Textencoder (Clip) ist hier sehr wichtig, wie bei Flux wird auch hier mit einer extra Database gearbeitet (multilingual) du kannst es also auch auf deutsch schreiben, englisch ist aber weitaus einfacher für die KI.
Anhang anzeigen 1499301
Dann wird alles eingeladen und dann kommt der Sampler, wenn dieser fertig ist, wird es Decoded, Frameinterpolation für mehr fps (länge 81 a 16 bilder multipliziert mit 2 ergibt am ende ein 5 sekunden langes 30 FPS Video)
Anhang anzeigen 1499302

Die Frameinterpolation ist wichtig, weil einem der VRAM sehr leicht ausgehen kann.
Je detailreicher das Ausgangsbild desto länger dauert es beim Sampling.

Ganz rechts im Bild ist dann die "Vorschau" zu sehen, man kann es mit einem rechtsklick auf "open Preview" im vollbild anzeigen lassen, im loop laufen oder direkt auf "save Preview" klicken, dann kannst du es speichern.

Man kann zusätzlich im Wan2.1 dann noch das video erweitern. Da muss man "last frame" auswählen, aber ich arbeite selbst noch daran es genau hin zu bekommen.
Vielen Dank! Das sieht schon sehr komplex aus.

Aber echt krass was damit machbar ist!:wow:
 
Sieht gut aus.

Ich habe auch erst vor ein paar Tagen damit angefangen, lerne also auch noch es richtig zu benutzen.

Aber ich finde es einfach sehr mächtig.
Warum werden die KI Videos nicht mit deinen anderen Videos (Cyberpunk usw) im YT-Channel angezeigt?

Ich habe jedenfalls Abo und Like da gelassen! :daumen:
 
Habe die als "Hidden" markiert um möglichen "Rechtsstreits wegen Copyright" zu entgehen.

Nehmen wir den "Gandalf" wird (könnte) es sicher Probleme geben.
Ansonsten sind die Videos unter "Shorts" zu finden, weil sie sehr kurz sind.

Und danke für den Like und das Abo, aber so aktiv bin ich ja nicht bei YT ;)

Und falls ihr euch fragt, wofür man GPUs mit mehr VRAM braucht, genau für solche Einsätze.
 
Zuletzt bearbeitet:
Es geht auch mit Cache clear addons, und es gibt extra workflows und checkpoints die für 3060 mit 8gb (und vergleichbaren) ausgelegt sind, also machbar ist alles, dauert dann nur entsprechend länger.

Aber KI Leistung könnte man mal als Benchmark mit einbauen..

@PCGH_Dave unsere Maschine kann das sicher gut irgendwie ermitteln..
Eingebundener Inhalt
An dieser Stelle findest du externe Inhalte von Youtube. Zum Schutz deiner persönlichen Daten werden externe Einbindungen erst angezeigt, wenn du dies durch Klick auf "Alle externen Inhalte laden" bestätigst: Ich bin damit einverstanden, dass mir externe Inhalte angezeigt werden. Damit werden personenbezogene Daten an Drittplattformen übermittelt.
Für mehr Informationen besuche die Datenschutz-Seite.
 
Ich habe nur 12 GB Vram. Und 32Gb Ram. Damit brauche ich es glaube ich gar nicht erst probieren.
Ich hab "nur" ne RTX 4060 mit 8GB VRAM, dafür aber 64GB RAM. Geht alles ohne Probleme, auch vorher. Allerdings hat es dann länger gedauert...

PS: Hier mal der Unterschied den ich meine:
A nightmarish, infernal scene depicting a massive, demonic warship rising from a seething sea of blood and lava. The ship is pitch-black, with tattered, fiery red sails and jagged masts that jut like horns into the blazing sky. The hull is decorated with rusty chains, skulls, and diabolical runes pulsing with dark energy. Above the ship, sinister, red-orange storm clouds rage, crisscrossed by flashes of purple lightning.

On a jagged cliff of fiery, cracked lava stands a damned figure in a torn, coal-black robe, its face hidden beneath a hood. It gazes in desperate awe at the approaching hellship. The environment is filled with smoke, ash, and screaming shadows, while tormented souls swirl through the air in the distance like burning leaves.

Heaven appears like an open gate to hell—a maelstrom of fire, darkness, and pain. The entire composition is intended to evoke a sense of horror, damnation, and existential dread—as if this were the antechamber of an apocalyptic doom. Use high-resolution textures, dramatic lighting contrasts, and intense reds and blacks to maximize the destructive power and ominous atmosphere.

Bild 1 ist via ComfyUI, Bild 2 ist via Forge UI. Beides FLUX. Beide sind gut geworden, aber ComfyUI ist am Thema vorbei. WARUM ???
 

Anhänge

  • 001 - ComfyUI_00053_.png
    001 - ComfyUI_00053_.png
    2,4 MB · Aufrufe: 16
  • 002 - Forge UI 1610562302.png
    002 - Forge UI 1610562302.png
    1,6 MB · Aufrufe: 20
Zuletzt bearbeitet:
Weil du beim Comfi vermutlich keine lora festgelegt hast, das ist da wichtiger

Flux hat das meist integriert in dem Checkpoint, nutzt es je nach Eingabe aber nicht.
Deswegen arbeite ich mittlerweile fast nur noch mit zusätzlichen loras, die ich dann je nach Bedarf und Art ändere.
 
Zuletzt bearbeitet:
Weil du beim Comfi vermutlich keine lora festgelegt hast, das ist da wichtiger

Flux hat das meist integriert in dem Checkpoint, nutzt es je nach Eingabe aber nicht.
Deswegen arbeite ich mittlerweile fast nur noch mit zusätzlichen loras, die ich dann je nach Bedarf und Art ändere.
Das macht die Sache aber kompliziert. Woher weiß ich, welche Lora für "Bild 2" notwendig ist ?
 
Wenn ich mir die Prompts im Spoiler ansehe würde ich sagen, dir fehlt ein Lora welches "schiffe" darstellen kann.

Dazu nutze ich eigentlich immer CivitAI Loras und suche explizit nach den gewünschten Loras.
Gibt ja unendlich viele mittlerweile.

Deswegen ist Comfy etwas komplexer (wie ich oben schon sagte).
 
Zurück