Bilderthread Der K.I. Bilderthread

Darkearth27 · 15. Juli 2025

@binär-11110110111

Habe es gerade mal mit Flux getestet (nutze sonst immer SDXL)

Workflow sieht so aus

Erzeugtes Bild dann so:

Habe dazu deine Prompts 1:1 übernommen (C&P).

binär-11110110111 · 15. Juli 2025

Danke für die INFOs, schaue ich mir morgen mal an.
Anbei mal ein anderes Basismodell:
Cosmos Predict2 2B t2i - via ComfyUI - einfach über den Startworkflow zu installieren.

*

Darkearth27 · 15. Juli 2025

Ja, es kommt auf die "UI" an.

ComfyUI braucht oftmals sehr viel mehr input was genaue Beschreibung angeht.

Außerdem auf den Checkpoint / das Modell welches man nutzt.

Man kann mit den Loras auch übertreiben, dann wird einem nur Pixelmatsch ausgegeben.
So ganz verstanden habe ich es noch nicht, aber ich nutze "trigger" Wörter bei den Loras.

Bei vielen die man herunterladen kann sind vordefinierte Triggerwörter in der Beschreibung hinterleg. Das hilft wirklich ungemeint

binär-11110110111 · 16. Juli 2025

Es gibt noch ein stärkeres Modell von Nvidia.
cosmos_predict2_2B_t2i.safetensors - 3,8GB - gestern verwendet
cosmos_predict2_14B_t2i.safetensors - 27,8GB - heute verwendet (17 Milliarden Parameter).

*

binär-11110110111 · 16. Juli 2025

Ebenfalls mit cosmos_predict2_14B_t2i.safetensors - 27,8GB

Und einer WEBP Animation. Mehr Bewegung wollte irgendwie nicht ...

*

Darkearth27 · 21. Juli 2025

Eingebundener Inhalt

An dieser Stelle findest du externe Inhalte von Youtube. Zum Schutz deiner persönlichen Daten werden externe Einbindungen erst angezeigt, wenn du dies durch Klick auf "Alle externen Inhalte laden" bestätigst: Ich bin damit einverstanden, dass mir externe Inhalte angezeigt werden. Damit werden personenbezogene Daten an Drittplattformen übermittelt.
Für mehr Informationen besuche die Datenschutz-Seite.

Mal etwas "realitätsnäher".

Prompt für das ursprüngliche Bild:

A proud fisherman standing in a peaceful lake in the mountains, holding a 1-meter-long pike he just caught. The fisherman is dressed in weatherproof clothing, smiling widely. The background features a clear blue sky and majestic mountains, their reflection mirrored in the calm water. The atmosphere is tranquil, with gentle waves around the boat. The pike looks strong and vibrant, glistening in the sunlight.

Anschließend wieder mit Wan img2Vid animiert, diesmal aber einen Refiner, einen Detailer und einen Upscaler dazu genommen.

Das sieht man ganz besonders in den ersten paar Bildern, wie aus dem "Pike" der vorher eher weniger einer war, dann ein größerer sehr farbenfroher Hecht wird (etwas übertrieben).

Gesamtdauer von der Erstellung des Bildes bis zum Video waren circa 1 1/2 Stunden (mit neustarten der Workflows, da mir der VRAM ausging

)

Die Ki von Google macht es übrigens so:

‎Gemini – direkter Zugriff auf Google AI

Mit Gemini erstellt

gemini.google.com

Nachtrag:

Für die Erstellung zu Hause und für den eigenen Nutzen ist das mit Wan schon echt klasse.
Die Qualität von Online AI Generatoren wie z.B. das von Google, erreicht man natürlich nicht und auch nicht in der Geschwindigkeit und auch ohne Ton.

Dafür ist man allerdings frei in der Erstellung, da die Filter (verbotene Wörter) nicht vorhanden sind, welche die Onlineplattformen einbauen müssen.

Mein Fazit:

Ich brauche mehr VRAM

Cleriker · 21. Juli 2025

Das Google Ergebnis ist um Längen besser, muss man sagen.
Mehr vram? Hast du nicht schon eine 4090? Frisst das echt so viel?

Darkearth27 · 21. Juli 2025

Ja frisst. Und wenn man alles direkt in einem Rutsch abarbeiten will bräuchte man mindestens 96GiB an VRAM (mit / bei entsprechend hoher Qualität natürlich).

Das leeren vom Cache oder des VRAM (das bei mir nötig ist) macht es schwieriger direkt alles umzusetzen.

Und natürlich ist das Google Pendant besser, hat ja auch eine viel größere Rechenkapazität und entsprechend hohe eintrainierte Bilder in der Datenbank.

Cleriker · 22. Juli 2025

DAS wäre mal ein Einsatzgebiet für eine Radeon Pro SSG. Nur leider basiert die noch auf einer Radeon Fury, mit entsprechend wenig Dampf heutzutage.
Eine Neuauflage wäre cool.

Darkearth27 · 22. Juli 2025

Mi300

Aber ja, wenn man wirklich Videos erstellen möchte, die entsprechend hohe Qualität und Laufzeit haben, dann braucht man Unmengen an GPU Power.

Wenn man sich dann bei YT diese aufpolierten "Trailer" von angeblich bald kommenden Filmen ansieht, die KI erstellt sind (und auch noch echt super aussehen) dann will ich nicht wissen, was da für ein Stromverbrauch hinter steckt.

Für den Heimanwender der mal eben ein Bild aufpolieren will (alte Fotos digitalisieren und die Details verbessern etc) reicht das aber aus.

Man lädt ja ungern seine privaten Fotos zum verbessern hoch.

clown44 · 28. Juli 2025

Darkearth27 · 12. August 2025

Dragonball Super

Fusion von Goku und Vegeta durch Potara Ohrringe (Vegetto / Vegito) in "Reallife" Version.

Und weil das ganze mich ein wenig gewurmt hat, habe ich es in einer zweiten Version mit original Soundfile hinterlegt, leider ist die Soundfile zu kurz geraten.

Die Qualität ist jedenfalls angestiegen mit der neuen WAN 2.2 Version. Ich arbeite noch etwas dran und schaue mal was da noch so geht.

Eingebundener Inhalt

An dieser Stelle findest du externe Inhalte von Youtube. Zum Schutz deiner persönlichen Daten werden externe Einbindungen erst angezeigt, wenn du dies durch Klick auf "Alle externen Inhalte laden" bestätigst: Ich bin damit einverstanden, dass mir externe Inhalte angezeigt werden. Damit werden personenbezogene Daten an Drittplattformen übermittelt.
Für mehr Informationen besuche die Datenschutz-Seite.

binär-11110110111 · 1. September 2025

Leider ist nach einem Jahr meine RTX 4060 verstorben, Garantiegedöns ist angefragt...

Zum Glück hatte ich noch eine GTX 1650, welche aber im Vergleich selbst mit Juggernaut XL v12 extrem langsam ist.

Dennoch hier mal wieder ein "Lebenszeichen" von mir:

Promts: "Oil painting, a captivating cat figure made of shimmering amber, with delicate and intricate flowers perfectly integrated into her form. Her head is shaped like a fox's, exuding elegance and mystique. She has a voluptuous body with wide hips sculpted in graceful curves. Behind her, a bright, radiant light shines, casting a shimmering, ethereal aura around her translucent body of amber and flowers. The scene is enchanting and surreal, blending natural beauty with an air of divine radiance."

Olstyle · 2. September 2025

Hab mal wieder versucht meinen Avatar zu vervollständigen. Gemini hat den Körper aufgefüllt aber bei den Flügeln immer nur Mist produziert. Also die nachträglich mit Google Foto überarbeitet.

RyzA · 2. September 2025

Olstyle schrieb:
Hab mal wieder versucht meinen Avatar zu vervollständigen. Gemini hat den Körper aufgefüllt aber bei den Flügeln immer nur Mist produziert. Also die nachträglich mit Google Foto überarbeitet.Anhang anzeigen 1502883

Ist das eine Figur aus der griechischen Mythologie? Eine Frau die sich befreit?

Libertas – Wikipedia

de.wikipedia.org

Mit der "Libertas" hat das nichts zu tun oder?

Olstyle · 5. September 2025

RyzA schrieb:
Ist das eine Figur aus der griechischen Mythologie? Eine Frau die sich befreit?

Libertas – Wikipedia

de.wikipedia.org

Mit der "Libertas" hat das nichts zu tun oder?

Das Bild ist von folgendem Cover entliehen:

Libertad (Velvet Revolver album) - Wikipedia

en.m.wikipedia.org

Was sich wiederum an dieser Münze (optisch, nicht idealistisch) bedient hat:

Moneda de 10 Pesos (República) | SURDOC

www.surdoc.cl

Also Freiheit ist schon das Motiv.

RyzA · 6. September 2025

Olstyle schrieb:
Das Bild ist von folgendem Cover entliehen:

Libertad (Velvet Revolver album) - Wikipedia

en.m.wikipedia.org

Was sich wiederum an dieser Münze (optisch, nicht idealistisch) bedient hat:

Moneda de 10 Pesos (República) | SURDOC

www.surdoc.cl

Also Freiheit ist schon das Motiv.

Den Ursprung habe ich dann ja richtig erkannt!

binär-11110110111 · 6. September 2025

Leider läuft meine neue RTX 5060 (AT für meine verstorbene RTX 4060) NICHT mit Forge UI (welches übrigens seit Monaten leider nicht mehr weiter entwickelt wird). Daher muß ich mich nun mit ComfyUI anfreunden. Kennt jemand eine aktuelle kompatible Oberfläche auf Basis von A1111 ? Invoke.Community.Edition z.B. bietet nicht den vollen Funktionsumfang.

binär-11110110111 · 7. September 2025

So, bin fündig geworden. Für (schnelle) SDXL Bilder habe ich fooocusrtx508090 gefunden. Für FLUX und SD3.5 kann ich ComyUI verwenden. Anbei ein Fooocus Testbild via Juggernaut XL v12, saubere Arbeit, keine Übersättigung oder Pixelfehler. Läuft ! Testprompt: cat in garden.

binär-11110110111 · 10. September 2025

a detailed matte painting of a river running through a forest, magical forest background, by Thomas Kinkade, by mark keathley. Erstellt mit Juggernaut XL v12 via FooocusRTX50xx.

a detailed matte painting of a river running through a forest, magical forest background, by T...jpg

*

Bilderthread Der K.I. Bilderthread

BIOS-Overclocker(in)

Software-Overclocker(in)

BIOS-Overclocker(in)

Software-Overclocker(in)

Software-Overclocker(in)

Anhänge

BIOS-Overclocker(in)

PCGH-Community-Veteran(in)

BIOS-Overclocker(in)

PCGH-Community-Veteran(in)

BIOS-Overclocker(in)

Software-Overclocker(in)

BIOS-Overclocker(in)

Software-Overclocker(in)

Moderator

PCGH-Community-Veteran(in)

Moderator

PCGH-Community-Veteran(in)

Software-Overclocker(in)

Software-Overclocker(in)

Anhänge

Software-Overclocker(in)