Generazione immagini ML based a casa - "We have Midjourney at home", letteralmente

matsnake86 · March 21, 2024, 7:10pm

{
  "prompt": "(2d artwork, drawing), young male, fantasy character,  monk warrior , bald, black eyes, shaolin clothes, looking at viewer, hood, red tunic , collared shirt, cowboy shot, fantasy city streets",
  "seed": 94761692,
  "used_random_seed": true,
  "negative_prompt": "realistic, photograph,",
  "num_outputs": 1,
  "num_inference_steps": 25,
  "guidance_scale": 7,
  "width": 512,
  "height": 1024,
  "vram_usage_level": "high",
  "sampler_name": "dpmpp_sde",
  "use_stable_diffusion_model": "dreamshaper_8",
  "clip_skip": true,
  "use_vae_model": "",
  "stream_progress_updates": true,
  "stream_image_progress": false,
  "show_only_filtered_image": false,
  "block_nsfw": false,
  "output_format": "png",
  "output_quality": 95,
  "output_lossless": false,
  "metadata_output_format": "none",
  "original_prompt": "(2d artwork, drawing), young male, fantasy character,  monk warrior , bald, black eyes, shaolin clothes, looking at viewer, hood, red tunic , collared shirt, cowboy shot, fantasy city streets",
  "active_tags": [],
  "inactive_tags": [],
  "use_lora_model": "more_details",
  "lora_alpha": "0.5",
  "enable_vae_tiling": true
}

edit:

questo invece è come era impostato ED

Crius · March 21, 2024, 7:19pm

non so neanche dove dovrei infilare quel json

L’unica cosa che ho come UI e’ un pulsante per cui se scrivo tutto il papiello della configurazione nel prompt e poi premo

Imposta il resto da se ma sti cazzi perche’ tanto non saprei cosa scrivere di base la’ dentro, e’ buono giusto per copiare i prompt

btw, stavo cercando di usare la funzione train visto che ho una gozzilione di assets e volevo generarmene alcuni per delle mappe ma non c’e’ versi che veda l’embed generato. Ho letto che e’ una questione di versione del model ma se seleziono un model, vado su train, creo l’embed e poi faccio il train… dovrebbe crearlo della versione giusta no? WTF?

Cmq per l’uso che dovrei farne e’ ancora troppo esoso di tempo per impararlo. Cioe’ bazzico con nuove tecnologie ogni giorno dispari ma qua ho buttato tutto il giorno e piu’ che qualche immagine vagamente di quello che volevo non son riuscito a fare. Come vado per rinifire con l’img2img e compagnia bella, vien fuori il cazzo che gli pare.
Se provo a dare prompt piu’ precisi, non fa una sega o devi completamente. Se seleziono un seed per restare su quella creazione praticamente non cambia piu’ un cazzo, non importa cosa cambio nel prompt

Insomma, bella storia ma ancora siamo lontano dal “installa, smanetta e butta fuori quello che volevi”. Sopratutto perche’ c’e’ tutto un gergo da imparare nei prompt che varia da modello a modello, nei lora persino visto che dipende su che tag li hanno creati e trainati e in tutto questo ci sono i weigth che pure la’, mica e’ cosi ovvio come gestirli e che priorita’ gli viene assegnata.

Edit: dimenticavo. La maggior parte di chi ha un pc per giocare e quindi con piu’ probabilita’ una scheda grafica che puo’ far qualcosa, gira ancora oggi con una 1660 o al massimo una 3050.

Io sto con una 3070, mobile per carita’, quindi piu’ come se avessi una 2070 se non ricordo male, ma comunque stiamo a tempi di generazione troppo alti ancora. E assolutamente impossibile per chi avra’ schede ancora della generazione 16xx che, piaccia o meno, e’ la maggioranza. Mi ha colpito sta cosa perche’ diversi siti vedo che ripetono tipo sermone “democratizzare la generazione tramite AI” ma… mhm, famo’ che e’ un bel pensiero e basta per ora

Ripasso tra un annetto

Oath · March 21, 2024, 8:27pm

Si quello si. Mi pare che alla fine sono tutti wrapper per funzioni pitone sotto sotto e solitamente sono velocissimi ad implementare cose nuove ma non fanno un vero studio di ux dietro, piazzano due bottoni e go

Quando hai due gg liberi, Se ti gira automatic111 prova a installare confyui come estensione (dal tab estensioni di a1111); e’ una ui dove hai tutti vari nodi che puoi connettere per farti la tua pipeline, per cui boh una volta che hai capito come funziona ti puoi fare una pipeline tipo ‘genera foto di un duca conte’ prendi l output e lo passi al face swapper e ci metti la tua foto, prendi tutto e passi a un nodo che ti applica uno stile che vuoi etc etc

La cosa fica e’ che le info sui nodi vengono salvate con l’immagine nei metadata quindi se scarichi un immagine che ti piace fatta da qualcuno e la trascini nel browser ti apre il workflow col seed e tutti I settaggi

Oppure se trovi un immagine che hai fatto sei mesi fa

Oath · March 22, 2024, 12:11am

questi sono dei mostri che ho generato per una campagna di qualche gdr di un mio amico

https://imgur.com/a/IhWiu8I

setup assolutamente non ottimizzato (tipo i modelli stanno su un’altra partizione piu’ lenta etc etc) ci mette 30 secondi a generare un’immagine 4096 * 4096 (1024*1024 upscalata)

questo il workflow

workflow

perche’ quando masterizzavo 20 anni fa io ste cose non esistevano

Buccy · March 22, 2024, 1:34pm

Primi test con ComfyUI e AnimateDiff

Drest · March 22, 2024, 2:04pm

praticamente i sogni psichedelici di blade runner

con età che varia dai 12 ai 16 anni

Crius · March 22, 2024, 3:25pm

corteccia prefrontale etc etc

Drest · March 22, 2024, 3:31pm

quando si allunga il culo da una spalla comunque è veramente dreamlike

Oath · March 22, 2024, 3:40pm

daje

quando siamo almeno quattro as usare comfyui apriamo il thread per scambiarci i workflow

Oath · March 22, 2024, 3:41pm

semi ot - potenziale per contest/trivia su musica?

Oath · March 22, 2024, 4:16pm

Ps: fatti on the fly con random seed, sparate altre copertine e un prompt che ho il pomeriggio libero prima che si sveglia il nano

char · March 22, 2024, 4:33pm

questa al tempo era la grossa differenza tra A1111 e SHARK, fare un workflow col secondo era impossibile ed invece è quello il sistema per avere roba carina

Buccy · March 23, 2024, 8:47pm

Bello questo effetto: Embers SDXL & SD1.5 - SDXL | Stable Diffusion LoRA | Civitai