Contest - Wall-E 2

sto provando i miei soliti prompt e mi sembra ci sai un peggioramento sui disegni o perlomeno non riesco ad ottenere precisamente quello che voglio.

“realistic fish eye distorted ink drawing of a crow in flight over a Japanese city, the image is wide angle, 16mm lens, the image is centered on the crow’s eye while the landscape in the background is curved and distorted by the wide lens angle”

bella la terza zampa.

se provo a forzare lo stile prende un aspetto molto “cartone animato”

Provato Ideogram 2. Per alcuni utilizzi specifici è un salto avanti notevole, ma ho notato evidenti peggioramenti nell’aderenza al prompt e soprattutto meno elasticità nello stile. Per il fotorealismo va benissimo, per tutto il resto la versione 1 rimane imho migliore.

1 Like

Mai piaciuto ideogram. Bing secondo me resta il migliore.

non io che aspetto dall-e 4 :asd:

Bing? Ma non usa ancora DALL-E come generatore di immagini? A meno che non mi sia perso qualcosa, DALL E è indietro rispetto a Ideogram su tutti i fronti, praticamente è un paio di generazioni in ritardo.

Ora controllo perché non ho usato il generatore IA di Bing negli ultimi mesi, ma che io sappia non era nemmeno paragonabile.

EDIT: Ma in che senso Bing è il migliore, ho appena testato :asd:

Ideogram

Bing con DALL E 3

Che vuoi che ti dica, Bing risponde meglio ai prompt, secondo me, e se insisti sugli stessi comandi mantiene una maggiore coerenza e somiglianza nella generazioni di ambienti e personaggi. Ideogram commette ancora troppe imperfezioni. Fisionomie stravolte. Io ci gioco per creare sceneggiature per videoclip amatoriali e mi trovo meglio con bing. Poi a livello professinale non so esprimermi, ma bing tutta la vita. Ps ideogram però va forte sulle scritte in italiano, questo si.

Mah, onestamente sulle fisionomie stravolte non direi, dipende da quanti personaggi metti in gioco. Oltre un certo numero di persone nell’immagine comincia a dare un po’ di matto, questo si. Però i volti, la pelle, in genere le texture di Ideogram sono una spanna sopra (e con Ideogram 2 anche 2 spanne sopra) a Bing, che ha sempre quell’effetto “finto”, “iperfiltro di Instagram”.

Va detto anche che Ideogram ha un modo peculiare di rispondere ai prompt che ancora non è chiaro dato che gli sviluppatori stessi non hanno svelato troppo come lavora dietro le quinte. Di sicuro c’è che disattivare il prompt magic è imperativo per l’aderenza alla richiesta se si vuole qualcosa di preciso, dato che cambia un po’ troppo le carte in tavola. Invece quando si vuole andare su qualcosa di generico, il prompt magic aiuta a tirare fuori idee.

Considerato anche la libertà di formato, la presenza del negative prompt e le funzioni di remix e upscale, per me (sì, a livello semiprofessionale comunque) non c’è partita. Poi ognuno ha esigenze diverse e quindi ci sta che ci sia chi preferisce Bing, ma per me è inferiore come output e limitante come opzioni (anzi, assente).

Per sceneggiature potresti ipotizzare Runway 3 Alpha, costicchia qualcosina ma il prompt to video comincia ad essere interessante, soprattutto se si parte da una foto (la capacità di mappare la profondità e la coerenza nelle prospettive sono già ad un livello pazzesco, con un numero di artefatti incredibilmente ridotto rispetto al modello 2).

1 Like

Al momento trovo ancora impossibile generare una sceneggiatura coerente, ma dalla mia esperienza bing funziona molto meglio. Parliamo di prodotti amatoriali, ok, ma tant è, ideogram stravolge tutto ad ogni prompt. Bing, ad es, se utilizzato in modalita fumetto ( na non solo) riesce, con ripetuti tentativi, a garantire una simil coerenza dei personaggi immaginati. Ideogram tuttavia ha meno blocchi di censura per immagini ritenute sediziose o violente e tutto sommato spoglia di più le donne :). Il salto della rana potrebbe avvenire con Sora, ma anche li tutto da decifrare. Da tecnico montatore video mi si puo aprire un mondo, ma le variabili restano al momento oscure… Sora garantirà un minimo di free credits? Ne dubito. Prima di abbonarmi, vorrei testarlo come si deve, perchè resto comunque diffidente sui prodotti finali delle IA, nonostante ci smanetti di continuo.

Cercherò info su Runway 3 grazie della dritta.

Non so dirti, onestamente per quanto mi riguarda Ideogram (1.0, il 2 è un discorso un po’ a parte) risponde abbastanza bene ai miei prompt, è tutta una questione di capire cosa dirgli e come dirglielo. Per esempio ho notato che, forse perché risparmiano risorse così, se rifai lo stesso prompt senza remix, è comunque altamente probabile che otterrai un risultato molto ma molto simile, come se si basasse comunque sul seed precedente.

Non so, magari ti capita di avere il prompt magic attivo di default e quindi ti modifica tutti i prompt, prova a disattivarlo. Quanto allo stile, in basso nella finestra del prompt ci sono i bottoni dello stile, puoi attivarne diversi e vedere il risultato (tipo anime + illustration dovresti andare molto vicino allo stile da fumetto).

Altra cosa che Ideogram ha e Bing no è il Remix, che ti consente a partire da un’immagine che hai prodotto di farne una molto simile, correggendo un po’ di dettagli. Spesso dopo un paio di tentativi ottieni quello che cercavi.

Comunque, è tutto un imho alla fine. DALL E3 l’ho usato tanto, ma non mi risponde mai in modo davvero aderente a ciò che voglio. Con Leonardo avevo ottenuto buoni risultati, ma non ha un buon understanding del prompt e devi costruirglielo a blocchi come per SD: una discreta rottura di scatole se si cercano certi specifici dettagli in certe specifiche posizioni.

Parere mio, potresti dare qualche altra chance a Ideogram 1.0 (il 2 è acerbo ancora, dato che si basa su un modello diverso), fai qualche prova con i modificatori di stile e il negative prompt. Puoi anche dare ulteriore risalto ad alcuni dettagli usando prima un hashtag (sicuramente è stato trainato su Instagram o database social). Tanto ci sono 20 crediti gratis al giorno, si può testare parecchio.

1 Like

Grazie dei suggerimenti. Farò delle prove.

pensavo fosse un po’ una cagata, ma a quanto pare, leggendo un articolo, freepik ha un buon modello di generazione.
sicuramente anche un articolo marchetta, ma gli esempi non erano male.

https://twitter.com/freepik/status/1829087588222738843

non so dove metterlo ma intanto lo appiccio qua

bella segnalazione, ho provato un paio di miei prompt vecchi, buona qualità direi ai livelli di leonardo e meno censure di bing e una velocità impressionante anche con il free tier.

bisognerebbe aprire un nuovo topic “news” con la situazione

1 Like

Ok Freepik potrebbe essere fonte di LulZ

Ma nella quarta è chiaramente Luttazzi

però vedo solo fps

ma quelli che commentano lo sanno che è generata dalla ai? oppure sono così rinco?

è pieno di rincoglioniti. lo fanno anche nei profili dove nella bio c’'è scritto chiaro che è ai generated