L’ultimo sistema di intelligenza artificiale text to image che è finito sulla bocca di tutti è Midjourney. Vi sarà sicuramente capitato di imbattervi in Papa Francesco con il giubbotto modello Moncler e nelle immagini dell’arresto di Trump e Putin. Questa carrellata di fotografie è stata generata tramite Midjourney, ha ingannato molti ma – soprattutto – ha aperto un ulteriore dibattito sull’ennesimo sistema che, grazie all’intelligenza artificiale, è riuscito a creare immagini che appaiono sempre più reali (con tutti i rischi che ne derivano a partire dalla generazione di fake news che potrebbero diffondersi a macchia d’olio in pochissimo tempo). Come funziona Midjourney e quali sono Stable Diffusion, altro modello per generare immagini a partire dal testo di cui avevamo già parlato nell’approfondimento dedicato a Lensa AI.

Come funziona Midjourney?

Questi strumenti permettono di generare opere d’arte d’effetto tramite l’inserimento di un prompt (una stringa di testo inserita come input). Midjourney è stato rilasciate a luglio 2022 da Midjourney, Inc. – società di ricerca indipendente che ha sede a San Francisco – e permette la realizzazione di immagini iper realistiche.

Scrivendo quello che si vuole vedere, quindi, la foto generata è quanto di più simile a uno scatto di realtà che si può ottenere attualmente. Come si usa Midjourney? Per ora l’accesso si limita a un bot su Discord, quindi occorre iscriversi al server Discord di Midjourney e accedere alla versione Beta. Una volta entrati nel sistema, è possibile unirsi a uno dei canali “newbies” in cui si può imparare a utilizzare lo strumento.

Una volta inserita la descrizione, il bot di Midjourney si prende circa un minuto per generare quattro diverse immagini a partire dalla stringa di testo inserita. Ognuna di queste può essere selezionata e possono essere operate delle variazioni. Una volta scelta l’immagine che più piace, chi l’ha generata può lasciare la propria opinione tramite un voto e ottenere la possibilità di creare altre immagini gratuitamente.

Ci sono una serie di piani di abbonamento disponibili che danno la possibilità di generare più immagini o di sbloccare funzioni avanzate.

Le differenze tra Midjourney e Stable Diffusion

Si tratta di strumenti simili che permettono di fare la stessa cosa (generare immagini realistiche) nello stesso modo (scrivere un testo che descriva l’immagine che viene generata) e le differenze individuabili sono, perlopiù, su un piano di tecnico e di funzionamento. Stable Diffusione offre una personalizzazione dei prodotti generati e una possibilità di variarli maggiori rispetto a Midjourney che, però, sembra generare immagini di qualità superiore.

Ci sono esperti che li stanno testando che sostengono – come riporta Digital Trends in un approfondimento dedicato – che inserendo i giusti input in Stable Diffusion, anche questo algoritmo è in grado di generare immagini altrettanto realistiche e di qualità alta.

Al di ciò che permettono di fare o non fare, c’è anche da dire che Stability AI ha reso disponibile il codice sorgente di Stable Diffusion (non open source) mentre Midjourney no, essendo interamente proprietario. Ci sono ipotesi relative al fatto che Midjourney possa basarsi, in qualche modo, su Stable Diffusion.