L'azienda ha rilasciato un modello AI per la modifica delle immagini basato su comandi di testo

Sebbene non sia uno dei principali attori nel mondo dell’intelligenza artificiale oggi, il nuovo modello di intelligenza artificiale aperta di Apple per l’editing delle immagini potrebbe dare un contributo in questo campo. In questo modo, il percorso di Apple verso l’intelligenza artificiale sta migliorando e un modello chiamato MLLM-Guided Image Editing (MGIE) utilizza modelli linguistici multimodali di grandi dimensioni per interpretare i comandi di testo durante la modifica delle immagini. In altre parole, lo strumento ha la capacità di modificare le foto in base al testo inserito dall'utente.

Sebbene non sia il primo strumento a farlo, scrive, “le istruzioni umane a volte sono troppo brevi per catturare e monitorare i metodi attualmente disponibili”. Nel documento di progetto. Apple ha sviluppato MGIE in collaborazione con ricercatori dell'Università della California, Santa Barbara.

I modelli linguistici di grandi dimensioni hanno il potere di trasformare comandi di testo semplici o oscuri in istruzioni dettagliate e chiare che un editor di foto può seguire. Ad esempio, se un utente desidera che la foto di una pizza con peperoni sembri più sana, i modelli linguistici più ampi possono interpretarlo come “aggiunta di verdure” e modificare la foto di conseguenza.

Oltre ad apportare importanti modifiche alle foto, MGIE può ritagliare, ridimensionare e ruotare le foto, nonché migliorarne la luminosità, il contrasto e il bilanciamento del colore con comandi di testo. Può modificare parti specifiche della foto, ad esempio, cambiare i capelli, gli occhi e i vestiti della persona ritratta o rimuovere elementi dallo sfondo, cosa che piace a molti utenti di Instagram.

Apple ha rilasciato il modello Sulla piattaforma GitHubMa chi è interessato può provare solo la demo per ora, che è attualmente disponibile nel repository Git di Hugging Face Spaces.

READ  Drammatico avvertimento della NATO: cittadini, preparatevi per una guerra totale con la Russia

L’azienda deve ancora dire se intende utilizzare quanto appreso dal progetto come strumento o come funzionalità che potrebbe essere integrata in uno dei suoi prodotti, come l’iPhone, dove arriveranno ufficialmente le sue funzionalità AI di prossima generazione.

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *