Anche ad Agosto l'AI non si ferma!

OpenAI si smaschera da sola? Midjourney 6.1 rilasciato e Figure 02 in arrivo..

 📰 News della settimana

0.1  OpenAI sta valutando se rilasciare uno strumento per rilevare il testo generato da ChatGPT

OpenAI ha dichiarato ufficialmente di avere a disposizione uno strumento per identificare in modo sicuro e inequivocabile il testo generato dall'intelligenza artificiale, in particolare dal suo servizio ChatGPT.
Il tool, che funziona come una sorta di watermark o filigrana digitale, è già pronto da circa un anno e ha un tasso di efficacia del 99,9% sul testo grezzo non rimaneggiato. Tuttavia, non è ancora chiaro se sarà diffuso pubblicamente.

Dalle scorciatoie per studenti ai rischi per il giornalismo e la ricerca

Con l'avvento degli strumenti di AI generativa, sta diventando sempre più facile e immediato ottenere interi testi pronti all'uso. Una scorciatoia che viene sfruttata non solo dagli studenti, ma anche da siti di news che devono produrre decine di articoli ogni giorno, da giornalisti pigri e persino da ricercatori per i paper scientifici.
Anche se i risultati spesso generano errori grossolani, gli strumenti di AI generativa dedicati al testo possono lasciare tracce del proprio lavoro, proprio come quelli che creano immagini o video.

OpenAI valuta i rischi del rilascio pubblico

L'attesa per il rilascio dello strumento di rilevamento è spiegata da un portavoce di OpenAI a Techcrunch: "Il metodo che stiamo sviluppando è tecnicamente promettente, ma presenta rischi importanti che stiamo soppesando mentre ricerchiamo alternative, tra cui la suscettibilità all'elusione da parte di malintenzionati e l'impatto sugli ecosistemi esterni a ChatGPT".
Oltre a questioni etico-tecnologiche, c'è anche un pericolo molto più pratico: un recente sondaggio ha rivelato che un terzo degli attuali utenti più attivi potrebbe abbandonare ChatGPT nel caso in cui il tool di rilevamento fosse diffuso.

La questione del rilevamento del testo generato dall'AI solleva interrogativi importanti sul futuro dell'istruzione, del giornalismo e della ricerca scientifica. Da un lato, uno strumento come quello di OpenAI potrebbe aiutare a smascherare i "furbetti"; dall'altro, potrebbe anche scoraggiare l'uso legittimo di questi strumenti e spingere gli utenti verso alternative meno trasparenti.

0.2  Figure, startup sostenuta da OpenAI, presenta il nuovo robot umanoide "Figure 02"

La corsa per portare robot umanoidi guidati dall'intelligenza artificiale nelle case e nei luoghi di lavoro di tutto il mondo ha preso una nuova piega oggi, quando Figure, una società sostenuta tra gli altri da OpenAI con 675 milioni di dollari nell'ultimo round di febbraio, ha pubblicato un video trailer per il suo nuovo modello: Figure 02, insieme alla data del 6 agosto 2024.

Come vedrai nel video, è scarso di dettagli ma ricco di atmosfera e primi piani, mostrando viste di quelli che sembrano essere giunti e arti robotici, così come alcuni interessanti design a rete, forse flessibili, per il corpo del robot. Sono visibili anche etichette per valori di coppia fino a 150Nm e "ROM", che interpreto come "range of motion" fino a 195 gradi (su un totale di 360).

Sostenuto da grandi nomi della tecnologia e dell'AI

Figure AI è stata fondata nel 2022 da Brett Adcock, un imprenditore che in precedenza aveva fondato le startup futuristiche Archer Aviation e il marketplace per le assunzioni Vettery. A marzo 2023, Figure è emersa dalla modalità stealth per presentare Figure 01, un robot umanoide ideato per affrontare la carenza di manodopera globale svolgendo compiti in vari settori come produzione, logistica, magazzinaggio e vendita al dettaglio.

Con un team di 40 esperti del settore, tra cui il Dr. Jerry Pratt come CTO, Figure AI ha completato la costruzione a grandezza naturale dell'umanoide in soli sei mesi. Adcock immagina che i robot miglioreranno la produttività e la sicurezza assumendosi lavori pericolosi e indesiderabili, contribuendo in definitiva a un futuro più automatizzato ed efficiente, pur mantenendo che non saranno mai armati.

La società, che oltre a OpenAI ha tra i suoi investitori e sostenitori NVidia, Microsoft, Intel Capital e Bezos Expeditions (il fondo privato del fondatore di Amazon Jeff Bezos), ha stretto un accordo con BMW Manufacturing all'inizio di quest'anno e ha mostrato impressionanti integrazioni con il modello di visione GPT-4V di OpenAI all'interno del robot Figure 01, prima del rilascio dei nuovi modelli di punta di OpenAI, GPT-4o e GPT-4o mini. Presumibilmente, Figure 02 avrà uno di questi nuovi modelli OpenAI a guidare i suoi movimenti e le sue interazioni.

La competizione per la robotica umanoide si intensifica

Figure è stata un po' tranquilla ultimamente, anche mentre altre aziende debuttano e mostrano design per robot umanoidi infusi di AI che sperano assisteranno gli umani in ambienti come magazzini, fabbriche, impianti industriali, case di riposo, punti vendita, strutture sanitarie e naturalmente, anche case nelle nostre abitazioni.

Anche se i robot umanoidi sono stati a lungo una chimera nelle storie di fantascienza, il loro debutto come prodotti commerciali è stato lento e segnato da design costosi riservati esclusivamente agli ambienti di ricerca. Ma questo sta cambiando grazie all'AI generativa e più specificamente ai grandi modelli linguistici (LLM) e ai modelli di AI multimodale, che possono analizzare rapidamente input video e audio in tempo reale e rispondere con audio e movimenti propri simili a quelli umani.

Infatti recentemente Elon Musk ha dichiarato con la sua tipica spavalderia che c'è un mercato per più di 10 miliardi di robot umanoidi sulla Terra (più di uno per ogni persona) e che spera di comandare o almeno di prenderne una fetta importante con la sua azienda di auto elettriche e AI Tesla Motors (che sta realizzando un robot umanoide rivale di Figure chiamato Tesla Optimus).

Sembra che la corsa ai robot umanoidi guidati dall'AI si stia scaldando, con Figure che si posiziona come un serio contendente grazie al sostegno di grandi nomi come OpenAI. Sei curioso di vedere cosa sarà in grado di fare Figure 02 quando sarà svelato ad agosto?

0.3 Groq, la startup di AI, raccoglie 640 milioni di dollari per sfidare il dominio di Nvidia nei chip per l'intelligenza artificiale

La startup di chip e software per l'intelligenza artificiale Groq Inc., fondata nel 2016 da Jonathan Ross, ha raccolto ben 640 milioni di dollari nel suo ultimo round di finanziamento. Il round è stato guidato dai fondi di BlackRock Inc. e supportato dai fondi d'investimento di Cisco Systems Inc. e Samsung Electronics Co. Grazie a questo investimento, l'azienda è ora valutata 2,8 miliardi di dollari.

LPU: i chip specializzati per i modelli linguistici

Ross, che in precedenza aveva lavorato sui chip TPU di Google, sta sviluppando con Groq hardware specializzato per applicazioni di intelligenza artificiale, in particolare quelle che migliorano gli attuali modelli “di fondazione” come i modelli linguistici. L'azienda ha sviluppato i cosiddetti LPU (Language Processing Units), ottimizzati per l'esecuzione di modelli linguistici. Questi chip possono raggiungere velocità di migliaia di token al secondo, anche con modelli più grandi come Llama 2 70B di Meta, equivalenti a centinaia di parole al secondo. Questa velocità rende l'hardware attraente per le applicazioni in tempo reale, capacità sempre più richiesta dagli sviluppatori. Allo stato attuale anche l'hardware di Nvidia raggiunge questa velocità, seppur a prezzi significativamente più alti.

Più efficienti e senza colli di bottiglia

Secondo Groq, gli LPU sono più efficienti dal punto di vista energetico rispetto alle tradizionali schede grafiche (GPU) in quanto riducono l'overhead per la gestione di più thread ed evitano il sottoutilizzo dei core. Il design dei chip di Groq consente anche di collegare più CPU core senza i tradizionali colli di bottiglia che si verificano nei cluster di GPU.

L'hardware di Groq potrebbe quindi fornire un'alternativa ai chip attualmente molto richiesti di Nvidia, ma solo per l'inferenza, cioè l'esecuzione dei modelli di AI. Le aziende hanno sempre più bisogno di hardware o di chip simili per l'addestramento dei loro modelli. Ad esempio, Meta prevede di addestrare Llama 4 con una potenza di calcolo dieci volte superiore a quella utilizzata per Llama 3.

Insomma, sembra che la corsa ai chip per l'intelligenza artificiale si stia scaldando, con Groq che si posiziona come un potenziale rivale di Nvidia grazie ai suoi LPU specializzati. Certo, l'azienda dovrà ancora dimostrare di poter competere con il colosso dei chip in termini di prestazioni e adozione da parte del mercato, ma questo round di finanziamento da record è sicuramente un buon punto di partenza. Tu cosa ne pensi? Credi che Groq possa davvero sfidare il dominio di Nvidia nel settore dei chip per l'AI?

🔧 AI Tools

1.1 Midjourney V6.1: un aggiornamento per immagini più belle e coerenti

Dopo più di sei mesi dall'ultimo aggiornamento, Midjourney ha rilasciato un nuovo modello per la generazione di immagini. Anche se non si tratta di un salto enorme, la versione 6.1 promette risultati più coerenti, dettagliati e visivamente accattivanti rispetto alla V6, rilasciata a fine dicembre.

Qualità delle immagini migliorata su tutta la linea

Secondo il changelog, V6.1 offre una qualità delle immagini significativamente migliore nel complesso, con meno artefatti e texture perfezionate. Il CEO di Midjourney, David Holz, evidenzia i miglioramenti nella resa della pelle e nella pixel art a 8 bit; inoltre la generazione standard delle immagini è il 25% più veloce.
L'aggiornamento si concentra nel migliorare problematiche ben note agli sviluppatori come braccia, gambe e mani, così come le rappresentazioni di piante e animali. I piccoli dettagli delle immagini come occhi, piccoli dettagli dei volti e mani sono ora più dettagliati e accurati. L'aggiornamento introduce anche nuovi strumenti di upscaling.

Testo più accurato e personalizzazione migliorata

La precisione del testo è stata migliorata, soprattutto quando diamo indicazioni sul testo all’interno dei nostri prompt. In un rapido confronto, V6.1 ha mostrato prestazioni migliori, anche se non ancora impeccabili.
Inoltre aggiungendo il nuovo parametro --q 2, può aggiungere più dettagli e texture all’immagine ma richiede il 25% di tempo in più per generazione.

Holz inoltre ha dichiarato che: "Le cose dovrebbero sembrare 'generalmente più belle' in tutti i sensi".
Va notato che Midjourney V6.1 non offre attualmente un modello di inpainting/outpainting, quindi funzionalità come zoom, riformulazione, ridipintura e variazione di regione richiedono ancora il modello V6.0.

1.2 Gli ex sviluppatori di Stable Diffusion lanciano Flux, un nuovo modello di immagini che sfida Midjourney

C'è una nuova realtà nel panorama dell'intelligenza artificiale generativa: Black Forest Labs. Questa startup, fondata da ex sviluppatori di Stability.ai, mira a creare modelli all'avanguardia per la generazione di immagini e video. La loro prima famiglia di modelli Flux.1, promette di stabilire nuovi standard nella generazione di immagini da testo.

Un team di talenti con un curriculum impressionante

Con sede a Friburgo in Germania, Black Forest Labs è stata formata da ricercatori e sviluppatori di AI che in precedenza avevano lavorato su Stable Diffusion e altri modelli di AI generativa presso Stability.ai. Il team ha lasciato Stability.ai in primavera e da allora ha raccolto 31 milioni di dollari in finanziamenti seed, con Andreessen Horowitz a guidare il round e la partecipazione di investitori di molti altri investitori entusiasti del progetto.

I fondatori della startup hanno un curriculum impressionante, avendo contribuito a innovazioni come VQGAN, Latent Diffusion, Stable Diffusion XL, Stable Video Diffusion, Rectified Flow Transformers e Adversarial Diffusion Distillation per la sintesi di immagini in tempo reale.

Flux "Pro": un nuovo stato dell'arte nella generazione di immagini da testo

Per segnare il lancio, Black Forest Labs ha rilasciato la suite di modelli text-to-image Flux.1. L'azienda afferma che questi modelli "definiscono un nuovo stato dell'arte in dettaglio delle immagini, aderenza al prompt, diversità di stile e complessità della scena per la sintesi text-to-image" e la startup sembra fiduciosa di essere molto avanti rispetto alla concorrenza.
Tutti i modelli Flux.1 supportano la creazione di immagini con in diversi formati e con risoluzioni che vanno da 0,1 a 2,0 megapixel. Secondo Black Forest Labs, Flux.1 [pro] e [dev] superano i modelli popolari come Midjourney v6.0, DALL-E 3 (HD) e SD3-Ultra in qualità visiva, fedeltà ai prompt degli utenti, opzioni di personalizzazione di dimensioni/aspetto, capacità di resa dei testi e versatilità di output. Flux.1 [schnell] (che significa "veloce") è stato dichiarato come il modello più veloce della famiglia, superando alcuni dei suoi concorrenti e non arrivando distante rispetto ai performanti modelli di Midjourney.
Black Forest Labs prevede di rilasciare modelli text-to-video come prossimo passo, promettendo "creazione e modifica precise ad alta definizione e velocità senza precedenti". Staremo a vedere!

 🎨 Approfondimento

2.1 L'AI generativa usata principalmente per aumentare efficienza e produttività, secondo uno studio

Un recente studio di Deloitte ha rivelato che le aziende stanno attualmente utilizzando l'intelligenza artificiale generativa principalmente per aumentare l'efficienza e la produttività. Il sondaggio, che ha coinvolto più di 2.800 manager di 16 paesi, ha evidenziato che il 56% vuole utilizzare questa tecnologia per migliorare le performance, mentre il 35% ha citato la riduzione dei costi come obiettivo.

Aspettative alte, ma attenzione alla realtà

L'impatto dell'intelligenza artificiale (IA) generativa sulle aziende si prospetta estremamente positivo, con il 91% dei manager che prevede un aumento della produttività grazie a questa tecnologia. Questo dato riflette le grandi aspettative riposte nell'IA dal management, sebbene queste potrebbero non concretizzarsi pienamente nel breve termine.

I benefici legati all'innovazione e alla crescita sembrano giocare un ruolo secondario, attestandosi intorno al 29%. Gli autori dello studio interpretano questo fenomeno come tipico dell'introduzione di nuove tecnologie: inizialmente, l'attenzione si concentra sul miglioramento incrementale dei processi esistenti, per poi evolvere verso applicazioni più complesse e trasformative.

Attualmente, la maggior parte delle aziende si affida a soluzioni IA pronte all'uso. Il 71% utilizza applicazioni di produttività con IA generativa integrata, mentre il 68% ricorre ad applicazioni IA standard. Solo una minoranza impiega soluzioni specializzate come applicazioni specifiche per il settore (23%) o modelli open-source adattati (25%).

Lo studio evidenzia anche carenze nella preparazione all'uso diffuso dell'IA generativa. Il 41% degli intervistati ha dichiarato che la propria azienda era solo marginalmente o per nulla preparata ad affrontare le questioni relative al talento associate a questa tecnologia. Una percentuale analoga riconosce la necessità di colmare lacune in termini di governance e gestione del rischio.

Nonostante queste sfide, l'entusiasmo per l'IA generativa rimane elevato. Il 62% dei manager ha indicato l'entusiasmo come l'emozione predominante associata a questa tecnologia, e il 79% si aspetta che l'IA generativa trasformi sostanzialmente la propria azienda e il proprio settore nei prossimi tre anni.

Tuttavia, lo studio mette in luce anche il potenziale impatto sociale dell'IA generativa. Il 52% degli intervistati prevede che questa tecnologia centralizzerà il potere nell'economia globale, mentre il 51% ritiene che aumenterà le disuguaglianze economiche. Inoltre, il 49% teme che la fiducia nelle istituzioni nazionali e globali possa erodersi a causa dell'IA generativa.

Di fronte a queste sfide, molti dirigenti chiedono una maggiore regolamentazione e cooperazione globale. Il 78% degli intervistati sostiene un incremento della regolamentazione governativa, mentre il 72% rileva una mancanza di cooperazione globale nello sviluppo responsabile dei sistemi di IA.

In conclusione, l'IA generativa sembra essere percepita come un'arma a doppio taglio: da un lato, promette di aumentare l'efficienza e la produttività delle aziende; dall'altro, presenta rischi non trascurabili per la società e richiede un approccio più regolamentato e collaborativo a livello globale.

Scopri l’Academy di Imparerai e tutte le risorse che abbiamo preparato per te!

Scopri i migliori Tool di AI selezionati per te!

Vuoi contattarci? Non aspettiamo altro!

Sei arrivato alla fine!

La tua razione è completa!

Il tuo feedback è importante! Rispondi a questa email e raccontaci come potremmo migliorare questa newsletter.

Sei interessato a raggiungere i nostri lettori? Per diventare uno sponsor di Imparerai, scrivici qua!