Imparerai Newsletter
Posts
Notizie Fresche dal Mondo dell'AI!

Notizie Fresche dal Mondo dell'AI!

L'AI rivoluziona i Videogiochi? Arrivano i Google GEMS e nuove indiscrezioni sul nuovo modelli di ChatGPT!

Giovanni Meroi
3 settembre 2024

Le tue "Razioni" di AI 🥫

📰 News della settimana
🔧 AI Tools
- 1.1 Midjourney Svela i Piani per un Modello di gen …
- 1.2 Google Potenzia Gemini con Chatbot Personalizz …
🎨 Approfondimenti
- 2.1 Strawberry AI di OpenAI: Il Segreto Dietro il …
💡 Link Utili

📰 News della settimana

0.1 GameNGen di Google: L'AI che Rivoluziona lo Sviluppo dei Videogiochi Simulando DOOM in Tempo Reale

Un sistema di intelligenza artificiale sviluppato da Google è ora in grado di simulare DOOM in tempo reale, aprendo nuove e entusiasmanti prospettive per lo sviluppo di videogiochi. Ricercatori di Google Research, Google DeepMind e dell'Università di Tel Aviv hanno creato GameNGen, un sistema di AI capace di simulare completamente e riprodurre il classico gioco DOOM in tempo reale. Questa innovazione potrebbe spianare la strada a una nuova era di sviluppo di giochi assistito dall'AI.

GameNGen dimostra prestazioni impressionanti, riuscendo a simulare DOOM a oltre 20 fotogrammi al secondo su un singolo chip TPU di Google.

Un Processo di Addestramento in Due Fasi
Il sistema è stato addestrato seguendo un processo in due fasi:

Un agente AI ha imparato a giocare a DOOM, da sessioni di gameplay registrate.
Un modello di diffusione è stato addestrato a generare l'immagine successiva sulla base delle immagini e delle azioni precedenti.

GameNGen è in grado di eseguire complessi aggiornamenti dello stato di gioco, tra cui tenere traccia della salute e delle munizioni, la raccolta di armi, l'attacco ai nemici, il danneggiamento di oggetti e l'apertura di porte. Può mantenere lo “stato” di gioco per periodi prolungati, con i ricercatori che hanno dimostrato clip della durata di circa 2 minuti e mezzo.

Nonostante le sue impressionanti capacità, il sistema presenta alcune limitazioni: la sua "memoria" è limitata a circa 3 secondi, il che significa che non può tenere conto di eventi accaduti più di 3 secondi prima. Questo limita notevolmente la sua capacità di riconoscere e rispondere a relazioni a lungo termine nel gioco, ma teniamo conto che questo è solamente l’inizio.

I ricercatori considerano GameNGen un passo importante verso un nuovo paradigma, in cui i giochi potrebbero essere generati automaticamente da modelli neurali. Tuttavia, rimangono domande su come addestrare tali game engine neurali e creare giochi in modo efficace.

Un Futuro Entusiasmante per lo Sviluppo dei Videogiochi

GameNGen segna l'inizio di una nuova era in cui i giochi possono essere creati e alimentati dall'intelligenza artificiale senza alcuna capacità di programmazione tradizionale. L'impatto potenziale di questo game engine AI sull'industria dei videogiochi da 200 miliardi di dollari è immenso, poiché potrebbe ridurre drasticamente i tempi e i costi di sviluppo, democratizzando al contempo la creazione di giochi.

Con ulteriori progressi nella tecnologia AI, possiamo aspettarci di vedere un'esplosione di esperienze di gioco innovative e coinvolgenti generate dall'AI nei prossimi anni.

0.2 I Giganti del Web Bloccano l'AI di Apple per Proteggere i Propri Contenuti

Numerosi siti web di grande rilevanza stanno adottando misure per impedire all'intelligenza artificiale di Apple di accedere ai loro contenuti, costringendo così l'azienda di Cupertino a intavolare negoziazioni per accordi di licenza. Questa situazione si pone in netto contrasto con l'approccio di Google, che sfrutta la sua posizione dominante nel mercato per esercitare pressione sugli editori affinché consentano l'accesso all'AI.

Un'indagine condotta da WIRED ha rivelato che piattaforme di primo piano come Facebook, Instagram, Craigslist e Tumblr, insieme a testate giornalistiche del calibro del New York Times, Financial Times e The Atlantic, nonché gruppi editoriali come Vox Media, USA Today Network e Condé Nast, figurano tra coloro che stanno attivamente bloccando i crawler di addestramento dell'AI di Apple. È interessante notare che alcuni di questi editori hanno già stretto accordi con OpenAI.

Applebot-Extended: Il Nuovo Crawler nel Mirino degli Editori

Apple ha recentemente introdotto Applebot-Extended, un nuovo crawler che gli operatori di siti web possono bloccare tramite il file robots.txt. Secondo l'analisi di Wired, circa il 7% dei 1.000 siti web esaminati attualmente blocca questo crawler AI. Un'indagine separata condotta dal giornalista Ben Welsh ha rilevato che 294 su 1.167 pubblicazioni, principalmente statunitensi in lingua inglese, bloccano Applebot-Extended.

È importante sottolineare che anche altre aziende del settore, come Anthropic, OpenAI e Google, stanno affrontando problematiche simili. In particolare, OpenAI sta sperimentando tassi di blocco ancora più elevati per il suo crawler.

Google Fa Leva sul Suo Dominio nella Ricerca

Apple e OpenAI necessitano di dati di addestramento di alta qualità e notizie aggiornate per i loro prodotti AI, e di conseguenza dipendono da accordi di licenza con i principali siti web ed editori. Mentre OpenAI ha già assicurato alcuni accordi, Apple sarebbe in fase di trattative, ma non ha ancora annunciato alcuna intesa ufficiale.

Google, d'altra parte, adotta un approccio differente. L'azienda sta sfruttando la sua posizione dominante nei motori di ricerca per fare pressione sugli editori: consentire l'accesso all'AI o rischiare una minore visibilità nei risultati di ricerca.
Considerando l'enorme volume di ricerche giornaliere su Google, il costo di tali accordi sarebbe probabilmente molto elevato per gli editori, mettendoli in difficoltà a causa della già ridotta quantità di visite dovuta all'uso crescente dei modelli di linguaggio.

0.3 Un Nuovo Round di Finanziamento Potrebbe Valutare OpenAI Oltre i 100 Miliardi di Dollari

OpenAI, la startup di intelligenza artificiale che ha dato vita a ChatGPT, è attualmente impegnata in trattative per un round di finanziamento miliardario. Secondo fonti ben informate, questo nuovo round potrebbe portare la valutazione dell'azienda a superare la soglia dei 100 miliardi di dollari.

Thrive Capital, una società di venture capital guidata da Josh Kushner, si prepara a giocare un ruolo chiave in questa operazione finanziaria. Secondo quanto riportato dal Wall Street Journal, Thrive Capital prevede di investire circa 1 miliardo di dollari, assumendo il ruolo di capofila del round. Non è da sottovalutare la partecipazione di Microsoft, che, dopo aver già investito circa 10 miliardi di dollari in OpenAI a gennaio 2023, sembra intenzionata a unirsi anche a questo nuovo round di finanziamento.

Questo potenziale finanziamento giunge in un momento cruciale, caratterizzato da un'intensificazione della concorrenza nel settore dell'AI. Giganti tecnologici come Google, Amazon e Meta stanno tutti sviluppando attivamente i propri prodotti AI e investendo massicciamente in questo campo. In particolare, l'ultimo modello Llama 3 di Meta, offerto gratuitamente, si sta dimostrando all'altezza di GPT-4 in numerosi ambiti.

Nonostante ChatGPT di OpenAI mantenga la leadership di mercato con centinaia di milioni di utenti mensili, conservare questa posizione richiederà investimenti significativi in ricerca e sviluppo per rimanere all'avanguardia della tecnologia AI. Inoltre, concorrenti come Anthropic e Perplexity stanno rapidamente guadagnando terreno.

Le recenti voci di mercato evidenziano come il rapporto tra OpenAI e Microsoft rimanga fondamentale per entrambe le aziende, nonostante la crescente concorrenza e le nuove partnership che si stanno delineando. Attualmente, Microsoft detiene una quota del 49% dei profitti di OpenAI, ma di recente si è ritirata dal consiglio di amministrazione e ha aggiunto la startup alla sua lista di concorrenti nei settori dell'AI e della ricerca.

Apple e Nvidia Considerano di Investire in OpenAI

Il New York Times riporta che anche colossi come Apple e il produttore di chip Nvidia stanno valutando la possibilità di investire in OpenAI. Un investimento di questo tipo potrebbe rivelarsi strategico per Apple, che già collabora estensivamente con OpenAI attraverso il suo software Apple Intelligence. Nvidia, d'altra parte, ha un interesse diretto nel mantenere lo slancio dell'AI e nel rafforzare la posizione di OpenAI. Entrambe le aziende probabilmente mirano a impedire che Microsoft acquisisca un'influenza sproporzionata su OpenAI.

Con l'intensificarsi della concorrenza e l'evoluzione delle partnership strategiche, il futuro di OpenAI e dell'intero panorama dell'AI rimane in una fase di grande dinamismo. Tuttavia, una cosa appare certa: con un potenziale boost finanziario miliardario all'orizzonte, OpenAI si trova in una posizione privilegiata per mantenere la sua leadership nell'innovazione e continuare a plasmare il futuro di questa tecnologia.

0.4 Amazon Lancia un'Alexa Potenziata dall'AI con Abbonamento a Ottobre

Amazon si prepara a lanciare una versione a pagamento del suo assistente vocale Alexa, dotata di funzionalità di intelligenza artificiale avanzate, prevista per ottobre di quest'anno. Questa nuova versione di Alexa mira a competere direttamente con i più recenti assistenti AI sviluppati da aziende come OpenAI e Google.

Documenti interni ottenuti dal Washington Post rivelano che la nuova Alexa, conosciuta internamente come "Remarkable Alexa" o "Project Banyan", offrirà diverse capacità basate sull'AI. Una delle funzionalità chiave sarà "Smart Briefing", che fornirà riassunti giornalieri di notizie personalizzate generate dall'AI. È importante notare che questa funzione è in fase di sviluppo nonostante le preoccupazioni sull'accuratezza dell'AI nel gestire le notizie politiche, un aspetto particolarmente delicato in vista delle imminenti elezioni presidenziali statunitensi.

L'abbonamento per la nuova versione di Alexa potrebbe avere un costo fino a 10 dollari al mese, anche se l'attuale "Alexa classica" rimarrà disponibile gratuitamente. Amazon dovrebbe stabilire definitivamente il prezzo, la struttura dell'abbonamento e il nome ufficiale del prodotto nel corso di questo mese.

Project Metis: La Risposta di Amazon a ChatGPT

Parallelamente, Amazon sta sviluppando un prodotto basato sul web chiamato Project Metis, destinato a competere direttamente con gli strumenti LLM (Large Language Model) in stile ChatGPT. Questa mossa arriva in un momento in cui Amazon deve affrontare la pressione di tenere il passo con i rapidi progressi dell'AI dei suoi concorrenti.

L'azienda ha recentemente investito 4 miliardi di dollari nella startup di AI Anthropic, ma sta anche sviluppando il proprio modello di linguaggio di grandi dimensioni, denominato Olympus. Amazon mira a far superare a Olympus il modello Claude di Anthropic, con i primi rapporti che suggeriscono che ha "centinaia di miliardi di parametri". Tuttavia, non ci sono state recenti notizie sullo stato di sviluppo di Olympus.

Ritardi nel Lancio

Il lancio della nuova Alexa ha subito alcuni ritardi, con i documenti interni che inizialmente puntavano a un rilascio a settembre 2024. La tempistica attuale di metà ottobre indica che ci è voluto più di un anno per portare il progetto sul mercato dal suo annuncio nel settembre 2023.

Mentre Amazon non ha rivelato pubblicamente le performance finanziarie di Alexa, i rapporti suggeriscono che l'attività dei dispositivi dell'azienda, che include Alexa, sta attualmente operando in perdita. Il nuovo modello di abbonamento e le funzionalità di e-commerce migliorate della nuova Alexa potrebbero aiutare Amazon a recuperare parte del suo investimento. Per i consumatori, l'arrivo di un Alexa potenziata dall'AI promette un'esperienza più coinvolgente e personalizzata.

🔧 AI Tools

1.1 Midjourney Svela i Piani per un Modello di generazione Video e Lancia Ufficialmente il Progetto Hardware "Orb"

In una recente intervista con l'esperto di Midjourney Nick St. Pierre, il CEO David Holz ha offerto un'interessante anteprima sullo sviluppo del prossimo modello di generazione video dell'azienda. Anziché proporre un singolo video ad alta risoluzione, Holz vuole offrire agli utenti una selezione di video a risoluzione inferiore tra cui scegliere, con la possibilità di migliorarne successivamente la qualità. Questo approccio innovativo mira a fornire agli utenti maggiore flessibilità e controllo sul processo creativo. Holz sottolinea inoltre che un rendering troppo lento potrebbe ostacolare il flusso creativo, privando gli artisti di quella sensazione di immediatezza e spontaneità.

Trovare il Giusto Equilibrio

Holz rivela che Midjourney sta ancora sperimentando per trovare il perfetto equilibrio tra velocità, costo e qualità. L'azienda sta valutando attentamente fattori quali la riduzione della risoluzione o del frame rate possano influenzare l'esperienza utente. Per questo motivo, Midjourney prevede di addestrare diverse versioni di questo modello generativo al fine di identificare la combinazione migliore tra questi parametri.

Per Holz, la velocità è uno dei fattori chiave. Midjourney sta esplorando diverse strategie per accelerare il modello, pur riconoscendo che ciò potrebbe comportare costi più elevati e di conseguenza, renderlo meno accessibile a un pubblico più ampio. "È difficile prevedere come si equilibreranno tutti questi fattori", afferma Holz, ipotizzando uno scenario in cui un modello di punta più costoso e veloce diventi gradualmente più accessibile nel tempo. Parallelamente, l'azienda sta sviluppando anche un modello 3D che potrebbe essere successivamente integrato con il modello video.

Il Misterioso "Midjourney Orb"

I dettagli precisi del progetto, informalmente chiamato "Midjourney Orb" e confermato da Holz all'inizio di quest'anno, rimangono ancora avvolti nel mistero. Le speculazioni suggeriscono che potrebbe essere un progetto legato alla creazione di mondi 3D e potenzialmente, videogiochi generati in tempo reale.

Holz ha espresso la sua visione di un futuro non troppo lontano in cui una console dotata di un processore AI sarà in grado di simulare tutti i giochi in tempo reale. Ha descritto infatti il modello di immagini dell'azienda come un "motore di gioco davvero lento", promettendo lo sviluppo di mondi 3D volumetrici generati a 60 fotogrammi al secondo in un prossimo futuro.

Con i suoi ambiziosi piani per modelli di generazione video e 3D, Midjourney si sta posizionando come un'azienda che fa dell’innovazione nel campo della creazione di contenuti guidata dall'AI il suo marchio di fabbrica. Mentre l'azienda continua a spingere i confini di ciò che è possibile, possiamo aspettarci di vedere innovazioni rivoluzionarie che trasformeranno radicalmente il modo in cui creiamo e sperimentiamo i mondi digitali.

1.2 Google Potenzia Gemini con Chatbot Personalizzati e Generazione di Immagini Migliorata

Google sta lanciando due innovative funzionalità per il suo chatbot AI Gemini: i chatbot personalizzati denominati Gems e una generazione di immagini potenziata, alimentata da Imagen 3.
Gli abbonati a Gemini Advanced, Business e Enterprise avranno ora la possibilità di creare i propri esperti o agenti AI chiamati Gems. Gli utenti possono fornire istruzioni specifiche per il chatbot, assegnargli un nome e interagire con esso, in modo simile ai CustomGPT di OpenAI. I Gems possono essere utilizzati per creare specialisti dedicati a argomenti o obiettivi specifici, come la gestione di progetti, sessioni di brainstorming o la creazione di contenuti per i social media.

Al lancio, Google offrirà una serie di Gems preconfezionati per vari scenari, tra cui un coach di apprendimento, un generatore di idee, un consulente di carriera, un consulente di scrittura e un partner di programmazione. I Gems saranno disponibili nei prossimi giorni per gli utenti di Gemini Advanced, Business e Enterprise in oltre 150 paesi e nella maggior parte delle lingue, sia su desktop che su dispositivi mobili.

Imagen 3: Generazione di Immagini di Alta Qualità con un Tocco di Sicurezza

Google sta anche introducendo il suo nuovo software e modello di generazione di immagini, Imagen 3, all'interno di Gemini e sempre secondo Google, Imagen 3 è in grado di generare immagini di alta qualità. Come il suo predecessore Imagen 2, utilizza la tecnologia SynthID come filigrana per le immagini generate dall'AI, garantendo così una maggiore trasparenza.

Google aveva temporaneamente sospeso la creazione di immagini di persone in Gemini a febbraio, dopo che gli utenti avevano generato immagini che contenevano elementi di discriminazione raziale. L'azienda afferma ora che questi problemi sono stati risolti, o quantomeno significativamente mitigati.

🎨 Approfondimenti

2.1 Strawberry AI di OpenAI: Il Segreto Dietro il Modello Linguistico di Nuova Generazione Orion

OpenAI sta attualmente sviluppando due innovativi modelli di intelligenza artificiale che promettono di far progredire significativamente il settore dei grandi modelli di linguaggio. Il primo, denominato "Strawberry", mira a risolvere problemi complessi di matematica e programmazione con una efficacia superiore rispetto ai sistemi attuali. Il secondo, chiamato "Orion", si propone di superare le già notevoli capacità di GPT-4, sfruttando il supporto di Strawberry.

Secondo quanto riportato da The Information, citando due fonti coinvolte nel progetto, OpenAI potrebbe rilasciare una versione chatbot di Strawberry già questo autunno, potenzialmente integrandola in ChatGPT.
Strawberry è stato concepito per affrontare problemi matematici e affrontare task relativi alla programmazione. La sua logica migliorata dovrebbe consentirgli di risolvere problemi molto complessi in modo più efficace, specialmente quando gli viene concesso un tempo sufficiente per "ragionare".
Reuters ha riferito che OpenAI ha già testato internamente un'AI che ha ottenuto oltre il 90% sul benchmark MATH, una raccolta di compiti di problemi di matematica. È probabile che si tratti proprio di Strawberry, che è stato presentato anche a funzionari della sicurezza nazionale, secondo The Information.

The Information sottolinea che non è certo se Strawberry verrà lanciato quest'anno. Se rilasciato, sarebbe probabilmente una versione distillata del modello originale, che offre prestazioni simili con meno potenza di calcolo - una tecnica che OpenAI ha già utilizzato per le varianti di GPT-4 da quando il modello originale è stato rilasciato a marzo 2023.

Project "Orion": Il Successore di GPT-4 di OpenAI

Parallelamente a Strawberry, OpenAI sta lavorando a un modello linguistico di punta con il nome in codice "Orion", progettato per superare GPT-4. Strawberry giocherà un ruolo cruciale in questo processo, contribuendo a generare dati sintetici, cioè artificiali, per Orion. Questa combinazione di Strawberry e dati sintetici di alta qualità potrebbe potenzialmente ridurre errori ed allucinazioni in Orion rispetto ai modelli precedenti. La ricerca dimostra infatti che dati di alta qualità sono fondamentali per sviluppare modelli di AI capaci ed efficienti.

Infatti l'amministratore delegato di OpenAI, Sam Altman, ha menzionato durante un evento di maggio che l'azienda aveva raccolto abbastanza dati per addestrare il suo prossimo modello e stava sperimentando con dati sintetici.
Anche Google DeepMind sta conducendo ricerche su sistemi di AI con capacità matematiche avanzate. Hanno sviluppato AlphaProof e AlphaGeometry 2, che hanno vinto l'argento alle Olimpiadi Internazionali della Matematica. Tuttavia, rimane poco chiaro quanto bene questi modelli possano essere scalabili ed applicati in situazioni più generiche.
Con Strawberry e Orion all'orizzonte, OpenAI si appresta a tornare sul gradino più alto del podio nel frenetico campo dell'intelligenza artificiale.

💡 Link Utili

Scopri l’Academy di Imparerai e tutte le risorse che abbiamo preparato per te!

Scopri i migliori Tool di AI selezionati per te!

Vuoi contattarci? Non aspettiamo altro!

Sei arrivato alla fine!

La tua razione è completa!

Il tuo feedback è importante! Rispondi a questa email e raccontaci come potremmo migliorare questa newsletter.

Sei interessato a raggiungere i nostri lettori? Per diventare uno sponsor di Imparerai, scrivici qua!