- Imparerai Newsletter
- Posts
- Llama 3 scuote i modelli ed OpenAI sfida Google..
Llama 3 scuote i modelli ed OpenAI sfida Google..
In arrivo SearchGPT, Llama 3, Udio passa alla 1.5 ed Apple inciampa con la sua AI..
Le tue "Rations" di AI 🥫
📰 News della settimana
0.1 OpenAI sfida Google con SearchGPT, un motore di ricerca basato sull'AI
OpenAI sta testando "SearchGPT", un motore di ricerca che utilizza l'intelligenza artificiale per fornire risposte rapide e aggiornate, citando le fonti. L'obiettivo dell'azienda è combinare i punti di forza dei suoi modelli di AI con le informazioni provenienti dal Web.
Una fase di test per raccogliere feedback
Inizialmente, OpenAI offrirà SearchGPT a un piccolo gruppo di utenti ed editori per raccogliere feedback. In futuro, l'azienda prevede di integrare le funzionalità di maggior successo direttamente in ChatGPT. Se vuoi avere accesso a questa nuova funzionalità puoi iscriverti alla lista d’attesa e sperare di essere selezionato.
SearchGPT mira a rispondere direttamente alle query degli utenti con informazioni web aggiornate, fornendo al contempo link espliciti a fonti pertinenti. Come in ChatGPT, gli utenti possono porre domande di follow-up, con il sistema che tiene conto del contesto precedente.
Una sfida a Google e Perplexity
Il nuovo servizio è destinato solo alla ricerca ed è separato dall'addestramento dei modelli di AI generativa di OpenAI. I siti possono apparire nei risultati di ricerca anche se bloccano i crawler di dati di addestramento di OpenAI.
Google sta testando una funzione simile di chat di ricerca con AI Overviews, mentre Perplexity offre un motore di ricerca basato sull'AI da più di un anno.
OpenAI ha recentemente iniziato a stringere diversi accordi editoriali con giornali e riviste. Uno dei partner di contenuti di OpenAI è la rivista The Atlantic, il cui CEO Nicholas Thompson ora descrive la ricerca basata sull'AI come "uno dei modi chiave in cui le persone navigheranno su Internet" in futuro.
Punti Chiave di SearchGPT
Risposte rapide e aggiornate: Fornisce risposte immediate utilizzando informazioni aggiornate dal Web.
Citazione delle fonti: Include link espliciti alle fonti pertinenti.
Feedback degli utenti: Fase iniziale di test per raccogliere feedback da un gruppo selezionato.
Integrazione futura con ChatGPT: Le funzionalità di successo saranno integrate in ChatGPT.
Sfida ai giganti: Competizione diretta con Google e Perplexity nel settore della ricerca basata sull'AI.
Collaborazioni con editori: Accordi editoriali per indirizzare traffico verso i siti degli editori.
0.2 I modelli AI di Google DeepMind ci avvicinano a LLM in grado di ragionare
Google DeepMind ha svelato due nuovi sistemi di intelligenza artificiale che hanno vinto medaglie d'argento alle Olimpiadi Internazionali della Matematica (IMO) di quest'anno. AlphaProof e AlphaGeometry 2 hanno risolto quattro dei sei problemi proposti, totalizzando 28 punti su 42 possibili. DeepMind vede questo risultato come un passo verso l'Intelligenza Artificiale Generale (AGI) con capacità matematiche avanzate.
AlphaProof: combinare modelli linguistici e apprendimento per rinforzo
AlphaProof è un sistema di intelligenza artificiale che combina due tecnologie avanzate per dimostrare teoremi matematici. La prima è un modello linguistico, simile a quelli usati per comprendere e generare testo. La seconda è l'algoritmo AlphaZero, già noto per aver battuto i campioni umani in giochi come scacchi e go. Il sistema funziona così: Si allena risolvendo milioni di problemi matematici di diversa difficoltà . Usa queste esperienze per imparare a cercare passaggi dimostrativi nel linguaggio matematico formale chiamato Lean. Ogni volta che trova una dimostrazione corretta, la usa per migliorare la sua comprensione e capacità di risolvere problemi. Grazie a questo processo, AlphaProof diventa sempre più abile nel risolvere problemi matematici complessi. In sostanza, AlphaProof "impara a imparare", migliorando costantemente le sue capacità matematiche attraverso la pratica e l'esperienza, un po' come farebbe un matematico umano.
AlphaGeometry 2 è una versione significativamente migliorata del suo predecessore e si basa su un modello linguistico Gemini addestrato su una maggiore quantità di dati sintetici. Prima dell'IMO di quest'anno, AlphaGeometry 2 era in grado di risolvere l'83% di tutti i problemi di geometria storici dell'IMO degli ultimi 25 anni, secondo Google DeepMind.
Verso nuove frontiere della scienza e della tecnologia
Google DeepMind vede nello sviluppo di sistemi AI con capacità matematiche avanzate il potenziale per aprire nuove aree della scienza e della tecnologia. Questo è difficilmente possibile con gli attuali modelli di AI generativa come i LLM, che mancano di capacità di ragionamento e a volte commettono gravi errori.
DeepMind prevede di rilasciare in futuro maggiori dettagli tecnici su AlphaProof e sta anche esplorando approcci al ragionamento in linguaggio naturale basati sul modello Gemini. Questa prospettiva è in linea con quanto dichiarato dal CEO di Google DeepMind Demis Hassabis l'estate scorsa: "A un alto livello, si può pensare a Gemini come a una combinazione di alcuni dei punti di forza dei sistemi di tipo AlphaGo con le sorprendenti capacità linguistiche dei grandi modelli. Abbiamo anche alcune nuove innovazioni che saranno piuttosto interessanti".
Anche OpenAI punta sul ragionamento logico
Anche OpenAI mira a insegnare il ragionamento logico ai modelli di AI multimodale. Con il nome in codice "Strawberry", l'azienda starebbe sviluppando una tecnologia AI con capacità di ragionamento migliorate, simile al metodo "Quiet-STaR" sviluppato dai ricercatori di Stanford. L'obiettivo è migliorare i modelli dell'azienda, in particolare per le ricerche autonome su Internet e le attività di pianificazione complesse.
Secondo un rapporto di Reuters, un'AI testata internamente da OpenAI ha ottenuto oltre il 90% nel benchmark MATH per compiti matematici impegnativi. In confronto, GPT-4 ha ottenuto il 53% e GPT-4o il 76,6%.
Insomma, sembra che i giganti dell'AI stiano facendo progressi significativi verso modelli in grado di ragionare logicamente e affrontare problemi matematici complessi. Che si tratti di AlphaProof e AlphaGeometry 2 di Google DeepMind o di "Strawberry" di OpenAI, questi sviluppi potrebbero aprire nuove frontiere nella scienza e nella tecnologia. Tu cosa ne pensi? Credi che vedremo presto LLM con capacità di ragionamento paragonabili a quelle umane?
0.3 Apple Intelligence in ritardo: niente lancio con iOS 18
Sembra che dovremo aspettare un po' di più per mettere le mani su Apple Intelligence, la nuova piattaforma che raggruppa tutte le funzioni basate sull'intelligenza artificiale di Cupertino. Secondo quanto anticipato da Bloomberg, l'ecosistema slitterà di circa un mese, saltando l'appuntamento con iOS 18 (e iPadOS 18) e attendendo il successivo aggiornamento iOS 18.1 (e iPadOS 18.1), previsto per ottobre.
Più tempo per perfezionare e affinare
Il motivo del ritardo? Apple vuole prendersi più tempo per lo sviluppo e i successivi affinamenti, migliorando la stabilità e l'efficienza della piattaforma e riducendo al minimo errori o malfunzionamenti. Una mossa comprensibile, considerando che Apple Intelligence debutterà in anteprima negli Stati Uniti e dovrà fare i conti con una concorrenza che ormai galoppa da tempo nelle praterie dell'AI.
La tensione è alta a Cupertino
Secondo quanto raccontato dal solito Mark Gurman, sembra che dalle parti di Cupertino ci sia molta tensione per il debutto di Apple Intelligence. Il lancio dovrà essere perfetto, senza (troppe) sbavature e con tutte le promesse mantenute, per fornire un ecosistema che possa farsi perdonare l'attesa. Non è quindi un caso che per la prima volta nella storia della mela morsicata saranno rilasciate le versioni beta di iOS 18.1 e iPadOS 18.1 prima ancora del debutto della versione precedente dei sistemi operativi per smartphone e per tablet.
Un lancio indebolito per iPhone 16?
L'assenza di Apple Intelligence al lancio potrebbe sensibilmente indebolire la portata del lancio dei nuovi iPhone 16, che a livello hardware e di design non avranno cambiamenti radicali e straordinari rispetto agli attuali iPhone 15. D'altra parte, si dovrà attendere fino a iPhone 17 per accogliere qualcosa di veramente inedito con il già molto atteso modello noto ora come 17 Slim.
Insomma, sembra che dovremo armarci di un po' di pazienza prima di poter sperimentare le meraviglie dell'intelligenza artificiale made in Cupertino. Ma siamo certi che l'attesa sarà ripagata da un ecosistema all'altezza delle aspettative e in grado di rivaleggiare con la concorrenza. Sei disposto ad aspettare un mese in più per mettere le mani su Apple Intelligence o avresti preferito averla subito a disposizione con iOS 18?
🔧 AI Tools
1.1 Udio v1.5: l'AI che sfida la musica creata dall'uomo
La startup statunitense Udio ha rilasciato la versione 1.5 della sua piattaforma di generazione musicale basata sull'AI, segnando un significativo passo avanti verso una produzione musicale di livello professionale assistita dall'intelligenza artificiale.
Voci più umane e nuove funzionalità per tutti
Il nuovo aggiornamento, arrivato solo pochi mesi dopo il lancio iniziale della piattaforma, offre voci sorprendentemente simili a quelle umane e introduce funzionalità rivolte sia agli utenti casuali che ai professionisti. Secondo il blog post di Udio, l'attenzione della v1.5 è rivolta al miglioramento della qualità audio e a nuove funzionalità per semplificare il flusso di lavoro degli utenti.
Un confronto tra la v1 e la v1.5 fornito da Udio dimostra i progressi fatti: la nuova versione suona notevolmente più calda, con meno qualità artificiali e meccaniche. Sta diventando sempre più difficile distinguere le voci generate dall'AI dalle performance umane solo ascoltandole. Ascoltare per credere!
Oltre a migliorare la qualità audio, Udio ha lavorato anche sull'esperienza utente. Una pagina dedicata alla creazione ora riunisce tutti gli strumenti creativi pertinenti e le librerie personali di brani in un unico luogo.
Funzionalità avanzate per utenti professionali
Gli utenti possono ora dividere le tracce Udio complete in quattro stem separate, offrendo agli utenti avanzati più flessibilità quando remixano o integrano elementi Udio nelle proprie produzioni utilizzando software professionali.
Una delle funzionalità più inventive è la funzione audio-to-audio, che permette agli utenti di caricare le proprie tracce e remixarle utilizzando la tecnologia AI di Udio. C'è anche una nuova funzione di controllo della chiave che permette agli utenti di influenzare la direzione armonica delle loro composizioni.
Supporto multilingue e condivisione social
Secondo l'azienda, Udio v1.5 offrirà un migliore supporto per varie lingue per soddisfare un pubblico globale più ampio. Un esempio di canzone generata in mandarino mostra le capacità linguistiche migliorate di Udio, tuttavia l'azienda non ha specificato quali lingue esatte sono supportate.
La musica generata dall'AI gioca già un ruolo significativo sui social media, soprattutto su reti guidate da algoritmi come TikTok, dove dimostra ripetutamente un alto potenziale di viralità . Udio sta capitalizzando su questa tendenza introducendo una funzione che permette agli utenti di creare video con i testi delle canzoni con pochi clic per evidenziare visivamente i testi. Il video può essere condiviso o scaricato direttamente tramite social network e app di messaggistica.
Udio continua a innovare nel campo della musica generata dall'AI, con voci sempre più realistiche e funzionalità che facilitano la creatività degli utenti. Con il supporto multilingue e le nuove opzioni di condivisione social, la piattaforma è pronta a conquistare un pubblico globale sempre più ampio.
1.2 KLING AI, l'impressionante generatore di video, ora disponibile a livello internazionale
KLING AI ha ufficialmente lanciato la versione 1.0 della sua piattaforma di video AI a livello mondiale! E la parte migliore? Per registrarsi è sufficiente un indirizzo email, non è più necessario un numero di cellulare cinese. Su klingai.com, gli utenti ricevono 66 crediti giornalieri gratuiti per la creazione di video al momento della registrazione, con video che possono essere generati da testo o da immagini e testo.
Kuaishou introduce una versione web di KLING AI con un "modello avanzato"
KLING AI si basa su un "modello avanzato" che può generare video fino a dieci secondi e il nuovo modello permette anche di controllare i movimenti della telecamera come panoramica, inclinazione e zoom e supporta i prompt negativi.
Tecnologia avanzata di KLING AI
Gli sviluppatori affermano che KLING utilizza un sistema di attenzione spazio-temporale 3D per modellare meglio il movimento e l'interazione fisica, ed il modello è in grado di generare video lunghi e ad alta risoluzione grazie a un framework scalabile e a un'inferenza ottimizzata.
Kuaishou sostiene che il modello simula correttamente le proprietà fisiche del mondo reale. Utilizzando un diffusion transformer, può anche combinare concetti e creare scene di fantasia.
Insomma, sembra che la corsa ai generatori di video AI si stia scaldando, con KLING che si posiziona come un potenziale rivale di Sora di OpenAI.
🎨 Approfondimento
2.1 Meta sfida GPT-4o di OpenAI con Llama 3 405B, il suo più grande LLM open-source fino ad oggi
Meta ha rilasciato il modello più grande della sua serie di modelli linguistici open-source Llama: Llama 3.1 405B, che vanta ben 405 miliardi di parametri. L'intera famiglia Llama 3 è stata aggiornata alla versione 3.1, portando il supporto per otto lingue e una lunghezza del contesto significativamente ampliata di 128.000 token rispetto ai modelli Llama 3 rilasciati ad aprile.
Llama 3.1 405B: il primo modello AI open-source di livello "frontier"
Secondo Meta, Llama 3.1 405B è il primo modello AI open-source di livello "frontier". Nei benchmark comuni, supera GPT-4o e una versione precedente di GPT-4 sia nelle attività in lingua inglese che in quelle che richiedono la conoscenza di più lingue e si avvicina anche alle prestazioni di Claude 3.5 Sonnet di Anthropic.
I modelli Llama 3.1 più piccoli, con 70 e 8 miliardi di parametri, sono stati ottimizzati utilizzando i dati generati dal modello 405B ed hanno prestazioni simili ad altri modelli open-source ed a GPT-3.5 Turbo, recentemente sostituito dal molto più potente ed economico GPT-4o mini.
Nuovi strumenti di sicurezza e un ecosistema di partner
Meta sta anche introducendo nuovi strumenti di sicurezza insieme al rilascio, tra cui:
Llama Guard 3 per la moderazione di input e output.
Prompt Guard per la protezione dall'iniezione di prompt.
CyberSecEval 3 per la valutazione dei rischi di cybersicurezza.
Meta ha rilasciato anche il codice sorgente ed i pesi del modello. Questo significa che:
Chiunque può utilizzare Llama per scopi commerciali, rispettando i termini della licenza fornita da Meta.
Gli sviluppatori e i ricercatori possono modificare e perfezionare ulteriormente il modello Llama per adattarlo alle loro esigenze specifiche.
Llama può essere utilizzato come base per creare modelli di AI più piccoli e specializzati, attraverso un processo chiamato "distillazione".
I dati generati da Llama possono essere impiegati per addestrare e migliorare altri sistemi di intelligenza artificiale.
La strategia open-source di Meta
La strategia di Meta con il suo modello di intelligenza artificiale open source Llama sembra avere diversi obiettivi:
Diventare leader nel settore dell'IA rendendo il suo modello ampiamente disponibile e accessibile a ricercatori e sviluppatori. Questo potrebbe aiutare ad accelerare l'innovazione e l'adozione dell'IA su larga scala.
Competere meglio con i grandi player tecnologici come Google, OpenAI, DeepMind, ecc. che stanno guidando la ricerca e lo sviluppo nel campo dell'IA. Rendendo Llama open source, Meta vuole posizionarsi come un attore chiave in questo settore.
Attrarre talenti e collaborazioni nel campo dell'IA. Rendendo disponibile gratuitamente un grande modello linguistico, Meta può attirare ricercatori e ingegneri di talento interessati a lavorare su progetti di IA all'avanguardia.
Migliorare la reputazione e l'immagine pubblica di Meta, mostrando il suo impegno per l'innovazione e la ricerca aperta nel campo dell'IA a beneficio della comunità scientifica e dell'umanità in generale.
Quindi, anche se le motivazioni e gli obiettivi esatti di Meta non sono del tutto chiari, questa mossa sembra essere un passo significativo per promuovere la ricerca e l'innovazione nel campo dell'IA, e potrebbe portare a sviluppi interessanti e potenzialmente trasformativi in futuro. Sarà interessante vedere come altri nel settore risponderanno e quali collaborazioni e avanzamenti deriveranno da questa iniziativa di condivisione di conoscenze e strumenti da parte di Meta. Certamente sembra un passo nella giusta direzione per il progresso nel campo dell'IA.
Il futuro dell'AI secondo Meta
Nella sua lettera aperta, Mark Zuckerberg sostiene con forza i vantaggi dei modelli di AI open-source come Llama 3. Egli prevede che, grazie alla loro adattabilità e convenienza, i modelli aperti guideranno il settore a partire dal prossimo anno, paragonando questa transizione all'ascesa di Linux rispetto ai sistemi proprietari.
"L'anno scorso, Llama 2 era paragonabile ai modelli della generazione passata rispetto ai più performanti presenti sul mercato. Quest'anno, Llama 3 è competitivo ed alla pari con i modelli più avanzati. A partire dal prossimo anno, ci aspettiamo che i futuri modelli Llama diventino i più avanzati del settore", scrive Zuckerberg.
Il rilascio di un modello open-source così potente come Llama 3 potrebbe spingere concorrenti come OpenAI e altri ad accelerare lo sviluppo di modelli ancora più avanzati, se tecnicamente possibile, per mantenere il vantaggio competitivo.
Tuttavia, i recenti progressi nel campo dei grandi modelli linguistici sono stati per lo più incrementali, con pochi vantaggi trasformativi in termini di costo ed efficienza. Llama 3 non sembra portare progressi significativi verso l'obiettivo ultimo del settore: la combinazione di ragionamento logico, conoscenza e capacità linguistiche in grandi modelli multimodali.
💡 Link Utili
Scopri l’Academy di Imparerai e tutte le risorse che abbiamo preparato per te! |
Scopri i migliori Tool di AI selezionati per te! |
Vuoi contattarci? Non aspettiamo altro! |
Sei arrivato alla fine!
La tua razione è completa!
Il tuo feedback è importante! Rispondi a questa email e raccontaci come potremmo migliorare questa newsletter.
Sei interessato a raggiungere i nostri lettori? Per diventare uno sponsor di Imparerai, scrivici qua!