- Imparerai Newsletter
- Posts
- News AI su Imparerai!
News AI su Imparerai!
Canvas per tutti! Gemini 2.0, Haiku 3.5 e nuove funzionalità per Notebook LM..
Le tue "Razioni" di AI 🥫
📰 News della settimana
0.1 OpenAI potenzia la modalità vocale avanzata con video e condivisione schermo
OpenAI sta espandendo la sua Advanced Voice Mode con funzionalità di video e condivisione schermo in tempo reale:
Gli utenti potranno condividere contesto visivo in tempo reale con ChatGPT, rendendo le conversazioni più naturali ed efficaci, con supporto per oltre 50 lingue.

Disponibilità e Babbo Natale
La distribuzione seguirà un approccio graduale: gli utenti Teams e la maggior parte degli abbonati Plus e Pro avranno accesso immediato. Gli utenti europei riceveranno l'aggiornamento successivamente, mentre istituzioni educative e aziendali dovranno attendere l'inizio del prossimo anno.
Come aggiunta natalizia, OpenAI introduce una funzionalità speciale: la chat con Babbo Natale, disponibile per tutto dicembre tramite un'icona a forma di fiocco di neve nella schermata principale. Per questa esperienza, l'azienda rimuove i limiti usuali della Advanced Voice Mode.
0.2 Google presenta Gemini 2.0: nuove capacità multimodali e agenti AI
Google DeepMind ha svelato Gemini 2.0 Flash Experimental, disponibile da subito nella web chat app e per sviluppatori selezionati attraverso l'API:
Il modello offre migliorate capacità multimodali, elaborando testo, immagini, video e audio, con generazione nativa di immagini e voci multilingua
Secondo Google, è due volte più veloce del predecessore e si avvicina alle prestazioni di Sonnet "3.6" di Anthropic
Gli agenti AI specializzati Google introduce tre prototipi di ricerca che mostrano le capacità agentive di Gemini 2.0:
Project Mariner: un'estensione Chrome sperimentale per task web, con un tasso di successo dell'83,5% nei test reali
Jules: un agente focalizzato sul supporto agli sviluppatori attraverso l'integrazione con GitHub
Project Astra: un assistente AI universale che può mantenere conversazioni multilingue con memoria contestuale fino a dieci minuti

Integrazione e sviluppi futuri
Google pianifica di integrare Gemini 2.0 in varie piattaforme, tra cui Android Studio, Chrome DevTools e Firebase. Il supporto alla programmazione, chiamato Gemini Code Assist, sarà disponibile nei principali ambienti di sviluppo.
L'azienda sta inoltre potenziando il suo agente per la data science su Google Colab, che ha già dimostrato risultati impressionanti: in un recente progetto presso il Lawrence Berkeley National Laboratory, il sistema ha ridotto i tempi di analisi da una settimana a pochi minuti.
0.3 Microsoft svela Phi-4: nuovo modello AI per la ricerca
Microsoft ha presentato il suo ultimo modello della famiglia Phi di AI generativa. Phi-4 si distingue per:
Miglioramenti significativi rispetto ai predecessori, particolarmente nella risoluzione di problemi matematici
Dimensioni contenute con 14 miliardi di parametri, posizionandosi nel segmento dei modelli più compatti
Il modello è attualmente disponibile in accesso molto limitato sulla piattaforma di sviluppo Azure AI Foundry, esclusivamente per scopi di ricerca. Si trova a competere con altri modelli compatti come GPT-4o mini, Gemini 2.0 Flash e Claude 3.5 Haiku.

Innovazioni tecniche
Il salto prestazionale di Phi-4 è attribuito all'uso di dataset sintetici di alta qualità combinati con contenuti generati da umani, oltre a non specificati miglioramenti post-training. Questo focus sull'innovazione nei dati sintetici e nel post-training riflette una tendenza più ampia del settore, come confermato dal CEO di Scale AI, Alexandr Wang, che ha recentemente evidenziato il raggiungimento di un "muro dei dati di pre-training".
Il lancio avviene in un momento significativo per Microsoft, essendo il primo modello Phi rilasciato dopo la partenza di Sébastien Bubeck, ex vicepresidente AI dell'azienda e figura chiave nello sviluppo della serie Phi, passato a OpenAI lo scorso ottobre.
0.4 Claude 3.5 Haiku di Anthropic arriva per gli utenti della piattaforma
Anthropic ha reso disponibile Claude 3.5 Haiku sulla sua piattaforma di chatbot Claude, sia su web che mobile:
Il modello eguaglia o supera le prestazioni del precedente flagship 3 Opus su specifici benchmark
Si distingue particolarmente nelle raccomandazioni di codice, nell'estrazione e etichettatura dei dati e nella moderazione dei contenuti

Capacità e limitazioni
Haiku porta con sé alcuni miglioramenti significativi:
Può generare porzioni di testo più lunghe rispetto al predecessore 3 Haiku
Dispone di un knowledge cutoff aggiornato, permettendogli di fare riferimento a eventi più recenti
Non supporta però l'analisi delle immagini, risultando meno versatile rispetto ad altri modelli come 3 Haiku e 3.5 Sonnet
Il lancio del modello tramite API il mese scorso ha generato alcune discussioni: Anthropic aveva inizialmente suggerito che il costo sarebbe stato lo stesso di 3 Haiku, per poi modificare la sua posizione, giustificando un costo API più elevato con la maggiore "intelligenza" del modello.
🔧 AI Tools
1.1 NotebookLM si rinnova: arrivano interazione vocale e piano premium per le aziende
Le novità dell'aggiornamento Google ha annunciato importanti aggiornamenti per NotebookLM, il suo assistente AI per la ricerca:
Integrazione di una versione sperimentale di Gemini 2.0 Flash e nuove funzionalità di interazione vocale con riassunti audio generati dall'AI
Gli utenti possono ora dialogare direttamente con l'AI riguardo i riassunti audio, chiedendo chiarimenti o spiegazioni alternative
Interfaccia rinnovata e workflow ottimizzato La nuova interfaccia di NotebookLM si articola in tre sezioni principali per migliorare il flusso di lavoro:
Il pannello Sources per la gestione delle informazioni
Il pannello Chat per le conversazioni con l'AI
Il pannello Studio per generare nuovo contenuto dalle fonti con un click

NotebookLM Plus per le aziende
Google introduce due versioni distinte del servizio:
Una versione base gratuita con le funzionalità essenziali
NotebookLM Plus, un abbonamento premium che offre funzionalità estese per aziende e power user, inclusi cinque volte più riassunti audio e fonti per notebook, personalizzazione delle risposte AI e notebook condivisi con analisi dettagliate
Il servizio Plus sarà disponibile attraverso Google Workspace o Google Cloud, con piani per includerlo nel pacchetto Google One AI Premium a partire dal 2025. Secondo i dati di Google, gli utenti hanno già generato più di 350 anni di riassunti audio negli ultimi tre mesi.
1.2 OpenAI rende Canvas disponibile a tutti
OpenAI ha reso Canvas, il suo editor collaborativo, disponibile a tutti gli utenti web, rimuovendo il requisito dell'abbonamento Plus:
Lo strumento offre un'area di lavoro condivisa dove utenti e ChatGPT possono collaborare simultaneamente su documenti e codice
Un emulatore Python integrato permette di eseguire il codice direttamente in Canvas, supportando la maggior parte delle librerie attraverso l'integrazione WebAssembly

Ambiente di sviluppo potenziato
L'ambiente di codifica include strumenti avanzati per sviluppatori:
Evidenziazione della sintassi e auto-completamento
Feedback in tempo reale sugli errori del codice da parte di ChatGPT
Suggerimenti di miglioramento applicabili con un click
La modifica dei testi è stata migliorata con la capacità di ChatGPT di evidenziare sezioni specifiche e aggiungere commenti. Inoltre, Canvas si integra ora con i Custom GPT: gli sviluppatori possono impostarlo come strumento predefinito attraverso una nuova opzione nelle impostazioni GPT, anche se rimane disattivato di default per i GPT esistenti per mantenerne la funzionalità corrente.
💡 Link Utili
Scopri l’Academy di Imparerai e tutte le risorse che abbiamo preparato per te! |
Scopri i migliori Tool di AI selezionati per te! |
Vuoi contattarci? Non aspettiamo altro! |
Sei arrivato alla fine!
La tua razione è completa!

Il tuo feedback è importante! Rispondi a questa email e raccontaci come potremmo migliorare questa newsletter.
Sei interessato a raggiungere i nostri lettori? Per diventare uno sponsor di Imparerai, scrivici qua!