News AI su Imparerai!

Canvas per tutti! Gemini 2.0, Haiku 3.5 e nuove funzionalità per Notebook LM..

 📰 News della settimana

0.1 OpenAI potenzia la modalità vocale avanzata con video e condivisione schermo

OpenAI sta espandendo la sua Advanced Voice Mode con funzionalità di video e condivisione schermo in tempo reale:

Gli utenti potranno condividere contesto visivo in tempo reale con ChatGPT, rendendo le conversazioni più naturali ed efficaci, con supporto per oltre 50 lingue.

Disponibilità e Babbo Natale

 La distribuzione seguirà un approccio graduale: gli utenti Teams e la maggior parte degli abbonati Plus e Pro avranno accesso immediato. Gli utenti europei riceveranno l'aggiornamento successivamente, mentre istituzioni educative e aziendali dovranno attendere l'inizio del prossimo anno.

Come aggiunta natalizia, OpenAI introduce una funzionalità speciale: la chat con Babbo Natale, disponibile per tutto dicembre tramite un'icona a forma di fiocco di neve nella schermata principale. Per questa esperienza, l'azienda rimuove i limiti usuali della Advanced Voice Mode.

0.2 Google presenta Gemini 2.0: nuove capacità multimodali e agenti AI

Google DeepMind ha svelato Gemini 2.0 Flash Experimental, disponibile da subito nella web chat app e per sviluppatori selezionati attraverso l'API:

  • Il modello offre migliorate capacità multimodali, elaborando testo, immagini, video e audio, con generazione nativa di immagini e voci multilingua

  • Secondo Google, è due volte più veloce del predecessore e si avvicina alle prestazioni di Sonnet "3.6" di Anthropic

Gli agenti AI specializzati Google introduce tre prototipi di ricerca che mostrano le capacità agentive di Gemini 2.0:

  • Project Mariner: un'estensione Chrome sperimentale per task web, con un tasso di successo dell'83,5% nei test reali

  • Jules: un agente focalizzato sul supporto agli sviluppatori attraverso l'integrazione con GitHub

  • Project Astra: un assistente AI universale che può mantenere conversazioni multilingue con memoria contestuale fino a dieci minuti

Integrazione e sviluppi futuri

Google pianifica di integrare Gemini 2.0 in varie piattaforme, tra cui Android Studio, Chrome DevTools e Firebase. Il supporto alla programmazione, chiamato Gemini Code Assist, sarà disponibile nei principali ambienti di sviluppo.

L'azienda sta inoltre potenziando il suo agente per la data science su Google Colab, che ha già dimostrato risultati impressionanti: in un recente progetto presso il Lawrence Berkeley National Laboratory, il sistema ha ridotto i tempi di analisi da una settimana a pochi minuti.

0.3 Microsoft svela Phi-4: nuovo modello AI per la ricerca

Microsoft ha presentato il suo ultimo modello della famiglia Phi di AI generativa. Phi-4 si distingue per:

  • Miglioramenti significativi rispetto ai predecessori, particolarmente nella risoluzione di problemi matematici

  • Dimensioni contenute con 14 miliardi di parametri, posizionandosi nel segmento dei modelli più compatti

Il modello è attualmente disponibile in accesso molto limitato sulla piattaforma di sviluppo Azure AI Foundry, esclusivamente per scopi di ricerca. Si trova a competere con altri modelli compatti come GPT-4o mini, Gemini 2.0 Flash e Claude 3.5 Haiku.

Innovazioni tecniche

Il salto prestazionale di Phi-4 è attribuito all'uso di dataset sintetici di alta qualità combinati con contenuti generati da umani, oltre a non specificati miglioramenti post-training. Questo focus sull'innovazione nei dati sintetici e nel post-training riflette una tendenza più ampia del settore, come confermato dal CEO di Scale AI, Alexandr Wang, che ha recentemente evidenziato il raggiungimento di un "muro dei dati di pre-training".

Il lancio avviene in un momento significativo per Microsoft, essendo il primo modello Phi rilasciato dopo la partenza di Sébastien Bubeck, ex vicepresidente AI dell'azienda e figura chiave nello sviluppo della serie Phi, passato a OpenAI lo scorso ottobre.

0.4 Claude 3.5 Haiku di Anthropic arriva per gli utenti della piattaforma

Anthropic ha reso disponibile Claude 3.5 Haiku sulla sua piattaforma di chatbot Claude, sia su web che mobile:

  • Il modello eguaglia o supera le prestazioni del precedente flagship 3 Opus su specifici benchmark

  • Si distingue particolarmente nelle raccomandazioni di codice, nell'estrazione e etichettatura dei dati e nella moderazione dei contenuti

Capacità e limitazioni

Haiku porta con sé alcuni miglioramenti significativi:

  • Può generare porzioni di testo più lunghe rispetto al predecessore 3 Haiku

  • Dispone di un knowledge cutoff aggiornato, permettendogli di fare riferimento a eventi più recenti

  • Non supporta però l'analisi delle immagini, risultando meno versatile rispetto ad altri modelli come 3 Haiku e 3.5 Sonnet

Il lancio del modello tramite API il mese scorso ha generato alcune discussioni: Anthropic aveva inizialmente suggerito che il costo sarebbe stato lo stesso di 3 Haiku, per poi modificare la sua posizione, giustificando un costo API più elevato con la maggiore "intelligenza" del modello.

🔧 AI Tools

1.1 NotebookLM si rinnova: arrivano interazione vocale e piano premium per le aziende

Le novità dell'aggiornamento Google ha annunciato importanti aggiornamenti per NotebookLM, il suo assistente AI per la ricerca:

  • Integrazione di una versione sperimentale di Gemini 2.0 Flash e nuove funzionalità di interazione vocale con riassunti audio generati dall'AI

  • Gli utenti possono ora dialogare direttamente con l'AI riguardo i riassunti audio, chiedendo chiarimenti o spiegazioni alternative

Interfaccia rinnovata e workflow ottimizzato La nuova interfaccia di NotebookLM si articola in tre sezioni principali per migliorare il flusso di lavoro:

  • Il pannello Sources per la gestione delle informazioni

  • Il pannello Chat per le conversazioni con l'AI

  • Il pannello Studio per generare nuovo contenuto dalle fonti con un click

NotebookLM Plus per le aziende

Google introduce due versioni distinte del servizio:

  • Una versione base gratuita con le funzionalità essenziali

  • NotebookLM Plus, un abbonamento premium che offre funzionalità estese per aziende e power user, inclusi cinque volte più riassunti audio e fonti per notebook, personalizzazione delle risposte AI e notebook condivisi con analisi dettagliate

Il servizio Plus sarà disponibile attraverso Google Workspace o Google Cloud, con piani per includerlo nel pacchetto Google One AI Premium a partire dal 2025. Secondo i dati di Google, gli utenti hanno già generato più di 350 anni di riassunti audio negli ultimi tre mesi.

1.2 OpenAI rende Canvas disponibile a tutti

OpenAI ha reso Canvas, il suo editor collaborativo, disponibile a tutti gli utenti web, rimuovendo il requisito dell'abbonamento Plus:

  • Lo strumento offre un'area di lavoro condivisa dove utenti e ChatGPT possono collaborare simultaneamente su documenti e codice

  • Un emulatore Python integrato permette di eseguire il codice direttamente in Canvas, supportando la maggior parte delle librerie attraverso l'integrazione WebAssembly

Ambiente di sviluppo potenziato

L'ambiente di codifica include strumenti avanzati per sviluppatori:

  • Evidenziazione della sintassi e auto-completamento

  • Feedback in tempo reale sugli errori del codice da parte di ChatGPT

  • Suggerimenti di miglioramento applicabili con un click

La modifica dei testi è stata migliorata con la capacità di ChatGPT di evidenziare sezioni specifiche e aggiungere commenti. Inoltre, Canvas si integra ora con i Custom GPT: gli sviluppatori possono impostarlo come strumento predefinito attraverso una nuova opzione nelle impostazioni GPT, anche se rimane disattivato di default per i GPT esistenti per mantenerne la funzionalità corrente.

Scopri l’Academy di Imparerai e tutte le risorse che abbiamo preparato per te!

Scopri i migliori Tool di AI selezionati per te!

Vuoi contattarci? Non aspettiamo altro!

Sei arrivato alla fine!

La tua razione è completa!

Il tuo feedback è importante! Rispondi a questa email e raccontaci come potremmo migliorare questa newsletter.

Sei interessato a raggiungere i nostri lettori? Per diventare uno sponsor di Imparerai, scrivici qua!