Settimana Scoppiettante!

Arriva Canvas su ChatGPT, Flux 1.1 e Copilot su WhatsApp!

 ðŸ“° News della settimana

0.1 Il prezzo del genio: Google spende 2,7 miliardi di dollari per riavere Noam Shazeer

Immaginate di essere così brillanti nel vostro campo da far spendere al vostro ex datore di lavoro 2,7 miliardi di dollari per riavervi. Fantascienza? No, è la realtà per Noam Shazeer, il pioniere dell'IA che Google ha appena "riacquistato" con una mossa che ha lasciato il mondo tech a bocca aperta.

Un accordo senza precedenti

Nell'agosto 2024, Google ha stretto un accordo di licenza da 2,7 miliardi di dollari con Character.AI. L'obiettivo? Riportare Noam Shazeer tra le sue fila. Questo accordo non solo ha dato a Google accesso immediato alla proprietà intellettuale di Character.AI, ma ha anche permesso di aggirare gli ostacoli normativi legati alle acquisizioni complete.

Shazeer non è un semplice sviluppatore. È uno dei coautori del paper "Attention is All You Need" del 2017, che ha introdotto l'architettura transformer, la base di molti dei modelli di IA più avanzati di oggi. Per darvi un'idea della sua importanza, questo lavoro è stato citato oltre 100.000 volte da altri ricercatori!

Durante il suo periodo a Google, Shazeer ha:

  • Migliorato il correttore ortografico del motore di ricerca

  • Creato Meena, un chatbot capace di intrattenere conversazioni su una vasta gamma di argomenti

  • Co-sviluppato un chatbot di IA che Google, ironicamente, decise di non rilasciare

La storia prende una piega interessante nel 2021. Frustrato dalla riluttanza di Google a rilasciare il suo chatbot, Shazeer lascia l'azienda per co-fondare Character.AI. Questa startup diventa rapidamente un successo, attirando circa 20 milioni di utenti mensili attivi con i suoi chatbot capaci di imitare celebrità e personaggi di fantasia.

Character.AI cresce così velocemente da attirare oltre 150 milioni di dollari in finanziamenti e raggiungere una valutazione di 1 miliardo di dollari nel marzo 2024. Ed è a questo punto che Google decide di fare la sua mossa da 2,7 miliardi.

La mossa di Google solleva domande intriganti sul futuro dell'industria tech e dell'IA:

  • Stiamo assistendo all'inizio di una "corsa all'oro" dei talenti nell'IA?

  • Come influenzerà questa tendenza l'innovazione nel settore? Concentrerà tutto nelle mani di pochi giganti o stimolerà una competizione più accesa?

  • Quali potrebbero essere le implicazioni etiche e sociali di avere "superstar" dell'IA così influenti e ben pagate?

E voi, cari lettori, cosa ne pensate? Siete affascinati da questo mondo in cui un singolo individuo può valere miliardi? O vi preoccupa la concentrazione di tanto potere e risorse nelle mani di pochi?

0.2 OpenAI DevDay 2024: Un sacco di novità in arrivo

Immaginate di poter chiacchierare con un'IA come se fosse un amico seduto accanto a voi, senza ritardi fastidiosi o risposte robotiche. Fantascienza? Non più, grazie alle ultime novità presentate da OpenAI al DevDay 2024. Facciamo un viaggio nel futuro dell'IA, dove la barriera tra umano e macchina si fa sempre più sottile.

Realtime API: Quando l'IA risponde in un battito di ciglia

La star indiscussa dell'evento è stata la Realtime API, ora in beta pubblica. Ma cos'è esattamente e perché dovrebbe entusiasmarci?

Immaginate di pianificare un viaggio parlando con un assistente AI che risponde istantaneamente, capisce il contesto e può persino chiamarvi al telefono. Ecco, questa è la Realtime API in azione. Romain Huet, responsabile dell'esperienza degli sviluppatori di OpenAI, ha mostrato proprio questo: un'app di pianificazione viaggi che sembra uscita da un film di fantascienza.

Ma le applicazioni vanno ben oltre il turismo:

  • Servizio clienti: Immaginate un supporto 24/7 che capisce davvero le vostre esigenze.

  • Educazione: Tutor virtuali che si adattano al vostro stile di apprendimento in tempo reale.

  • Accessibilità: Strumenti che traducono istantaneamente il parlato in testo per le persone non udenti.

C'è un "ma", però: gli sviluppatori dovranno essere chiari quando usano voci AI nelle chiamate. Niente scherzi alla "Her", per intenderci!

Vision Fine-Tuning: Quando l'IA impara a vedere come noi

Ma le sorprese non finiscono qui. OpenAI ha presentato il Vision Fine-Tuning per il modello GPT-4o. In parole povere? L'IA può ora essere addestrata a vedere il mondo come vogliamo noi, con applicazioni che fanno girare la testa:

  • Veicoli autonomi: Immaginate auto che riconoscono i limiti di velocità meglio di noi umani distratti.

  • Imaging medico: Diagnosi più precise con un'IA che "vede" i dettagli che potrebbero sfuggire anche all'occhio più esperto.

  • Ricerca visuale: Trovare quell'oggetto che avete visto una volta ma di cui non ricordate il nome diventa un gioco da ragazzi.

Un esempio concreto? La società del Sud-est asiatico Grab ha migliorato del 20% l'accuratezza nel conteggio delle corsie e del 13% la localizzazione dei segnali di limite di velocità. E tutto questo con soli 100 esempi di addestramento. Impressionante, vero?

Vision Fine-Tuning: Quando l'IA impara a vedere come noi

Infine, parliamo di soldi. O meglio, di come risparmiarne. OpenAI ha introdotto il Prompt Caching, una funzionalità che promette di ridurre i costi fino al 50% per i token di input elaborati di recente.

Ma cos'è esattamente? Immaginate di avere un assistente che, invece di rileggere ogni volta le stesse istruzioni, le memorizza e le riutilizza quando serve. Ecco, questo è il prompt caching in pillole.

Anthropic, con il suo modello Claude, ha già mostrato risultati strabilianti:

  • Riduzione dei costi fino al 90%

  • Miglioramento della latenza fino all'85% per i prompt lunghi

Pensate alle applicazioni: agenti conversazionali che non "dimenticano" il contesto, assistenti di codifica che capiscono al volo le vostre intenzioni, elaborazione di documenti lunghi senza perdere il filo. È come avere un supercervello che non si stanca mai!

0.3 CoPilot su WhatsApp: Il tuo assistente AI personale a portata di chat

CoPilot è il chatbot AI di Microsoft, e ora è disponibile direttamente su WhatsApp. È come avere un assistente personale super intelligente nella vostra lista contatti, pronto a:

  • Generare immagini su richiesta

  • Creare testi pronti all'uso

  • Ricercare informazioni aggiornate sul web

  • E molto altro ancora!

Funziona anche perfettamente con l’italiano!

Come aggiungere CoPilot su WhatsApp

Aggiungere CoPilot è molte semplice:

  1. Aprite WhatsApp

  2. Toccate l'icona "+" in basso a destra

  3. Selezionate "Aggiungi contatto"

  4. Scansionate il codice QR di CoPilot (lo trovate sul sito ufficiale oppure dall’immagine qui sopra)

  5. Confermate di voler aggiungere il profilo ufficiale di Microsoft Copilot (cercate il bollino blu!)

Se state usando WhatsApp su PC, basta cliccare su "Try it now" sul sito ufficiale. Et voilà, il vostro genio digitale è pronto all'uso!

Ora siete pronti a divertirvi con un nuovo assistente integrato all’interno delle vostre Chat! Buon divertimento!

🔧 AI Tools

1.1 Black Forest Labs: Arriva Flux 1.1

Black Forest Labs ha appena lanciato Flux 1.1 Pro, e le promesse sono a dir poco strabilianti:

  • 6 volte più veloce del suo predecessore

  • Miglioramento della qualità delle immagini

  • Maggiore aderenza ai prompt (finalmente l'AI capisce davvero cosa le chiediamo!)

  • Aumento della diversità nelle immagini generate

E come se non bastasse, presto potremo godere di immagini in risoluzione 2K a velocità fulminea. È come passare da una vecchia TV a tubo catodico a un televisore 8K di ultima generazione!

Black Forest Labs non ha paura di confrontarsi con i pesi massimi del settore. In test comparativi con Ideogram v2 e Midjourney v6.1, Flux 1.1 Pro si è dimostrato superiore in molte metriche, specialmente nell'aderenza ai prompt e nella coerenza. È come se un nuovo pugile entrasse sul ring e mettesse KO i campioni in carica!

Ma la startup non dimentica i suoi "vecchi" modelli:

  • Flux 1 Pro riceverà un aggiornamento che ne raddoppierà la velocità

  • Flux 1.1 Pro rimarrà comunque 3 volte più veloce, offrendo il perfetto equilibrio tra qualità e velocità

L'API di Black Forest Labs: Potere ai sviluppatori

La ciliegina sulla torta? Black Forest Labs ha lanciato la versione beta della sua API. Questo significa che gli sviluppatori potranno integrare i modelli Flux nelle loro applicazioni, con opzioni di personalizzazione, scalabilità e prezzi competitivi:

  • Flux 1 Dev: $0.025 per immagine

  • Flux 1 Pro: $0.05 per immagine

  • Flux 1.1 Pro: $0.04 per immagine

E per chi preferisce piattaforme già consolidate, i modelli sono disponibili anche su Together.ai, Replicate, fal.ai e Freepik.

Lanciata pubblicamente ad agosto, Black Forest Labs ha una storia interessante:

  • Fondata da ex sviluppatori di Stability.ai

  • Base a Friburgo, Germania (immagino tra le suggestive atmosfere della Foresta Nera)

  • I fondatori hanno lavorato al generatore di immagini open-source Stable Diffusion

Un dettaglio curioso? La tecnologia Flux è utilizzata anche nel generatore di immagini AI Grok di Elon Musk su X (ex Twitter). Tuttavia, questo ha sollevato alcune controversie sul potenziale uso improprio per scopi politici. Come sempre, con grande potere viene grande responsabilità!

1.2 Cos'è Canvas e perché dovrebbe entusiasmarci?

Canvas è la prima grande rivoluzione dell'interfaccia di ChatGPT da quando è stato lanciato circa due anni fa. È come se ChatGPT avesse improvvisamente acquisito la capacità di "vedere" l'intero progetto su cui state lavorando, non solo frammenti isolati.

Ecco perché Canvas è un game-changer:

  • Lavoro parallelo: Canvas si apre in una finestra separata, permettendovi di lavorare sul vostro progetto mentre ChatGPT osserva e offre suggerimenti. È come avere un collaboratore sempre pronto a dare una mano!

  • Focus mirato: Potete evidenziare sezioni specifiche per dirigere l'attenzione di ChatGPT. Immaginate di avere un editor o un revisore di codice che si concentra esattamente dove ne avete bisogno.

  • Comprensione del contesto: ChatGPT può ora fornire feedback e suggerimenti considerando l'intero progetto. Addio risposte fuori contesto!

Chi può usare Canvas e come?

Al momento, Canvas è in fase beta per gli utenti Plus e Team. Ecco come accedervi:

  • Attivatelo manualmente dal menu di selezione del modello

  • Digitate "Use Canvas" per lanciare la funzione

  • Per alcune attività specifiche, come "Scrivi un post sul blog sulla storia dei chicchi di caffè", Canvas si aprirà automaticamente

OpenAI prevede di rendere Canvas disponibile a tutti gli utenti gratuiti di ChatGPT dopo la fase beta. Gli utenti Enterprise ed Edu dovrebbero avere accesso nel giro di una settimana.

Canvas non è solo una nuova interfaccia, è una vera e propria cassetta degli attrezzi per potenziare la vostra creatività:

  • Per gli scrittori:

    • Suggerimenti di modifica

    • Regolazioni della lunghezza del testo

    • Modifiche del livello di lettura

  • Per i programmatori:

    • Revisione del codice

    • Modifica in linea del codice

    • Logging e debugging

E la cosa migliore? Avete il pieno controllo sul vostro lavoro. Potete modificare direttamente testo o codice e ripristinare le versioni precedenti.

Karina Nguyen, sviluppatrice di OpenAI, vede Canvas come parte di una tendenza più ampia verso un'interfaccia di chat in evoluzione per un'interazione uomo-IA più collaborativa.

 ðŸŽ¨ Approfondimenti

2.1 Anthropic rivoluziona il recupero di informazioni: quando il contesto fa la differenza

Immaginate di avere un assistente che non solo risponde alle vostre domande, ma capisce anche il contesto in cui le state ponendo. Suona come un sogno? Beh, Anthropic sta trasformando questo sogno in realtà con una nuova tecnica che promette di rendere l'IA più "intelligente" che mai.

Prima di tuffarci nella soluzione, facciamo un passo indietro. I sistemi di Retrieval Augmented Generation (RAG) - pensate a loro come a biblioteche digitali super intelligenti - hanno un problema: quando dividono i documenti in pezzetti più piccoli per indicizzarli, spesso perdono informazioni contestuali importanti. È come se leggessero un libro a caso, una frase alla volta, senza capire la trama generale.

La soluzione di Anthropic: un riassunto per ogni pezzetto

Ecco l'idea geniale di Anthropic: aggiungere un breve riassunto dell'intero documento a ogni "pezzetto" prima di indicizzarlo. Questi "frammenti di contesto" sono tipicamente lunghi fino a 100 parole. È come se ogni frase del libro portasse con sé una mini-sinossi della trama!

I risultati? Semplicemente impressionanti:

  • Riduzione degli errori fino al 49% nel recupero di informazioni

  • Combinando questa tecnica con un riordinamento dei risultati, si arriva a miglioramenti fino al 67%

E la cosa migliore? Anthropic afferma che questa nuova tecnica può essere integrata nei sistemi RAG esistenti con uno sforzo minimo. Hanno persino pubblicato una guida dettagliata con esempi di codice su GitHub. È come se ci stessero dicendo: "Ecco, provate anche voi a rendere la vostra IA più intelligente!"

Ma non è solo Anthropic a dire che il contesto è importante. Un recente studio della Cornell University ha esaminato una tecnica simile chiamata "Contextual Document Embeddings" (CDE). Hanno sviluppato due metodi complementari:

  • Addestramento contestuale: Immaginate di insegnare a un bambino la differenza tra cani e gatti mostrandogli solo razze molto simili. È così che funziona questo metodo, forzando il modello a imparare differenze più sottili.

  • Architettura contestuale: Pensate a questo come a un detective che non si limita a esaminare una singola prova, ma guarda anche alle prove circostanti per trarre conclusioni più accurate.

I risultati? Il modello CDE ha ottenuto punteggi top nella sua categoria nel Massive Text Embedding Benchmark (MTEB).

Le implicazioni di questa ricerca sono enormi, soprattutto per dataset più piccoli e specifici in settori come la finanza o la medicina. Immaginate un'IA medica che non solo riconosce i sintomi, ma li interpreta nel contesto della storia clinica completa del paziente. O un assistente finanziario che comprende le sfumature del mercato azionario non solo basandosi sui numeri, ma anche sulle tendenze più ampie. Stiamo entrando in un'era in cui l'IA non solo risponde alle nostre domande, ma le comprende veramente nel loro contesto più ampio.

Scopri l’Academy di Imparerai e tutte le risorse che abbiamo preparato per te!

Scopri i migliori Tool di AI selezionati per te!

Vuoi contattarci? Non aspettiamo altro!

Sei arrivato alla fine!

La tua razione è completa!

Il tuo feedback è importante! Rispondi a questa email e raccontaci come potremmo migliorare questa newsletter.

Sei interessato a raggiungere i nostri lettori? Per diventare uno sponsor di Imparerai, scrivici qua!