Imparerai Newsletter
Posts
Notizie dal Fronte AI su Imparerai!

Notizie dal Fronte AI su Imparerai!

Grok AI, Claude migliora la scrittura, Sora leaked e Frames per i video..

Giovanni Meroi
3 dicembre 2024

Le tue "Razioni" di AI 🥫

📰 News della settimana
🔧 AI Tools
- 1.1 Frames: il nuovo modello di immagini AI di Run …
- 1.2 Anthropic: Claude AI ora può imitare il tuo st …
🎨 Approfondimenti
- 2.1 Trapelato il generatore video Sora di OpenAI
💡 Link Utili

📰 News della settimana

0.1 xAI sfida i giganti dell'AI: a dicembre il lancio del chatbot Grok

Secondo un report del Wall Street Journal, xAI, la società di intelligenza artificiale di Elon Musk, è pronta a lanciare a dicembre un'applicazione chatbot indipendente chiamata Grok. Una mossa che metterà xAI in diretta competizione con colossi dell'AI come OpenAI, Google, Meta, Microsoft e Anthropic.

Attualmente Grok è accessibile solo agli abbonati di X (ex Twitter). La nuova app lo renderà ampiamente disponibile al pubblico, ma xAI dovrà colmare rapidamente il divario tecnico e di base utenti con i rivali già affermati.

La strategia di xAI per competere nell'arena dell'AI

Per prepararsi alla sfida, xAI ha:

Raccolto $11 miliardi di finanziamenti, raggiungendo una valutazione di $50 miliardi (seconda solo a OpenAI)
Costruito in soli 122 giorni "Colossus", un mastodontico data center con 100.000 GPU Nvidia, tra i più grandi cluster di chip AI al mondo
Aggiunto il riconoscimento delle immagini a Grok, funzionalità già presente da tempo in ChatGPT e Claude
Posizionato Grok come un chatbot meno censurato e "politicamente corretto" rispetto ai concorrenti, anche se uno studio recente indica un allineamento simile a ChatGPT su temi politici

Tuttavia, i ricavi 2023 previsti per xAI si attestano a soli $100 milioni, ben lontani dai $4 miliardi attesi da OpenAI. Inoltre, Grok basa le sue ricerche solo sui contenuti di X, limitandone le capacità rispetto alla ricerca web di ChatGPT. Lo stretto legame con X, spesso criticato per la diffusione di fake news e hate speech, potrebbe ridurre l'appeal mainstream di Grok.

Con l'ingresso di xAI, la battaglia per la supremazia nell'AI si fa rovente. Musk ha dalla sua un'enorme potenza di fuoco in termini di risorse e infrastrutture. Ma riuscirà a recuperare il vantaggio accumulato da rivali come OpenAI e Google, forti di una tecnologia più matura e collaudata?

0.2 Anthropic propone un nuovo modo per collegare i dati ai chatbot AI

Anthropic ha introdotto un nuovo standard open source chiamato Model Context Protocol (MCP), progettato per connettere gli assistenti AI ai sistemi dove risiedono i dati. Secondo l'azienda, questo protocollo potrebbe migliorare la qualità delle risposte dei modelli AI rendendole più pertinenti e precise.

Funzionalità di MCP

Il Model Context Protocol consente ai modelli di accedere a dati provenienti da fonti come strumenti aziendali, repository di contenuti e ambienti di sviluppo per completare attività. MCP affronta il problema dell'isolamento dei dati offrendo un protocollo standard che permette agli sviluppatori di creare connessioni bidirezionali tra le fonti di dati e le applicazioni AI, come i chatbot.

Gli sviluppatori possono:

Esporre i dati tramite "server MCP".
Costruire client MCP, come app e flussi di lavoro, che si connettono ai server su comando.

Alcune aziende, tra cui Block e Apollo, hanno già integrato MCP nei loro sistemi. Inoltre, piattaforme di sviluppo come Replit, Codeium e Sourcegraph stanno implementando il supporto per MCP.

Introducing the Model Context Protocol (MCP)
An open standard we've been working on at Anthropic that solves a core challenge with LLM apps - connecting them to your data.
No more building custom integrations for every data source. MCP provides one protocol to connect them all:
— Alex Albert (@alexalbert__)
4:09 PM • Nov 25, 2024

Vantaggi di MCP

Secondo Anthropic, il protocollo offre molteplici vantaggi:

Standardizzazione: Gli sviluppatori possono lavorare su un protocollo unificato invece di creare e mantenere connettori separati per ogni fonte di dati.
Contesto continuo: I sistemi AI possono mantenere il contesto anche passando tra diversi strumenti e dataset.
Architettura sostenibile: Le integrazioni frammentate saranno sostituite da un sistema più efficiente e duraturo.

Gli sviluppatori possono iniziare a utilizzare i connettori MCP immediatamente. Gli abbonati al piano Claude Enterprise di Anthropic possono collegare il chatbot Claude ai loro sistemi interni tramite server MCP precostruiti, disponibili per piattaforme come Google Drive, Slack e GitHub. A breve, Anthropic fornirà toolkit per implementare server MCP destinati a servire intere organizzazioni.

Nonostante il potenziale, l'adozione di MCP potrebbe incontrare difficoltà, specialmente in un mercato dominato da concorrenti come OpenAI. Quest'ultima ha recentemente introdotto una funzionalità simile in ChatGPT, chiamata Work with Apps, che consente al chatbot di leggere codice e interagire con app orientate allo sviluppo. Tuttavia, l'approccio di OpenAI è focalizzato su implementazioni con partner selezionati, invece di utilizzare uno standard open source.

Anthropic afferma che MCP migliora la capacità dei bot AI di recuperare informazioni pertinenti per comprendere meglio il contesto, ad esempio in attività di codifica. Tuttavia, mancano parametri di riferimento che confermino l'efficacia dichiarata del protocollo.

0.3 Il nuovo gioco di scacchi di Google usa l'AI per personalizzare i pezzi

Google ha lanciato un innovativo sito di scacchi che introduce una svolta creativa al gioco: pezzi personalizzati generati ogni volta da un’intelligenza artificiale generativa.

Come funziona

All’inizio, puoi digitare una breve descrizione per l’aspetto dei pezzi bianchi.
L’AI Imagen 3 di Google genera il set e crea automaticamente un’idea correlata per i pezzi neri.
Ad esempio, richiedendo pezzi in tema sci-fi, l’AI creerà pezzi in stile fantasy per l’avversario.
Dopo aver personalizzato i pezzi, puoi iniziare a giocare.

Funzionalità e Limiti

Il gioco è semplice ma non un’app di scacchi completa:

Offre tre livelli di difficoltà e due controlli del tempo.
Non consente di rivedere le mosse precedenti o vedere quali pezzi sono stati catturati.
La visuale predefinita è isometrica, accattivante ma poco pratica per giocare (è possibile passare alla visuale dall’alto nelle impostazioni).

Il gioco è stato lanciato questa settimana, in concomitanza con l’inizio del Campionato Mondiale di Scacchi 2024, dove il campione in carica Ding Liren difende il titolo contro il giovane prodigio Gukesh Dommaraju. Google, sponsor principale dell’evento, ha colto l’occasione per annunciare nuove iniziative legate agli scacchi.

Google ha anche rivelato che a dicembre lancerà un bot di scacchi integrato in Gemini:

I giocatori potranno digitare le mosse e Gemini mostrerà una scacchiera aggiornata in tempo reale.
Tuttavia, al momento Gemini presenta difficoltà nel valutare accuratamente le posizioni quando analizza immagini di scacchiere. Non è chiaro se acquisirà ulteriori capacità scacchistiche.

La funzione sarà disponibile a dicembre per gli abbonati a Gemini Advanced.

Pur non essendo un’app di scacchi completa, l’idea di utilizzare l’AI generativa per personalizzare i pezzi è una novità intrigante. Potrebbe aprire la strada a funzionalità simili in piattaforme più avanzate, offrendo esperienze di gioco sempre più personalizzate e coinvolgenti.

🔧 AI Tools

1.1 Frames: il nuovo modello di immagini AI di Runway

Runway ha lanciato Frames, un innovativo modello di immagini AI che punta a offrire maggiore indipendenza da strumenti come Midjourney.

Caratteristiche principali di Frames

Secondo Runway, Frames:

Offre un controllo più fine sugli stili visivi
Produce immagini più dettagliate rispetto ad altre opzioni
Consente di creare stili visivi coerenti su più immagini, ideale per progetti di grandi dimensioni
Può gestire una vasta gamma di stili, dai ritratti moderni alle foto d'epoca, dai collage alla fotografia di prodotti

Al momento, Frames è accessibile solo a un gruppo selezionato di utenti del modello di generazione video Gen-3 Alpha di Runway, lanciato a giugno. Gen-3 Alpha permette di utilizzare un’immagine di riferimento per guidare la generazione del video, dimostrandosi più efficace rispetto ai prompt testuali.

La sfida con Midjourney e la crescita di Runway

Con l’introduzione di Frames, gli utenti di Runway non dovranno più dipendere da Midjourney o strumenti simili. Tuttavia, anche Midjourney sta sviluppando un modello video che potrebbe competere direttamente con il core business di Runway.

Runway è ormai un leader nel settore del video AI, con una valutazione miliardaria. L’azienda continua ad arricchire i suoi strumenti browser-based, pensati sia per utenti quotidiani sia per società di produzione, offrendo funzionalità come:

Regolazione del rapporto d'aspetto dei video
Controllo della telecamera
Animazione dei volti

Frames rappresenta un ulteriore passo avanti per Runway nel rendere la creazione di contenuti visivi con l’AI più accessibile e potente. In un mercato sempre più competitivo, Runway consolida la sua posizione come protagonista nell’evoluzione della tecnologia AI per immagini e video.

1.2 Anthropic: Claude AI ora può imitare il tuo stile di scrittura unico

Anthropic ha introdotto una nuova funzionalità al suo assistente AI Claude, offrendo agli utenti un maggiore controllo sul modo in cui il chatbot risponde a diverse attività di scrittura. I nuovi stili personalizzati sono ora disponibili per tutti gli utenti di Claude AI, consentendo di adattarlo al proprio stile di comunicazione o di selezionare opzioni preimpostate per regolare rapidamente il tono e il livello di dettaglio.

Stili preimpostati e personalizzati

L’aggiornamento punta a rendere le risposte del chatbot più personalizzate e adatte a contesti specifici, come la stesura di documenti tecnici, e-mail professionali o altri contenuti. Sono disponibili tre stili preimpostati:

Formale: per testi "chiari e rifiniti".
Conciso: per risposte brevi e dirette.
Esplicativo: per risposte educative con dettagli aggiuntivi.

Se questi stili non bastano, Claude può essere addestrato per generare stili personalizzati:

Gli utenti possono caricare contenuti di esempio che riflettano il proprio modo preferito di comunicare.
Con istruzioni specifiche, Claude può apprendere e replicare lo stile di scrittura desiderato.

"Potresti volere spiegazioni approfondite quando stai imparando qualcosa di nuovo, o risposte rapide e dirette quando hai fretta," ha detto Scott White, leader di prodotto di Claude. "Puoi ora impostare queste preferenze una volta per tutte, rendendo ogni interazione perfetta per te."

Anche se apprezzata, la funzionalità non è una novità esclusiva di Claude. ChatGPT di OpenAI e Gemini di Google offrono strumenti simili:

ChatGPT consente di personalizzare risposte e impostare stili specifici.
Gemini può modificare rapidamente il tono e il livello di dettaglio, come nelle bozze di Gmail.
Anche Writing Tools di Apple Intelligence include preset di stile per diverse esigenze.

Nonostante non sia rivoluzionaria, l’aggiunta degli stili di scrittura personalizzati rende Claude un assistente AI più flessibile e adatto alle esigenze individuali. Questo aggiornamento conferma il crescente impegno di Anthropic nel migliorare l’esperienza degli utenti, offrendo strumenti sempre più sofisticati e adattabili.

🎨 Approfondimenti

2.1 Trapelato il generatore video Sora di OpenAI

Un gruppo ha presumibilmente reso pubblico l'accesso a Sora, il generatore video di OpenAI, in segno di protesta contro quella che definisce "duplicità" e "art washing" da parte dell'azienda.

Il leak e le accuse del gruppo

Un gruppo autodefinitosi "Sora PR Puppets" ha pubblicato un progetto su Hugging Face, una piattaforma di sviluppo AI, apparentemente legato all’API di Sora. Usando i propri token di autenticazione provenienti da un sistema di accesso anticipato, il gruppo ha creato un front-end che permette di generare video con Sora.

Attraverso il loro sistema, chiunque può creare video di 10 secondi fino a una risoluzione di 1080p inserendo una breve descrizione testuale. OpenAI, dopo circa tre ore, ha sospeso l’accesso anticipato a Sora per tutti i partecipanti, secondo il gruppo.

Le accuse del gruppo includono:

Pressioni su early tester e red teamer per diffondere una narrazione positiva su Sora.
Mancata equa compensazione dei partner creativi per il loro lavoro.
Controllo stretto degli utenti, limitando la comunicazione riguardo le reali capacità del generatore video.

Conirmed: OpenAI Sora really has been leaked
— Chubby♨️ (@kimmonismus)
4:02 PM • Nov 26, 2024

La risposta di OpenAI e le difficoltà di Sora

OpenAI ha risposto affermando che Sora è ancora in "anteprima di ricerca", sottolineando che gli artisti coinvolti non hanno obblighi contrattuali, se non quello di utilizzare lo strumento in modo responsabile e di rispettare la riservatezza.

Tuttavia, Sora ha affrontato sfide tecniche fin dalla sua prima presentazione:

Tempi di elaborazione lunghi: il sistema originale, rivelato a febbraio, impiegava oltre 10 minuti per generare un video di un minuto.
Incoerenza visiva: il regista Patrick Cederberg ha riferito di aver generato centinaia di clip per ottenere una sequenza utilizzabile, poiché il modello lottava a mantenere stili, oggetti e personaggi coerenti nei video.

Mentre Sora cerca di superare i suoi ostacoli, i concorrenti si muovono rapidamente:

Runway ha firmato un accordo con Lionsgate, studio dietro il franchise "John Wick", per addestrare un modello video personalizzato basato sul catalogo dello studio.
Stability AI, che sviluppa i propri modelli di generazione video, ha reclutato il regista di "Avatar", James Cameron, nel suo consiglio di amministrazione.

Nonostante le dimostrazioni di Sora mostrate a registi e studi di Hollywood (incluso un evento al Festival di Cannes), OpenAI non ha ancora annunciato partnership con grandi case di produzione.

💡 Link Utili

Scopri l’Academy di Imparerai e tutte le risorse che abbiamo preparato per te!

Scopri i migliori Tool di AI selezionati per te!

Vuoi contattarci? Non aspettiamo altro!

Sei arrivato alla fine!

La tua razione è completa!

Il tuo feedback è importante! Rispondi a questa email e raccontaci come potremmo migliorare questa newsletter.

Sei interessato a raggiungere i nostri lettori? Per diventare uno sponsor di Imparerai, scrivici qua!