Primo Ottobre e Nuove Notizie sul fronte AI!

Voice Mode delude le aspettative? STROM per articoli accademici, Notebook LM per analizzare video Youtube!

 ðŸ“° News della settimana

0.1 OpenAI: Venti di cambiamento o tempesta in arrivo?

Il mondo tech è in fermento per le notizie che arrivano da OpenAI, l'azienda che ha rivoluzionato il settore dell'intelligenza artificiale con ChatGPT. Ma cosa sta realmente accadendo tra le mura della celebre startup di San Francisco? Cerchiamo di fare chiarezza in questo mare di voci e speculazioni.

Sam Altman: il capitano senza bussola?

Il CEO di OpenAI, Sam Altman, si è trovato al centro di un vero e proprio ciclone mediatico. Le voci su una sua imminente acquisizione di una "gigantesca quota azionaria" dell'azienda si sono diffuse rapidamente. Ma Altman, con la flemma che lo contraddistingue, ha gettato acqua sul fuoco durante un recente incontro con i dipendenti.

"Queste voci? Semplicemente non sono vere", ha dichiarato Altman. "Non ci sono piani attuali per una mossa del genere", ha aggiunto, lasciando però una porta aperta a future possibilità.

La situazione di Altman è, a dir poco peculiare. Immaginate di essere il capitano di una nave che sta scoprendo nuovi mondi, ma di non possedere nemmeno un chiodo di quella stessa nave. È questa la condizione in cui si trova Altman, co-fondatore di un'azienda valutata miliardi di dollari, ma senza alcuna partecipazione azionaria.

Sarah Friar, CFO di OpenAI, ha confermato che questa situazione ha fatto alzare più di un sopracciglio tra gli investitori. E non posso biasimarli: la posizione di Altman è quantomeno insolita nel panorama delle startup tech.

La ristrutturazione: evoluzione o rivoluzione?

Il consiglio di amministrazione di OpenAI ha annunciato di star valutando una ristrutturazione dell'azienda in un'entità a scopo di lucro. Un cambiamento che potrebbe sembrare una mera formalità burocratica, ma che in realtà potrebbe avere ripercussioni profonde sul futuro dell'azienda e, di conseguenza, sul futuro dell'IA come la conosciamo.

L'idea è quella di mantenere una parte non-profit come unità separata. Questo approccio potrebbe aprire la strada a nuove possibilità di crescita e sviluppo, pur mantenendo la missione originale dell'azienda.

Le recenti partenze di alcuni dirigenti di alto livello hanno alimentato speculazioni su un possibile legame con questa ristrutturazione. Mira Murati, CTO di lunga data, ha annunciato il suo addio con un post su Platform X che trasudava di quella malinconia tipica di chi lascia un progetto a cui ha dedicato anima e corpo.

Altman, tuttavia, respinge categoricamente queste teorie. Durante un'intervista all'Italian Tech Week, ha definito la maggior parte dei report mediatici su questo tema "completamente sbagliati". Secondo lui, si tratta semplicemente di persone pronte per nuove sfide e di un naturale ricambio generazionale nella leadership.

0.2 ChatGPT Advanced Voice Mode: Tra realtà e aspettative

Avete presente quando vi promettono la luna e poi vi ritrovate con un palloncino? Beh, sembra che OpenAI ci stia facendo vivere qualcosa di simile con il suo nuovo Advanced Voice Mode per ChatGPT. Facciamo un po' di chiarezza su cosa c'è e cosa (ancora) manca.

Sam Altman, CEO di OpenAI, ha annunciato con gran fanfara il completamento del rollout di Advanced Voice Mode per gli utenti ChatGPT Plus e Team. Suona come musica per le nostre orecchie, vero? Promette interazioni vocali migliorate, accenti più naturali e conversazioni più veloci. Fin qui, tutto bene.

Le nuove funzionalità: un assaggio di futuro

Advanced Voice Mode porta con sé alcune novità interessanti:

  • Istruzioni personalizzate

  • Memoria (immagino per conversazioni più coerenti nel tempo)

  • Cinque nuove voci (per dare un po' di varietà alle nostre chiacchierate con l'IA)

Sembra promettente, no? Ma aspettate, c'è un "ma"...

Ricordate tutte quelle fantastiche dimostrazioni durante la presentazione di GPT-4o, il modello dietro Advanced Voice Mode? Beh, molte di quelle funzionalità sono ancora... nel regno dei sogni.

Cosa manca all'appello?

  • Niente analisi in tempo reale di video o grafica

  • Niente riconoscimento delle emozioni dai volti

  • Niente insegnamento di matematica analizzando i disegni dei bambini 

  • Niente canto o canticchiamento

E non è finita qui:

  • Niente ricerche su internet

  • Niente passaggio da conversazione testuale a vocale avanzata (o viceversa)

  • Niente generazione di immagini (almeno per ora)

Se vivete nell'UE, nel Regno Unito, in Svizzera o in alcuni altri paesi europei, ho una brutta notizia: Advanced Voice Mode non è disponibile per voi. Il motivo? Potrebbe essere legato alla capacità del sistema di riconoscere le emozioni, una funzione che sarebbe proibita dall'AI Act dell'UE. Ironia della sorte, una funzione che non c'è potrebbe essere la ragione per cui non possiamo avere quelle che ci sono! Se volete potete provare con una VPN per ottenere un’indirizzo IP Americano e provare la nuova modalità, oppure sperare che OpenAI ci dia accesso il prima possibile!

0.3 OpenAI o1: Il mistero dietro le sue straordinarie prestazioni

OpenAI sostiene di aver trovato il Santo Graal dell'IA: un modo per scalare le capacità dell'intelligenza artificiale aumentando la potenza di elaborazione durante l'inferenza. In parole povere, più potenza di calcolo = risultati migliori. Sembra semplice, no?

Ma aspettate, c'è di più. Mentre o1 è stato addestrato da zero utilizzando il metodo di inferenza step-by-step (ormai un classico nel mondo dell'IA), le sue prestazioni sembrano nascondere qualcosa di più complesso.

I ricercatori di Epoch AI, incuriositi da queste prestazioni straordinarie, hanno deciso di indagare. Hanno preso GPT-4o e l'hanno messo alla prova su un benchmark scientifico piuttosto ostico chiamato GPQA (Graduate-Level Google-Proof Q&A Benchmark). L'obiettivo? Vedere se potevano replicare le prestazioni di o1-preview.

Hanno usato due tecniche di prompting (Revisions e Majority Voting) per generare un gran numero di token, cercando di imitare il "processo di pensiero" di o1. Il risultato?

Nessuna quantità di token ha permesso a GPT-4o di avvicinarsi alle prestazioni di o1-preview.

Qual è il segreto di o1?

Ora, potreste pensare: "Ma forse o1 costa molto di più per token?" Buona osservazione! Ma anche tenendo conto di questo fattore, il divario di prestazioni rimane impressionante.

Secondo le stime di Epoch AI, spendere 1.000 dollari in token di output con GPT-4o produrrebbe comunque risultati con un'accuratezza inferiore di oltre 10 punti percentuali rispetto a o1-preview. Non proprio spiccioli, eh?

I ricercatori sono giunti a una conclusione intrigante: il semplice aumento della potenza di elaborazione durante l'inferenza non basta a spiegare le prestazioni superiori di o1. Suggeriscono che tecniche avanzate di apprendimento per rinforzo e metodi di ricerca migliorati potrebbero giocare un ruolo chiave.

In altre parole, non è solo questione di "muscoli" computazionali, ma anche di "cervello" algoritmico. Questo ci dimostra che l'innovazione negli algoritmi rimane cruciale per il progresso dell'IA.

Tuttavia, i ricercatori di Epoch AI sono cauti. Le loro scoperte non provano definitivamente che i miglioramenti algoritmici siano l'unico fattore dietro il vantaggio di o1-preview su GPT-4o. Dati di addestramento di qualità superiore potrebbero anche contribuire a questa differenza di prestazioni.

🔧 AI Tools

1.1 STORM: L'IA di Stanford che sta rivoluzionando la scrittura di articoli accademici

Immaginate di avere un assistente di ricerca instancabile, capace di setacciare il web, analizzare fonti e creare bozze dettagliate su qualsiasi argomento in una frazione del tempo che impieghereste voi. Fantascienza? Non più, grazie a STORM, l'ultima creazione dei ricercatori di Stanford.

STORM, acronimo di "Synthesis of Topic Outlines through Retrieval and Multi-perspective Question Asking" (che tradotto suona come "Sintesi di schemi tematici attraverso il recupero e la formulazione di domande da prospettive multiple"), è un sistema di IA che promette di rivoluzionare il modo in cui scriviamo articoli enciclopedici stile Wikipedia.

Ma cosa fa esattamente? In parole povere, STORM automatizza la fase di preparazione nella scrittura di articoli complessi. E credetemi, chiunque abbia mai provato a scrivere un articolo ben documentato sa quanto questa fase possa essere lunga e laboriosa!

Come funziona?

STORM opera in due fasi principali:

  1. Ricerca e organizzazione: Qui l'IA si trasforma in un vero e proprio detective digitale, raccogliendo informazioni e creando una struttura per l'articolo.

  2. Scrittura: Utilizzando l'outline e le referenze raccolte, STORM procede a scrivere l'articolo completo.

Ma il vero punto di forza di STORM sta nel suo approccio alla ricerca. Utilizza due strategie che, francamente, mi fanno venire in mente un mix tra Sherlock Holmes e un giornalista investigativo:

  1. Domande basate su prospettive diverse: STORM analizza articoli Wikipedia su argomenti simili per scoprire diverse prospettive.

  2. Conversazione simulata: Qui STORM si supera, simulando un dialogo tra un autore Wikipedia e un esperto del settore. Le risposte dell'esperto? Basate su fonti internet affidabili fornite dal motore di ricerca you.com.

STORM vs Umani: chi vince?

I ricercatori hanno messo alla prova STORM creando FreshWiki, un dataset di articoli Wikipedia attuali e di alta qualità. E i risultati? Sorprendenti!

  • Gli articoli prodotti da STORM sono stati giudicati meglio strutturati (un aumento del 25%!).

  • La copertura degli argomenti è risultata più ampia (10% in più).

Ma attenzione, non è tutto oro quel che luccica...Gli esperti di Wikipedia hanno evidenziato alcune criticità:

  • A volte, i pregiudizi delle fonti internet si trasferiscono agli articoli generati.

  • L'IA può creare connessioni tra fatti indipendenti, una sorta di "teoria del complotto digitale".

  • Attualmente il Tool funziona solamente in lingua Inglese! Per la lingua italiana dobbiamo aspettare!

1.2 NotebookLM di Google: Il tuo assistente AI per esplorare YouTube in profondità

Vi è mai capitato di guardare un video su YouTube e desiderare di poterne estrarre rapidamente i concetti chiave? O magari di voler approfondire un argomento specifico senza dover rivedere l'intero filmato? Beh, sembra che Google abbia ascoltato i nostri desideri con l'ultima funzionalità di NotebookLM!

NotebookLM è l'app di Google per prendere appunti potenziata dall'intelligenza artificiale. E ora, ha acquisito una nuova superpotenza: può analizzare e approfondire i video di YouTube. È come avere un assistente personale che guarda i video per voi e vi prepara un riassunto dettagliato!

Come funziona?

  1. Analisi della trascrizione: NotebookLM esamina la trascrizione del video, incluse quelle generate automaticamente.

  2. Sintesi dei punti chiave: L'AI crea un breve riassunto dei principali argomenti trattati.

  3. Approfondimento interattivo: Potete cliccare sui vari temi per ottenere informazioni più dettagliate.

  4. Domande e risposte: Potete porre domande specifiche sul contenuto del video. E se siete a corto di idee? NotebookLM vi suggerisce alcune domande!

Ma la vera chicca è questa: ogni informazione è accompagnata da una citazione che vi porta direttamente al punto esatto della trascrizione. È come avere un indice interattivo per il vostro video!

 ðŸŽ¨ Approfondimenti

2.1 Come l’AI generativa sta cambiando il mondo del lavoro

Ricordate quando l'arrivo dei primi PC in ufficio sembrava una rivoluzione? O quando internet ha fatto capolino nelle nostre vite, promettendo di connettere il mondo? Beh, tenetevi forte, perché c'è un nuovo player in città, e sta correndo più veloce di Usain Bolt alle Olimpiadi!

Un recente studio americano, dal titolo evocativo "The Rapid Adoption of Generative AI", ha messo in luce qualcosa di straordinario: l'AI generativa, con strumenti come ChatGPT in prima linea, sta conquistando il mondo del lavoro a una velocità mai vista prima.

Pensate un po': ciò che ha richiesto più di cinque anni per PC e internet, l'IA generativa l'ha raggiunto in soli due anni. È come se avessimo premuto il pulsante dell'acceleratore dell'innovazione!

Numeri che fanno girare la testa

I ricercatori non si sono certo risparmiati. Hanno condotto due sondaggi raccogliendo:

  • Giugno 2024: 2.551 risposte

  • Agosto 2024: ben 5.014 risposte

E cosa hanno scoperto? Preparatevi, perché i numeri sono impressionanti:

  • Il 28% dei dipendenti usa l'IA generativa per lavoro

  • Quasi un quarto la usa settimanalmente

  • Uno su nove (pensate!) la usa quotidianamente

Confrontiamo questi dati con il passato: ci sono voluti tre anni dopo il lancio dell'IBM PC nel 1981 perché il suo uso in ufficio raggiungesse il 25%. L'IA generativa? Ha superato quella soglia in un batter d'occhio!

Ciò che rende l'IA generativa davvero rivoluzionaria è la sua versatilità. Non è solo appannaggio di programmatori o manager:

  • Quasi la metà dei lavoratori in ruoli informatici e manageriali la usa

  • Ma anche uno su cinque lavoratori in generale la sta adottando

La vediamo all'opera ovunque: dalla scrittura all'interpretazione dei dati, dal lavoro amministrativo alla programmazione, fino al supporto clienti. È come un coltellino svizzero digitale, pronto a tutto!

Ora, non lasciamoci travolgere dall'entusiasmo. L'impatto dell'IA generativa sulla produttività è ancora modesto, ma promettente:

  • Supporta tra lo 0,5% e il 3,5% delle ore di lavoro totali

  • Potrebbe aumentare la produttività del lavoro dello 0,1-0,9%

Numeri che potrebbero sembrare piccoli, ma ricordiamoci: siamo solo all'inizio di questa rivoluzione!

Scopri l’Academy di Imparerai e tutte le risorse che abbiamo preparato per te!

Scopri i migliori Tool di AI selezionati per te!

Vuoi contattarci? Non aspettiamo altro!

Sei arrivato alla fine!

La tua razione è completa!

Il tuo feedback è importante! Rispondi a questa email e raccontaci come potremmo migliorare questa newsletter.

Sei interessato a raggiungere i nostri lettori? Per diventare uno sponsor di Imparerai, scrivici qua!