I controlli e i prezzi cinesi riscrivono il potere dell’IA

Settimana turbolenta su r/artificial: tra governi che impongono paletti, concorrenza globale che ribalta i prezzi e comunità tecniche che frugano nei bug, emerge un filo unico: il potere di decidere chi controlla i modelli e con quali dati. Le discussioni convergono su tre fronti intrecciati: regole e narrativa, mercato e talento, qualità delle fonti.

Potere, regole e narrazioni

La politica entra nei modelli con forza: dalla sospensione di tredici giorni del modello Claude Fable 5, oggetto di un acceso confronto sulla portata dei controlli alle esportazioni, al montare di voci di possibili nuovi controlli alle esportazioni su Google che alimentano ansia e sarcasmo nella community. Sullo sfondo, la legittimità dell’addestramento torna al centro con il dibattito sull’ironia del prelievo di dati senza permesso, che mette a nudo doppi standard e tensioni etiche.

"La cosa divertente è che hanno pagato loro mentre usavano il loro modello, mentre le persone a cui è stato rubato il lavoro non sono state pagate per nulla..." - u/Open_Enthusiasm8528 (192 punti)

La contesa non è solo normativa ma anche informativa: le carte trapelate sul progetto della Social Design Agency russa suggeriscono una nuova frontiera della disinformazione, puntando a contaminare basi di conoscenza e indici di ricerca usati dai sistemi di IA. Allo stesso tempo, le rivelazioni sul contratto segreto del governo canadese con Palantir riaprono il tema dell’opacità nell’adozione pubblica di tecnologie sensibili. Insieme, questi segnali mostrano quanto sia fragile l’equilibrio tra controllo statale, fiducia pubblica e resilienza delle infrastrutture di conoscenza.

Prezzo, talento e piattaforme

Il mercato corre verso il rapporto prezzo-prestazioni: la corsa dei modelli cinesi a basso costo negli Stati Uniti sta spingendo molte realtà a ricalibrare budget e dipendenze tecnologiche, insinuando la soglia del “abbastanza buono” come criterio operativo. Meno esclusività, più sostituibilità: la scelta del modello diventa una leva economica ancor prima che tecnica.

"Stiamo raggiungendo la soglia dell’“abbastanza buono” per l’adozione di massa: se alternative economiche risolvono il 90% dei compiti, l’abbonamento premium diventa difficile da giustificare." - u/wenhuizhao (14 punti)

Il vantaggio competitivo non è “nei pesi” ma nelle persone e nell’orchestrazione: le discussioni sulle continue uscite di ricercatori da Google evidenziano che competenze di valutazione, allineamento e direzione dei modelli restano l’asset irriproducibile. Per blindare l’ecosistema, i grandi attori spingono sulla filiera: emblematica la mossa di Google con l’investimento in A24 per sviluppare strumenti cinematografici basati su IA, dove infrastruttura e creatività diventano un circuito di feedback, posizionando le piattaforme non solo come fornitori di modelli ma come partner di processo.

Dati, allucinazioni e sorgenti nascoste

Quando i modelli inciampano, la causa non è sempre “i dati cattivi”: l’indagine su una citazione allucinata rintracciata tra prompt di sistema e bug di post-addestramento mostra un effetto “cavallo di Clever Hans” in versione testuale, dove esempi e routine interne spingono il modello a rispondere a prescindere dall’input. Eliminare il caso sintomatico aiuta, ma non cura l’intero fenomeno: servono progettazione del prompt, verifiche sperimentali e robustezza del post-addestramento.

"Sono sempre curioso di capire cosa porta alle allucinazioni." - u/RADICCHI0 (31 punti)

Parallelamente, la consapevolezza che una quota significativa dei dati ancora utili giace su nastri magnetici in magazzino pone un tema di infrastruttura e costi: recuperare, indicizzare e curare quelle fonti potrebbe diventare la vera frontiera della qualità, proprio mentre il web “facile” si esaurisce. La prossima ondata di prestazioni potrebbe dipendere meno da nuovi parametri e più dall’estrazione di valore dalle riserve d’archivio, rinnovando l’attenzione su pipeline, annotazione e governance dei dati end-to-end.

Titolo	Utente	Punti	Data
So now scraping data without permission is bad for AI training all of sudden?	u/base64-encode	575	27/06/2026
Cheap Chinese AI models are quickly gaining customers across the US market: This changes things	u/BathroomMaximum1721	306	24/06/2026
We chased a hallucinated quote through 30k training records, 4,600 transcripts, and our own system prompt. Turned out to be two separate bugs	u/Sardzoski	264	24/06/2026
Claude Fable 5 may return today after 13-day government-forced suspension	u/Direct-Attention8597	258	25/06/2026
Google Invests 75 Million in A24 to Develop AI-Powered Filmmaking Tools	u/ControlCAD	177	23/06/2026
Leaked files detail Russia's Social Design Agency building fake reference platforms to contaminate AI training data and search indices	u/Justgototheeffinmoon	132	23/06/2026
Google keeps losing top ai researchers, the moat was never the weights	u/Adventurous_Rush1474	111	26/06/2026
I have it on good authority that Google are going to be hit with export controls soon.	u/ThoseOldScientists	108	27/06/2026
A significant portion of the remaining training data for AI is located on magnetic tapes stored in warehouses.	u/BudgetLimit6364	91	24/06/2026
Canadian government spent tens of millions on secret Palantir contract	u/Goldenmentis	83	22/06/2026

Titolo

Utente

Punti

Data

So now scraping data without permission is bad for AI training all of sudden?

u/base64-encode

575

27/06/2026

Cheap Chinese AI models are quickly gaining customers across the US market: This changes things

u/BathroomMaximum1721

306

24/06/2026

We chased a hallucinated quote through 30k training records, 4,600 transcripts, and our own system prompt. Turned out to be two separate bugs

u/Sardzoski

264

24/06/2026

Claude Fable 5 may return today after 13-day government-forced suspension

u/Direct-Attention8597

258

25/06/2026

Google Invests 75 Million in A24 to Develop AI-Powered Filmmaking Tools

u/ControlCAD

177

23/06/2026

Leaked files detail Russia's Social Design Agency building fake reference platforms to contaminate AI training data and search indices

u/Justgototheeffinmoon

132

23/06/2026

Google keeps losing top ai researchers, the moat was never the weights

u/Adventurous_Rush1474

111

26/06/2026

I have it on good authority that Google are going to be hit with export controls soon.

u/ThoseOldScientists

108

27/06/2026

A significant portion of the remaining training data for AI is located on magnetic tapes stored in warehouses.

u/BudgetLimit6364

24/06/2026

Canadian government spent tens of millions on secret Palantir contract

u/Goldenmentis

22/06/2026

Titolo	Utente
So now scraping data without permission is bad for AI training all of sudden?	27/06/2026 u/base64-encode 575 pts
Cheap Chinese AI models are quickly gaining customers across the US market: This changes things	24/06/2026 u/BathroomMaximum1721 306 pts
We chased a hallucinated quote through 30k training records, 4,600 transcripts, and our own system prompt. Turned out to be two separate bugs	24/06/2026 u/Sardzoski 264 pts
Claude Fable 5 may return today after 13-day government-forced suspension	25/06/2026 u/Direct-Attention8597 258 pts
Google Invests 75 Million in A24 to Develop AI-Powered Filmmaking Tools	23/06/2026 u/ControlCAD 177 pts
Leaked files detail Russia's Social Design Agency building fake reference platforms to contaminate AI training data and search indices	23/06/2026 u/Justgototheeffinmoon 132 pts
Google keeps losing top ai researchers, the moat was never the weights	26/06/2026 u/Adventurous_Rush1474 111 pts
I have it on good authority that Google are going to be hit with export controls soon.	27/06/2026 u/ThoseOldScientists 108 pts
A significant portion of the remaining training data for AI is located on magnetic tapes stored in warehouses.	24/06/2026 u/BudgetLimit6364 91 pts
Canadian government spent tens of millions on secret Palantir contract	22/06/2026 u/Goldenmentis 83 pts

Titolo

Utente

So now scraping data without permission is bad for AI training all of sudden?

27/06/2026

u/base64-encode

575 pts

Cheap Chinese AI models are quickly gaining customers across the US market: This changes things

24/06/2026

u/BathroomMaximum1721

306 pts

We chased a hallucinated quote through 30k training records, 4,600 transcripts, and our own system prompt. Turned out to be two separate bugs

24/06/2026