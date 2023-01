Cosa succede se fai scrivere i tuoi articoli a un’intelligenza artificiale?, scriveva giorni fa Il Post, con squisito understatement, in merito alla debacle di Cnet. Per questa testata tecnologica americana infatti l’AI è stata un boomerang: prima è emerso che aveva pubblicato alcuni articoli prodotti con una tecnologia di machine learning (quindi non scritti da umani) senza però adeguata trasparenza nei confronti del pubblico; poi si è aggiunto il fatto che i suddetti articoli fossero pieni di errori; infine è arrivato l’annuncio che la pubblicazione di simili contenuti sarebbe stata sospesa.

Ma Futurism, la testata che per prima ha puntato l‘indice contro i contenuti “automatizzati” di Cnet, non si è fermata qui ed è tornata all’attacco con un’altra accusa: “gli articoli generati dall’intelligenza artificiale di CNET avrebbero mostrato profonde somiglianze strutturali e nelle frasi con articoli precedentemente pubblicati altrove, senza però citarli o dare conto di ciò”.

Futurism ha mostrato i brani incriminati a un professore di business administration (e a un professore di filosofia) che li hanno valutati come “plagi”, nel senso che se presentati da umani sarebbero considerati plagi (sarebbe stato interessante sentire il parere di un ricercatore di AI e se consideri il concetto di plagio applicabile alla tecnologia sottostante). Scrive ancora Futurism: “Forse, alla fine, tutto ciò non dovrebbe stupire più di tanto. Di base, il funzionamento dei sistemi di machine learning prevede l’immissione di un’immensa quantità di “dati di addestramento” (training data), la loro elaborazione con algoritmi sofisticati e l’ottenimento di un modello in grado di produrre un lavoro simile su richiesta. I ricercatori in passato hanno individuato esempi di AI che copiano i propri dati di addestramento. Nel 2021 i ricercatori della Johns Hopkins University, della New York University e di Microsoft hanno scoperto che le AI che generano testi “a volte copiano in modo sostanziale, in alcuni casi duplicando passaggi di oltre 1.000 parole, dal set di addestramento”.