Si stima che il 50% degli articoli online sia ormai generato dall’intelligenza artificiale. Sempre più piattaforme evitano contenuti che suonano innaturali e troppo artefatti
Gli esperti di Open Resource Applications, un’azienda che sviluppa strumenti di intelligenza artificiale gratuiti, creati e verificati da esseri umani, hanno confrontato la capacità di diverse piattaforme di IA di scrivere testi dal suono umano e se le applicazioni di rilevamento dell’IA siano in grado di riconoscere la scrittura generata dall’IA.
L’analisi ha preso in esame 12 generatori di testo basati sull’intelligenza artificiale, tra cui Gemini, Claude AI, Grok, Perplexity AI, Meta AI e altri, fornendo loro le stesse istruzioni per avere un confronto diretto.
Ogni strumento ha generato un articolo di 1.000-1.500 parole che doveva risultare il più possibile simile a un testo umano. Questi testi sono stati valutati con tre strumenti di rilevamento basati sull’IA Grammarly, QuillBot e GPTZero.

I tassi di rilevamento sono stati inoltre confrontati con quelli di testi scritti da esseri umani e analizzati con gli stessi strumenti. Ecco i risultati delle analisi che ha portato ad rilevamento dei contenuti generati con la percentuale annessa.
| Possibile rilevamento di intelligenza artificiale | ||||
| Nome del chatbot AI | Grammarly | QuillBot | GPTZero | IA media rilevata |
| Gemini | 17% | 0% | 100% | 39,00% |
| Claude AI | 0% | 30% | 93% | 41,00% |
| Grok AI | 39% | 0% | 100% | 46,33% |
| DeepSeek | 6% | 36% | 98% | 46,67% |
| PI | 17% | 43% | 100% | 53,33% |
Principali risultati
- Gemini è il migliore nel riprodurre un suono umano, con quasi nessun contenuto segnalato durante l’analisi da Grammarly e QuillBot.
- Grammarly ha la capacità più limitata di riconoscere i testi generati dall’IA, identificando correttamente solo il 43,5% del contenuto prodotto.
- GPT Zero è lo strumento di rilevamento più difficile da ingannare, con un tasso di riconoscimento del 98,8%.
I generatori di IA più popolari non riescono a ingannare gli strumenti di rilevamento
Sebbene ChatGPT sia lo strumento di intelligenza artificiale più popolare, con 800-900 milioni di utenti mensili, si posiziona al 9° posto tra le 12 chat analizzate per quanto riguarda la somiglianza della scrittura con quella umana.
Grammarly ha individuato metà del testo come contenuto generato, mentre QuillBot e GPTZero hanno correttamente identificato che il 90-100% dell’articolo era generato dall’IA.
“ChatGPT si posiziona così in basso in classifica perché è stata la prima grande intelligenza artificiale sul mercato e tutti ne conoscono il suono“, spiega un portavoce di Open Resource Applications. “Molti modelli successivi inizialmente avevano un suono simile a quello di Chat, prima di differenziarsi in modo più specifico. Ecco perché i rilevatori di IA lo individuano così facilmente.“
Top 3 – Diversi approcci alla scrittura realistica
Gli strumenti che si sono dimostrati più efficaci nell’imitare il linguaggio naturale, ovvero Gemini, Claude AI e Grok, presentano approcci diversi allo stile di scrittura. Claude si concentra maggiormente su un tono professionale e incorpora spunti tratti dalle fonti, mentre Grok ha un aspetto più informale. Solo il 39% dei testi prodotti da Gemini è stato riconosciuto come generato, seguito a ruota da Claude con il 41%.
Strumenti di riconoscimento basati sull’intelligenza artificiale
I risultati riflettono l’efficacia degli strumenti di riconoscimento basati sull’IA, oltre a mostrare quali modelli linguistici complessi (LLM) siano più adatti alla scrittura umana. GPT Zero si è dimostrato il migliore nell’individuare la scrittura generata dall’IA, con solo Claude e Meta AI in grado di confonderla. Tuttavia, GPT Zero ha mancato solo il 5-8% della scrittura generata dall’IA, identificando correttamente il resto.
INDICE DEI CONTENUTI







































Lascia un commento
Visualizza commenti