Google può riconoscere e penalizzare i testi generati da ChatGPT? È vero che nel testo generato da ChatGPT è presente un sistema di watermarking per riconoscere i testi generati automaticamente? Può generare una penalizzazione Google? Come evitarla? Quando devi produrre contenuti ottimizzati per web, SEO e traduzioni, ecco alcune informazioni e suggerimenti per un uso etico di ChatGPT e come evitare di incorrere in penalizzazioni SEO da parte di Google.
Sommario
1. Un testo di ChatGPT è rilevabile da Google?
ChatGPT è un chatbot disponibile liberamente da Dicembre 2022. Fornisce risposte talmente accurate, evolute e verosimili da rivoluzionare professioni affermate e interi settori produttivi. Molti pensano che i contenuti AI prodotti da ChatGPT possano soppiantare la totalità degli articoli scritti da esperti umani.
ChatGPT è un modello di linguaggio naturale sviluppato da OpenAI che può essere utilizzato per generare testi di alta qualità in modo automatico. Tuttavia, ChatGPT può essere utilizzato anche in modo improprio per creare contenuti di scarsa qualità e guadagnarsi illecita visibilità dai motori di ricerca.
Per contrastare questo fenomeno, credo che Google, come altri motori di ricerca, con ogni probabilità utilizzerà algoritmi in grado di rilevare il contenuto generato dai modelli di linguaggio naturale come ChatGPT. La conseguenza sarà che i siti che utilizzano in modo improprio testi generati da ChatGPT potranno essere penalizzati.
2. Un uso etico di ChatGPT per evitare penalizzazioni Google
Nonostante vi sia sempre un rischio di penalizzazione, ci sono modi etici di utilizzare ChatGPT. Ad esempio, ChatGPT può essere utilizzato come supporto nella scrittura di contenuti ottimizzati SEO, permettendo di risparmiare tempo e fatica strutturando correttamente il contenuto, oppure ricercando le keyword giuste da utilizzare.
Tuttavia, è importante ricordarsi sempre di citare le fonti e di non copiare e incollare larghe porzioni di testo generato da ChatGPT. In questo modo è possibile sfruttare al meglio le potenzialità di ChatGPT senza rischiare di incorrere in penalizzazioni da parte di Google.
3. Un sistema di watermarking nei testi, rilevabile da Google
Un sistema di watermarking consentirà di capire se un contenuto è stato generato da ChatGPT oppure no. È ragionevole pensare che in futuro Google potrà rilevare se nelle pagine di un sito è presente del testo generato da ChatGPT, valutando una possibile penalizzazione.
Non si hanno ancora conferme da OpenAI, ma è possibile che i testi prodotti da ChatGPT contengano già ora un watermark. Nel caso dei testi generati da ChatGPT il watermark è una sorta di marchio invisibile, che è riconoscibile solo esaminando la combinazione di parole, lettere e punteggiatura del testo generato.
Secondo le recenti rivelazioni di Scott Aaron, uno specialista di sicurezza e crittografia che ha operato per ChatGPT , OpenAI ha introdotto nei testi generati da ChatGPT un pattern di parole, lettere e punteggiatura che svolge la funzione di watermarking.
Un watermark crittografato
Conosciamo tutti il watermark come un marchio visibile semitrasparente incorporato in un’immagine, nelle foto e nei video. Il watermark ha lo scopo di indicare chiaramente chi è l’autore originale dell’opera.
Come fa ad esserci un watermark in un testo? Grazie all’applicazione di tecniche di crittografia, nel testo prodotto da ChatGPT sarà presente un watermark costituito da un modello di parole, lettere e punteggiatura, proprio come un codice segreto completamente invisibile.
La presenza di un sistema di riconoscimento del testo generato, sostiene lo specialista di OpenAI, è necessaria per prevenire la possibilità che i testi generati da ChatGPT vengano usati p.es. come plagio accademico ma anche per evitare che i testi prodotti siano generati massivamente per una propaganda illecita.
Come funziona il watermarking di ChatGPT?
Il watermarking presente nei testi generati da ChatGPT è un sistema che incorpora un modello statistico e un codice nelle scelte delle parole e nei segni di punteggiatura. Questo è possibile in quanto i contenuti creati dall’intelligenza artificiale sono generati con uno schema abbastanza prevedibile di scelta delle parole, ovvero una specie di schema statistico.
Come fa il watermark ad essere invisibile? In un testo generato da ChatGPT, la distribuzione delle parole ha ancora un aspetto casuale simile al normale testo generato dall’IA, e quindi all’occhio umano non è rilevabile la presenza di un “pattern” nei contenuti e nella distribuzione delle parole scelte (distribuzione pseudocasuale di parole).
Scegliere determinate parole, combinazioni di parole, punteggiatura e tipo di sintassi è un modo per “marchiare” il testo in maniera successivamente riconoscibile. Questo rende semplice per un sistema automatico rilevare se il testo è frutto di uno specifico generatore di testo di intelligenza artificiale.
Ufficialmente, il watermark di ChatGPT non è attualmente in uso, in quanto attualmente ancora in versione beta. Tuttavia, nelle dichiarazioni rilasciate dallo specialista di OpenAI, è pianificata l’attivazione del watermarking in una versione finale di ChatGPT o poco prima.
Il watermarking necessita un testo lungo
Secondo le dichiarazioni rilasciate, introdurre efficacemente il watermarking in un testo breve risulta troppo complesso; quindi, la “marchiatura” del testo sarebbe possibile con un testo di lunghezza significativa.
In questo caso, ogni volta che ChatGPT genera un testo sufficientemente lungo, nel testo verrà inserito un “segnale segreto” impercettibile, scegliendo opportunamente parole e punteggiatura. Questo codice potrà essere successivamente rilevato da un sistema automatico che “rilegge” il testo, per dimostrare in seguito che un determinato testo proviene da ChatGPT.
Il watermarking è una soluzione per la privacy
Introdurre un watermarking è una soluzione pressoché obbligata per la missione di OpenAI. È necessaria in quanto uno dei fondamenti teorici delle applicazioni di intelligenza artificiale è che “nessun prodotto AI possa mai nuocere agli umani”. Nel caso di ChatGPT, è possibile che i testi generati vengano usati per scopi illeciti; quindi, è necessario quantomeno che i testi generati automaticamente siano identificabili.
Ci sono diverse discussioni sui social media in cui si ipotizza che OpenAI tenga un archivio (sterminato) di ogni testo generato e che sia possibile utilizzare tale archivio per verificare se una frase sia stata generata da ChatGPT. OpenAI non ha smentito questa circostanza, che pone importanti questioni di privacy.
L’utilizzo del watermarking per ChatGPT è invece una buona soluzione alternativa che consente di abbandonare l’idea dell’archivio e sollevare OpenAI da ogni problema di privacy.
GPTZero: un tool che riconosce testo scritto da Chat Gpt
Per esempio, ecco un tool che valuta se un testo è prodotto da Chat GPT oppure da un umano: GPTZero
- Inserisci il testo
- Premi Ctrl-Enter
- Ottieni la valutazione
La valutazione è un po’ verbosa e un po’ macchinosa, espressa in un valore di “perplessità”. Minore la perplessità, maggiore è la possibilità che il testo sia stato generato da ChatGPT. Per esempio, ho appena ottenuto una perplessità di 150 con un testo prodotto da Chat GPT, e una perplessità di 1300 su un testo realizzato da me.
Questo sistema è nato per contrastare il dilagare di ChatGpt tra gli studenti americani ed è diretto soprattutto a insegnanti, per rilevare chi ha copiato i compiti con Chat GPT. Facile pensare ad uno spin-off di GPTZero a uso commerciale, magari utilizzato da Google per penalizzare pagine interamente copiate da Chat GPT.
Come aggirare il watermarking di ChatGPT
C’è un modo per aggirare il sistema di watermarking? Teoricamente sì. Il watermarking di ChatGPT funziona finché il testo viene mantenuto perfettamente integro. Qualora un testo generato da ChatGPT venga modificato o riscritto da un umano (oppure riscritto da un diverso sistema di generazione automatica dei testi) allora il codice di watermarking verrebbe più o meno danneggiato, fino a renderlo non più riconoscibile in caso di riscrittura massiva del testo.
4. Come agirà Google
Nel caso l’uso di ChatGPT continui a diffondersi al ritmo attuale, c’è il concreto rischio che i contenuti digitali vadano progressivamente a soppiantare i testi prodotti da umani. Se questo non è un problema (anzi è un beneficio) per determinati settori, è invece un grosso problema per i testi accademici, per la scienza, la ricerca e la scuola. Inoltre, un abuso di generazione dei testi mirato p.es. a produrre testi di propaganda e orientare massivamente le opinioni delle persone porrebbe problemi molto complessi da affrontare.
La posizione di Google ad oggi (Feb 2023) è espressa nel post Google Search’s guidance about AI-generated content. In sintesi:
- Google non vieterà tutti i contenuti generati automaticamente, nemmeno usando intelligenza artificiale, ma penalizzerà solo i contenuti mirati alla manipolazione del ranking di ricerca. Traduzione: se scrivi bene cose interessanti, allora puoi usare AI. Se scrivi schifezze con l’AI, verrai penalizzato. Ciò che conta è se scrivi robe interessanti o schifezze, non se usi AI.
- Google incoraggia la creazione di contenuti originali e incentrati sulle persone. I contenuti devono mostrare competenza, esperienza, autorevolezza e affidabilità (E-E-A-T expertise, experience, authoritativeness, trustworthiness). Traduzione: Google si occupa del merito dei contenuti, non di come li hai prodotti. E per il merito dei contenuti vale quanto detto in 1.
Via libera Google, quindi, a testi, immagini, video, audio prodotti con AI. Non ci saranno conseguenza SEO dirette nell’uso di ChatGPT e compagnia bella. Almeno, a breve.
5. SEO: come evitare penalizzazioni da ChatGPT
I testi creati con ChatGPT inonderanno in breve tempo i siti web, creando molteplici problemi. Riconoscere se un testo è prodotto da un autentico esperto umano o da una intelligenza artificiale diventerà un tema assolutamente prioritario nel brevissimo futuro, probabilmente già nel corso dell’anno corrente in cui scrivo, 2023.
Come comportarsi, allora?
Per chi produce contenuti, sicuramente i testi prodotti da ChatGPT sono un ausilio incredibile e irrinunciabile. Va però evitato il copia-e-incolla massivo. Non mi pare corretto derogare completamente ad un sistema AI la qualità di un contenuto e del lavoro SEO interno al sito. A maggior ragione, data la probabile presenza futura di un watermarking nei testi, facendo copia-e-incolla di grandi porzioni di testo si rischia una dura penalizzazione.
Suggerisco quindi molta cautela e consiglio di utilizzare ChatGPT come suggerimento e ausilio per la struttura dei contenuti, per trovare spunti, per verificare di non essersi dimenticati nulla nei contenuti del sito. Ecco, questo mi pare un uso corretto dello strumento ChatGPT.
Aggiungo un’ovvietà: va ovviamente sempre verificata la veridicità di ciò che ChatGPT ha scritto. P.es. propri ieri ho chiesto a ChatGPT di elencarmi i principali concorrenti di un mio cliente. Almeno 2 dei “concorrenti” citati non esistono e sono stati inventati di sana pianta da ChatGPT.
6. Quattro regole per un uso SEO etico di ChatGPT
Per chi fa SEO professionale, riassumo i miei suggerimenti in 4 semplici indicazioni, mirate ad un uso etico e proficuo di ChatGPT nel SEO:
- Usare ChatGPT per spunti, verifiche, suggerimenti
- Verificare sempre se le affermazioni fatte nel testo generato corrispondono a realtà
- Evitare copia-e-incolla di grandi porzioni di testo. Limitare al massimo a 1-2 righe (diciamo ai canonici 160 caratteri) la quantità di testo prodotta da ChatGPT, copiata e pubblicata senza variazioni per ciascun paragrafo.
- Eventuali testi lunghi generati automaticamente devono essere riscritti manualmente.
In questo modo la scrittura di contenuti ottimizzati SEO potrà essere svolta meglio, più rapidamente, con maggiore brillantezza e qualità, evitando ogni tipo di penalizzazione futura. Questo è il vero obiettivo per un SEO professionale.
7. Usare ChatGPT per un uso etico nel SEO
In conclusione, ChatGPT può essere uno strumento molto utile per la scrittura di contenuti, ma è importante utilizzarlo in modo responsabile e etico sia per evitare di incorrere in possibili penalizzazioni da parte di Google sia per fornire ai propri utenti un contenuto esclusivo, originale, interessante.
Sebbene il rischio di penalizzazione sia reale, ci sono modi etici di utilizzare ChatGPT come supporto alla scrittura, citando sempre le fonti e evitando di presentare il testo generato come se fosse stato scritto dall’autore del sito. In questo modo, è possibile sfruttare al meglio le potenzialità di questo modello di linguaggio naturale senza mettere a rischio la visibilità del proprio sito sui motori di ricerca.