Chatbot e motori di ricerca

12 aprile 2022

Loro diventano sempre più intelligenti, e noi sempre più stupidi?

Chatbot, da chat+(ro)bot, quindi in italiano potremmo tradurlo con "robot che parla". Gli manca però il numero della smorfia, ci dovremo accontentare del 48, per approssimazione.
Il bot del chatbot in verità non sarebbe un vero robot. È un'entità virtuale, che capita di incontrare navigando internet, e che interagisce con l'utente in linguaggio naturale, scritto o vocale.
Erano onnipresenti, praticamente chiunque avesse un sito si sentiva obbligato ad avere un chatbot. Ma poi molti si sono resi conto che se accetti che ti facciano qualunque domanda devi anche essere in grado di produrre qualunque risposta, o almeno produrre una risposta pertinente la maggior parte delle volte.
Mentre in realtà nella maggior parte dei casi le risposte disponibili erano pre-confezionate, e poche. Pochissime.
Come nel negozio online di jeans, a cui abbiamo chiesto "dove è coltivato il cotone dei vostri jeans?" e lui ha proposto di rispondere a "Come faccio a verificare che i miei jeans xxxxx siano proprio quelli originali e autentici?". Bah, come bot ci pare piuttosto inutile.

Ma in realtà il chatbot funziona, e pure bene. Il problema non è il bot, o la sintesi vocale, o la comprensione della lingua parlata. Quelle sono tutte cose che l'intelligenza artificiale ora sa fare benissimo. Il fatto è che poi dietro al coso che capisce e parla serve una base di conoscenza da cui pescare le risposte.

E quindi ovviamente il miglior candidato per un chatbot è il motore di ricerca. Di questo si preoccupava il MIT Technology Review qualche mese fa (Chatbots could one day replace search engines. Here's why that's a terrible idea. | MIT Technology Review).

La cosa è molto semplice: invece di cercare un documento che contenga un'informazione che risponde a una mia domanda, faccio direttamente la domanda al motore di ricerca.

Anni fa per scoprire quando è nato Napoleone saremmo andati su Google e avremmo digitato "Napoleone Buonaparte". Dalla lista dei risultati avremmo selezionato un articolo dall'aria promettente, ad esempio Wikipedia o la Treccani, e nell'articolo avremmo cercato la data di nascita.
Oggi se scrivo o dico "Quando è nato Napoleone" Google risponde direttamente "15 agosto 1769", e se scrivo "dove è nato Napoleone" mi risponde Ajaccio, senza batter ciglio (perché non ha le ciglia).
Ma attenzione: Google non sa niente di Napoleone, non ha capito la domanda, e nemmeno la risposta. Google ha capito la sintassi, ha estratto dalla domanda quali erano le informazioni richieste, ha cercato nei suoi database (quindi su internet) la risposta e l'ha presentata. E non ci ha mostrato la sorgente, e meno ancora ci ha permesso di sceglierla.

Se dico "hey gugu, quanto fa 7 per 8?" o se chiedo quando è nato Napoleone, la risposta dovrebbe essere una, e le sorgenti non sono un problema. Molto diverso sarebbe se chiedessi ad esempio "come si è originato il COVID-19". Se ci provate oggi, con Google, Bing o Yahoo otterrete una lista di siti. Se provate a dire al vostro telefono "hey gugu come si è originato il COVID-19?" Google risponde citando sì la sorgente (*), ma ovviamente senza darvi possibilità di scegliere.

Già il fatto che sia il motore di ricerca a selezionare la sorgente è quanto meno opinabile. Ma se questi sistemi evolvendo arrivassero al punto di poter rispondere verbalmente, corriamo il rischio di ricevere risposte apparentemente plausibili ma prese da sorgenti inaffidabili, o deliberatamente false.
Molti conosceranno il termine SEO (Search Engine Optimization). Si riferisce all'arte oscura di scrivere contenuti (e metadati) in modo tale da rendere più probabile la comparsa di una pagina per gli utenti che sono alla ricerca di un concetto, di una specifica informazione. In sostanza, se faccio "bene" la pagina aumento le probabilità che quella pagina sia scelta come risultato di una determinata ricerca. Il problema è proprio il "se faccio bene". Qui non si intende se diciamo la verità, se siamo onesti. Anzi, è quasi il contrario: dobbiamo convincere il motore di ricerca che il nostro contenuto è quello più rilevante per un certo argomento. Quindi il rischio è che il motore finisca per dare più importanza a contenuti che si "vendono meglio" piuttosto che a quelli più autorevoli. E chi ci tiene a vendersi bene più di chi cerca di manipolare il motore di ricerca, per manipolare l'opinione pubblica?

In conclusione, il motore di ricerca troppo intelligente rischia di offuscarci la mente, ridurre la nostra capacità critica, e soprattutto renderci più vulnerabili a condizionamenti voluti da altri e ottenuti diffondendo notizie false o fuorvianti e ingannando i motori di ricerca.

La soluzione? Come dice Il MIT Technology review, forse il linguaggio naturale nei motori di ricerca non è poi un gran progresso. Più in generale occorre rendersi conto dello strapotere esercitato dal motore di ricerca che, senza averlo cercato, è finito per mettersi in mezzo tra noi e tutto internet (**).
Quindi dobbiamo imparare a dipendere meno da gugu, dobbiamo insegnare alle nuove generazioni che quello che trovo in rete non necessariamente è vero, e soprattutto insegnare come cercare e a giudicare le risposte (***).

--------------------------------------------------------------------------

(*) stranamente il comportamento cambia se si fa la domanda in inglese o in italiano. In inglese risponde parlando delle origini, e la sorgente è Wikipedia, in italiano si mette a parlare della trasmissione (che non era la domanda) e la sorgente è il ministero della salute. Inoltre le risposte in italiano cambiano se si chiede "come si è originato" piuttosto che "quali sono le origini"

(**) Sull'esagerato uso del motore di ricerca ci sarebbe molto da dire. Noi abbiamo una collega che piuttosto che salvare una URL nei preferiti (quella del Microsoft Partner Center), fa una ricerca su Google tutte le volte, il che succede diverse volte al giorno, "perché faccio prima".

(***) Sappiamo di un docente della facoltà di storia di Mc Gill (Montreal) che ha scritto un articolo falsissimo su Wikipedia, e subito assegnato ai suoi studenti una ricerca su quello stesso argomento, per poi chiarire a quelli che ci erano cascati copiando da Wikipedia che 1: le sorgenti sono importanti, 2: Wikipedia non è una sorgente affidabile 3: non si copia…

Segui la nostra
pagina su LinkedIn

Tweets by Microsys_Italia