Karen Spärck Jones, la “madre” dei motori di ricerca

Una sua funzione, pubblicata all'inizio degli anni Settanta, ha dato il là a molti dei sistemi a nostro uso e consumo quotidiano

08/03/2024 di Enzo Boldi

Se i motori di ricerca che utilizziamo ogni giorno riescono a trovare risposte alle nostro domande, lo dobbiamo a una donna che nella seconda metà del Novecento sviluppò una funzione fondamentale per il loro funzionamento. Parliamo di Karen Spärck Jones, informatica britannica che ha fatto la storia dell’evoluzione tecnologica globale. Nonostante una formazione che potremmo pensare come molto distante dal mondo dell’informatica che conosciamo oggi, la sua figura e le sue intenzioni hanno dato la spinta a molti dei paradigmi nascosti che – oggi – sono a nostro uso e consumo. 

LEGGI ANCHE > Ada Lovelace, l’inventrice dell’algoritmo ante litteram

Classe 1935, iniziò per un breve tempo a insegnare. Ma la sua esperienza nella didattica durò poco e nel giro di pochi anni iniziò la sua carriera nel mondo dell’informatica. Prima nell’unità di ricerca linguistica di Cambridge, poi nel laboratorio di informatica della stessa Cambridge. Un fil rouge rimasto vivo fin dalla seconda metà degli anni Cinquanta, con particolare attenzione all’Information Retrieval, ovvero la rappresentazione, memorizzazione e organizzazione dell’informazione non strutturata. In modo non testuale.

Karen Spärck Jones, la “madre” dei motori di ricerca

Ed è il 1972 l’anno in cui si ultimarono quegli studi (poi attualizzati e modificati in base al sorgere delle nuove tecnologie) che oggi ritroviamo – tecnicamente – all’interno della maggior parte dei motori di ricerca. Parliamo della cosiddetta funzione TF-IDF (term frequency–inverse document frequency), che ancora oggi ritroviamo come parte dello schema di ponderazione dei più moderni motori di ricerca. Questo suo studio è stato pubblicato all’inizio di quello stesso anno, in un saggio chiamato “A Statistical Interpretation of Term Specificity and Its Application in Retrieval“. Ma di cosa stiamo parlando?

In questo lavoro, introdusse la funzione TF-IDF, sigle che stanno per “Term Frequency-Inverse Document Frequency”. Si tratta, come detto, di un cosiddetto algoritmo su cui, ancora oggi, si basano molti dei più utilizzati motori di ricerca in Internet. Dai più grandi ai più piccoli. In pratica, la funzione TF-IDF valuta la rilevanza di un documento rispetto a una query (domanda/richiesta), assegnando un punteggio più alto ai termini che compaiono frequentemente nel documento e raramente in altri documenti. Esattamente come funzionano i motori di ricerca. Infatti, questo algoritmo ha permesso di portare delle enormi migliorie per quel che riguarda l’efficacia e l’accuratezza dei sistemi di ricerca. E ha esteso anche questo concetto travalicando quei limiti tecnici che si erano palesati fino ad allora.

Dunque, Karen Spärck Jones è stata una figura di enorme importanza per l’evoluzione dell’informatica e della sua applicazione alle nuove e vecchie tecnologie. Non è un caso che, per il suo contributo inestimabile, nel corso della sua carriera abbia ricevuto numerosi riconoscimenti: dal Premio ACM SIGIR Gerard Salton Award nel 1988, al Premio ASIST Award of Merit nel 1994. Infine, quattro anni dopo, è stata nominata Membro della Royal Society.

Share this article
TAGS