5.12.07

Storia dei motori

fonte: Informatica per le scienze umane


I motori di ricerca oggi si presentano come pagine web che ci permettono di recuperare informazioni, ma in realtà la nascita e l’utilizzo dei motori di ricerca precedono di molto l’avvento del WWW.E’ all’inizio degli anni ’90 che Tim Berners-Lee, Robert Cailliau, e altri ricercatori, svilupparono le tecnologie necessarie alla pubblicazione di quei documenti ipertestuali connessi fra loro che formeranno il WorldWideWeb.I motori di ricerca erano, però, già attivi da parecchi anni, anche se non si trattava di pagine web, bensì di veri e propri software da installare sul proprio pc, che permettevano di indicizzare le risorse della rete.

I primi motori di ricerca sul web fuorono fiaschi, o comunque estremamente tecnici e complessi da usare, come Archie e Veronica.
Per vedere il primo motore di ricerca vero e proprio sul web bisogna attendere fino al 1994, quando nacque WebCrawler, un progetto dell’Università di Washington. Fra le innovazioni introdotte da WebCrawler la più importante è sicuramente l’utilizzo di uno spider, un programma che navigando la rete memorizza le informazioni e le rende utili per gli utenti del sito. Per quanto innovativo i risultati erano semplici elenchi di pagine web che non andavano molto lontani da quelli di un comune portale.
Questi primi progetti spianarono la strada per quelli che poi divennero i veri colossi del settore prima di Google: Lycos, Excite e Yahoo.
Lycos nacque nel 1994 dalla mente del dott. Micheal Muldin e dai soldi del Ministero della Difesa. Usava uno spider per indicizzare il web come i suoi predecessori, ma con algoritmi più sofisticati. Il suo punto di forza era l’analisi lessicale del testo e delle descrizioni dei link in uscita dalle pagine web, per costruire piccole sintesi poste sotto i risultati della ricerca.
Excite nel 1996 si vantava di avere il “doppio della potenza dei suoi concorrenti”, e aveva sostituito alla solita tecnologia basata sulle analisi lessicali, un sistema di analisi statistiche per raggruppare gruppi di siti in base al tema trattato.
Entrambi questi motori di ricerca fallirono per avere peccato di troppo entusiasmo, lanciandosi nei mercati azionari e dimenticando quelle che erano le loro mansioni originarie.
Diversa sorte ebbe Yahoo. Creato, quasi per caso, da Jerry Yang e David Filo, crebbe fino a occupare un ruolo dominante nel settore, tanto che nel 1998 si calcolava che fossero circa 140 milioni le pagine web visitate ogni giorno a partire da Yahoo. Non si tratta di un motore di ricerca puro, infatti molti dei siti censiti vengono catalogati manualmente dagli stessi operatori, e indicizzati tramite directory e sotto-directory raggruppate in aree tematiche. I fondatori stessi ancora oggi definiscono Yahoo come una società editoriale e multimediale più che tecnologica.

Goggle propose un sistema totalmente nuovo di fare ricerca, che prendeva spunti dalla matematica e dal mondo delle pubblicazioni accademiche. Tutto ebbe inizio allìuniversità di Stanford, dove i due fondatori, Lawrence Page e Sergej Brin, erando dottorandi al corso d’informatica. A differenza dei suoi colleghi che si arricchivano aprendo società on-line, Page era più attratto dagli aspetti matematici del web. Notò che ogni computer era un nodo, ogni link era una connessione fra nodi, e il tutto andava a comporre una tipica struttura a grafo. Notò anche che non era possibile all’epoca vedere i link in entrata ad una determinata pagina, e quindi non si poteva sapere quali o quante pagine web avessero linkato tale pagina. Decise di sviluppare un progetto, chiamato BackRub, al quale si aggiunse, poi, anche Brin, che consisteva in uno spider che sondava la rete per capirne la struttura e quindi anche i link in entrata. BackRub, però, capiva anche quali erano i nodi più importanti del web in base alla loro capacità di attrarre link. A questo punto si poteva stilare una graduatoria per importanza dei siti, applicando qualche principio dell’editoria accademica, in particolare quelli di citazione e annotazione, in base ai quali più un’opera è importante più altri autori ne fanno uso nelle loro opere. Insieme Page e Brin inventarono un sistema per premiare i link provenienti da fonti autorevoli a discapito degli altri. Svilupparono, quindi, un algoritmo che tenesse conto sia del numero di link in verso un particolare sito, sia verso ognuno dei siti collegati al primo. Questo sistema, oggi meglio noto come PageRank, era ottimale perché per sua stessa natura, più il web diventa grande, più esso lavora bene. Google divenne operativo nel febbraio del 1996, sul sito web dell’università di Stanford, e il 7 settembre 1998 Google Inc. venne formalmente costituita, divenendo, nel giro di pochi anni, il colosso multimiliardario che oggi tutti conosciamo.

0 commenti: