Proprio ieri accennavo a strumenti web per verificare il posizionamento di un sito nei motori di ricerca, ma come funziona un motore di ricerca? Quando facciamo una ricerca in internet digitiamo un termine ed in un attimo vediamo apparire sullo schermo delle pagine con i vari risultati della ricerca. Ma cosa avviene nel motore di ricerca?
Dal blog di Daniel Serra abbiamo una descrizione dei vari passaggi su come funziona un motore di ricerca, mi sembra molto interessante, traduco così a grande linee le varie fasi che possiamo seguire anche dall’immagine (ingrandire).
1) Tutto inizia con un bot chiamato anche spider o crawler che raccoglie tutte le informazioni che trova percorrendo tutti i server del world wide web. Il bot è un programma che visita le pagine di internet in maniera automatica e le copia. Esiste inoltre un bot speciale chiamato “fresh bot” che passa più spesso per quei siti che attualizzano le pagine frequentemente. Raccolte queste pagine vengono mandate al Page Depository, poi verranno visitati anche i link presenti all’interno di queste pagine e così via.
2) Il Page Depository è il cache, l’ultima attualizzazione che il bot ha copiato di una determinata pagina. Tonnellate di informazioni su disco rigido. Quando viene fatta una ricerca in internet, il link al cache possiamo vederlo alla fine di ogni risultato.
3) L’indexing module prende le pagine del Page Depository e ne estrae le informazioni più rilevanti creando così una versione compressa che sarà utilizzata negli indici. Troviamo titolo, descrizione, anchor texts, links, parole in grassetto ed altro.
4) Dalle informazioni del Indexing module si creano gli indici come il:
Content Index che indica in quale pagina si trova una determinata parola nel Page Depository. Funziona come nei libri di testo dove alla fine del libro c’è l’indice delle parole e le pagine corrispondenti dove sono presenti.
Il Structure Index dove ci sono informazioni di come le pagine sono linkate tra di loro, link entranti ed in uscita, con queste informazioni si calcola il PageRank.
Ci sono poi tutta una serie di altri indici di file pdf, immagini ed altro.
5) Tutto questo procedimento avviene in modo costante giorno e notte. Quando un utente va in un motore di ricerca come ad esempio Google e digita qualcosa, questa ricerca entra nel Query Module che trasforma le parole cercate in numeri. Quindi viene consultato il Content Module per definire la lista di pagine che ha il contenuto rilevante per quella ricerca, queste vengono quindi ordinate in base al Content Score (contenuto della pagina con le keywords più rilevanti), prelevate dal Page Depository e mandate al Ranking Module.
6) Il Ranking Module prende queste pagine, cerca il PageRank di ognuna nel Structure Index quindi calcola il Overall Score (che definisce l’ordine con cui devono essere presentate le pagine) e che dipende del Content Score e del PageRank e le presenta così all’utente, il tutto a velocità supersonica in frazioni di secondo.
Da: Daniel Serra
Condividi:
Se ti è piaciuto l'articolo, iscriviti al feed per tenerti sempre aggiornato sui nuovi contenuti del blog! Per maggiori informazioni sui feed, clicca qui! |





Se ti è piaciuto l'articolo, 




















0 commenti:
Posta un commento