Algoritmo HITSHyperlink-Induced Topic Search (HITS; conosciuta anche come hubs and authorities) è un algoritmo, sviluppato da Jon Kleinberg, di valutazione delle pagine web in funzione dei link. L'idea dell'algoritmo si fonda su una particolare intuizione di come le pagine del web si stavano formando. Infatti, certe pagine web, conosciute come hub, o pagine "concentratrici", fungevano esclusivamente da grandi directory, prive di un contenuto, venendo di fatto utilizzate soltanto come indice. Descrizione dell'algoritmoL'algoritmo si divide in due fasi:
A volte HITS tende a generalizzare o deviare dal topic specifico, in particolare quando gli hub coprono diversi argomenti. Una possibile soluzione è confrontare le parole della query con quelle del testo che circonda un link in maniera tale da ottenere una versione ''pesata'' della regola di aggiornamento. Un'altra soluzione è la suddivisione degli hub grandi in hub più piccoli detti hublet ed ignorare quelli che sono meno inerenti alla query. Differenze principali con il PageRankIl PageRank può essere precalcolato mentre HITS viene elaborato a tempo di esecuzione della query, che si traduce in costi più elevati. Vi sono anche differenze nelle scelte che riguardano il modello formale. Information related to Algoritmo HITS |