Per capire il PageRank, dobbiamo immaginare internet come un enorme grafo (una rete):

  • Nodi (pallini): Rappresentano le pagine Web ().
  • Archi (frecce): Rappresentano i Link ipertestuali da una pagina all’altra.

La logica del “Voto”

L’idea rivoluzionaria è che un link verso una pagina conta come un voto di fiducia. Tuttavia, non tutti i voti hanno lo stesso peso. L'importanza di una pagina P è la somma dell'importanza delle pagine che la linkano, divisa per il numero di link che queste pagine fanno verso l'esterno.

Esempio: Se una pagina importante ci linka, il nostro rango sale molto. Se una pagina ci linka ma linka anche altre 99 persone, il valore del suo “voto” si diluisce (diventa 1/100).

La Formula Matematica

L’importanza (Rank) di una pagina si calcola così:

Legenda:

  • : È il Rank della pagina che stiamo analizzando.
  • : Sono le pagine “Backlink”, ovvero quelle che puntano verso .
  • : È l’importanza della pagina che ci sta linkando (più è alta, meglio è per noi).
  • : È il numero totale di link in uscita da . Più link fa , meno valore passa a noi.

Il Calcolo Iterativo (Dinamica nel tempo)

C’è un problema: per calcolare il nostro Rank serve il quello dell’altra pagina, ma per calcolare il suo serve il nostro. Come si risolve? Con un processo iterativo nel tempo.

  • Tempo (Ieri): Usiamo i valori vecchi.
  • Tempo (Oggi): Calcoliamo i nuovi valori basandoci su quelli di ieri.

Si parte assegnando a tutti lo stesso valore iniziale. Si ripete il calcolo tante volte finché i valori smettono di cambiare. Questo stato finale si chiama Stato Stazionario ().

In forma matriciale si scrive:

(Il vettore dei rank di oggi è uguale alla Matrice moltiplicata per il vettore dei rank di ieri).

Esempio Pratico

Immaginiamo un piccolo web con sole 4 pagine.

  • 1 → linka solo a 2.
  • 2 → linka a 1 e 3.
  • 3 → linka solo a 4.
  • 4 → linka a 1 e 2.

Costruiamo la matrice dove le colonne () sono le pagine di partenza e le righe () le pagine di arrivo.

Come leggere la matrice (Esempi):

  • Colonna 1 (Pagina 1): Ha un solo link in uscita verso la 2. Quindi metto 1 nella riga 2. Le altre celle sono 0.
  • Colonna 2 (Pagina 2): Ha due link in uscita (verso 1 e 3). Quindi divide il suo voto: 1/2 alla riga 1 e 1/2 alla riga 3.

Applicando la formula, l’importanza della pagina 1 al tempo è: