Caching dei contenuti: presto e bene
by 3 Settembre 2011 15:130
Ultimo aggiornamento 5 Dicembre 2018
“Presto e bene” è l’antico motto delle prostitute parigine. Professioniste attente ad ottenere il risultato migliore nel minor tempo possibile, ottimizzando i tempi di lavoro e massimizzando di conseguenza il profitto. Vediamo insieme il motivo per cui sul web si cerca di fare altrettanto…
Come sai, l’indicizzazione del contenuto avviene quando un bot scansiona la pagina web e la inserisce negli indici del motore di ricerca. Facendo questo, viene appunto generata una copia cache del contenuto.
Per vederla, basta scrivere su Google:“cache:www.paginaweb.estensione”.
A patto che la pagina sia indicizzata, il comando “cache:” restituisce un’istantanea della pagina, così come visualizzata dal bot (o spider o crawler) nel momento in cui il contenuto è stato assorbito negli indici. Insomma, è come una fotografia della pagina web scattata in quel momento preciso, a quell’ora.
Essendo verosimile che i contenuti dei siti vengano aggiornati, i motori di ricerca, allo scopo di offrire il servizio migliore possibile agli utenti, sono programmati in modo da riassorbire periodicamente le pagine indicizzate.
I database si aggiornano ed incidentalmente le serp cambiano.
Quando parliamo del caching dei contenuti quindi, ci riferiamo alla prima indicizzazione certamente, ma soprattutto alla frequenzacon cui i bot assorbono i contenuti nuovi e ri-assorbono quelli già presenti negli indici.
Diamo due orientamenti tendenziali (che quindi non rappresentano un dogma) sulla frequenza di caching:
1) È più frequente per i siti web aggiornati spesso, solitamenteparticepati (siti di informazione, forum, social network)
2) È più frequente per i siti web popolari (per page rank, trust rank)
Rispetto a questo secondo punto, guarda ad esempio con quanta frequenza viene riassorbita la homepage del sito Apple.com, che pur essendo privo di caratteristiche partecipative/orizzontali, ha un re-cache ogni 2 ore circa (sul sito Repubblica.it è meno frequente).
Più o meno un anno fa, nell’estate 2010 veniva lanciato in ItaliaGoogle Caffeine, un aggiornamento algoritmico che riguardava proprio il caching dei contenuti, nel quale veniva stabilito una volta per tutte che il motore di ricerca avrebbe “preferito” le pagine partecipate, garantendone un caching più frequente e (mediamente) posizioni migliori nelle serp.
Da quel momento (già succedeva in realtà) abbiamo visto sempre meno risultati di siti come “tutto gratis” e più “Yahoo answers”.
Il mio suggerimento quindi è quello di monitorare il caching e cercare sempre di tenerne alta la frequenza, sia per i contenuti nuovi che per il riassorbimento di quelli già esistenti.
A tale scopo ovviamente, oltre ad aggiornare spesso i contenuti, si potranno utilizzare le piattaforme di social bookmarking, sulle quali scriverò in un prossimo post, ed anche il sistema di segnalazione tramite feed rss (feedburner soprattutto), che in alcuni casi consente di far indicizzare il contenuto nuovo in 20 secondi!
Per questi sistemi segnalerò i modi e i tempi di procedura, sulla base degli esperimenti svolti.
Resta collegato!