Problemi di scansione sui siti eCommerce
by 15 Giugno 2016 11:016
Ultimo aggiornamento 2 Gennaio 2018
Come individuare facilmente e risolvere i problemi di scansione nei siti e-commerce, come in tutti i siti web strutturati ad albero che ospitano grandi moli di contenuti.
Lo spunto per il sito web di oggi arriva da una consulenza SEO che ho erogato la scorsa settimana per un grosso sito e-commerce nel settore sportivo. Nello specifico, Google aveva indicizzato centinaia di migliaia di pagine a fronte di un sito web con “solo” migliaia di prodotti.
Robots.txt
Il responsabile tecnico del progetto ha trattato il caso spostando il sito web su HTTPS bloccando contestualmente i percorsi che generavano loop di scansione infiniti, per lo più legati ai contenuti come le user e checkout pages, le search pages e le cartelle tecniche. Una buona compilazione del file Robots.txt può fare tantissimo in questi casi, ma questa volta il sito web non si riprendeva, il traffico organico era poco nonostante l’azienda fosse affermata e il sito web molto buono. Sì, è una di quelle storie da amaro Montenegro.
Analisi della scansione
Il primo campanello d’allarme è scattato nel rendermi conto che Google generava una cache per le pagine di categoria sia richiamandole con https che senza, mentre per molte schede prodotto, spesso la cache esisteva solo richiamando gli URL con https, altrimenti (solo con www.) Google riportava un codice 404. Tutte le pagine in cache sono comunque con HTTPS.
Questa cosa dipende dal fatto che Google cerca di risparmiare risorse di scansione in presenza di siti web enormi o con seri problemi di scansione. Se ad esempio richiami la Google cache della pagina Facebook di Fanpage(5 milioni di fan) con HTTPS esce, senza no. Il sito web che ho esaminato non aveva le dimensioni di Facebook, ma presentava 4.000 errori di scansione su 14.000 pagine indicizzate, con una struttura di link interni pesante e poco verticalizzata sugli obiettivi. Di conseguenza la frequenza di riassorbimento era alta (cache in uno o due giorni) sui contenuti superficiali come le categorie e molto bassa (cache in due mesi) sulle schede prodotto, da cui l’intera visibilità organica del sito web risultava compromessa.
Problemi di rendering
Per rendere più problematico il tutto, richiamando una qualunque scheda prodotto del sito web con lo strumento RECUPERA E VISUALIZZA della Search Console, ci si accorge che Google renderizza il menu principale in versione desktop come se fosse in versione mobile, in pratica nascondendo tutte le voci del menu, cosa non da poco, considerando che Google vede tutto, ma da più peso a quello che in pagina si vede.
I link interni e i codici 404
I problemi più grossi del sito web che ho esaminato sono legati a link verso prodotti e archivi che restituisconocodici 404, raggiungibili troppo spesso da un modulo nel sidebar. Allo stesso tempo tutte le schede prodotto presentano sempre nel sidebar link a tutte le categorie. È una pratica secondo me rischiosa in molti casi, perché può appesantire veramente tanto la scansione e non è un caso che nelle ultime release dei principali CMS per e-commerce, le schede prodotto siano state ripulite da questi sidebar enormi, che invece restano presenti solo nelle categorie.
Cose che mancano
Molti e-commerce presentano nelle schede prodotto, link agli archivi per marchio. Secondo me se il marchio in questione produce tanti articoli diversi per tipologia, gli archivi generici per marchio sono inutili e fuorvianti. Sarebbe molto meglio avere archivi per tipologia di prodotto di un marchio, così come è sempre meglio creare articoli correlati in pagina molto vicini per tipo a quello che sto vedendo.
Conclusioni
Ogni consulenza è un momento di crescita anche per me, perché ogni caso è diverso dall’altro. Se anche il tuo e-commerce si trova ad avere problemi simili, fammi sapere come li stai trattando, oppure contattami per discuterne insieme.