Come impedire ai crawler web di accedere a determinati file e cartelle del vostro sito.

lo_sapevate_che Volete sapere come fare per impedire ai crawler di Google, ma anche altri motori di ricerca, di accedere a determinati file, cartelle e pagine web? L’appuntamento settimanale di Google Webmaster “Lo sapevate che..”, spiega proprio come poterlo fare.

Cosi come descritto sul forum, per inibire l’accesso a determinate pagine presenti nel vostro sito, è necessario creare un file robot.txt dove inserire i percorsi di tutti i file e cartelle da limitare.

In genere pagine contenenti informazioni riservate, o credenziali di accesso, non debbono essere indicizzate da Google, quindi dovremo dire al crawler di saltare l’indicizzazione. Per creare un file robot.txt possiamo usare un semplice editor di testo, e una volta inseriti i percorsi, questo file dovrà essere caricato nella cartella principale del nostro sito.

robot_txt

Per semplificare la creazione del file robot.txt, negli Strumenti per webmaster di Google, sezione Configurazione sito/ Accesso crawler, troverete un tool che permette di generare e analizzare il file robot per il tuo sito web, indicando azione, directory e User-agent da limitare.

Al termine sarà possibile generare il file robot.txt contenente le impostazioni, e le cartelle de non indicizzare.

Il prossimo appuntamento di Lo sapevate che…, sarà molto interessante, perché conterrà informazioni su come trasferire un sito web. (via)

Cookie	Durata	Descrizione
pardot	past	The pardot cookie is set while the visitor is logged in as a Pardot user. The cookie indicates an active session and is not used for tracking.
_ga	2 years	The _ga cookie, installed by Google Analytics, calculates visitor, session and campaign data and also keeps track of site usage for the site's analytics report. The cookie stores information anonymously and assigns a randomly generated number to recognize unique visitors.
_gat_gtag_UA_3912188_4	1 minute	Set by Google to distinguish users.
_ga_KQD5B6NWML	2 years	This cookie is installed by Google Analytics.
_gid	1 day	Installed by Google Analytics, _gid cookie stores information on how visitors use a website, while also creating an analytics report of the website's performance. Some of the data that are collected include the number of visitors, their source, and the pages they visit anonymously.

Cookie	Durata	Descrizione
country	1 month	No description available.
loggedIn	1 month	No description available.
myapp_session	12 hours	No description
nette-browser	session	No description available.
preferredLanguage	1 month	No description available.
wpcom_highlander_3pc_check	session	No description

Come impedire ai crawler web di accedere a determinati file e cartelle del vostro sito.

Correlati

RispondiAnnulla risposta