在做搜索引擎优化中分析搜蜘蛛爬虫日志是非常重要的一步,大部分网站采取服务器日志数据,一般认为采用类似googleanalytics的页面标记法是无法捕捉搜索引擎爬虫的信息,然而两位法国googleanalytics的爱好者的一段代码却可以让我们轻松利用googleanalytics追踪搜索引擎spider的抓取信息。 要做到这个功能需要做以下步骤 第一步,添加一个新的profile配置文件,这个profile文件必须是设置为新的domain域名。 第二步下载analytics文件夹解压后上传到网站根目录,里面包含了analytics、config和patterns三个文件。 需要做的是修改config文件, 添加第一步中增加的新的profileid号(非网站的始proflieid) 增加你的域名信息(如) 添加你域名的哈希(hash)值信息,为域名cookie里面的_utmacookie内容字段的第一段id. 第三步让网站每个页面都包含analytics文件的代码,可以在网站页面的公共调用部分(如footerheader)加入以下代码: <?phpinclude_once(“analytics/analytics.php”)?> 以上步骤完成等待两小时后在googleanalytics后台便可以看到来自搜索引擎爬虫的爬行信息” 在内容(content)报告,按来源选择可以很清晰的看到来自各爬虫的爬行信息