如何使用google analytics来跟踪搜索引擎蜘蛛的爬行日志

之前我在看搜索引擎蜘蛛爬行记录时只能通过系统的日志来分析。对于系统日志的来说是不够直观,而且不便于对是时间段等来进行分析。而且一般的流量统计是不能统计到搜索引擎的爬虫记录。周未在家上网时,看到一篇介绍关于使用google analytics来追踪爬虫记录的方法,于是用tsov.net的站点来尝试了二三天后发现不错。这里把这篇介结利用google analytics追踪搜索引擎蜘蛛的爬行日志的方法收藏先。

这个方法是两位法国google analytics的爱好者写的一段代码,可以让我们轻松利用google analytics追踪搜索引擎spider的抓取信息。要做到这个功能需要做以下步骤:
第一步,添加一个新的profile配置文件,这个profile文件必须是设置为新的domain域名。

第二步下载analytics文件夹上传到网站根目录,里面包含了analytics 、config和patterns三个文件。需要做的是修改config文件。
1、添加第一步中增加的新的profile id 号(非网站原始proflie id)

2、增加你的域名信息
添加你域名的哈希(hash)值信息,为域名cookie里面的_utma cookie内容字段的第一段id。(利用firebug cookie读出)

里面的”109917574”’就是需要增加的id.

3、让网站每个页面都包含analytics文件的代码,可以在网站页面的公共调用部分(如footer header) 加入以下代码:

<?php include_once( “analytics/analytics.php”) ?>

以上步骤完成后,等待两小时后 在google analytics后台便可以看到来自搜索引擎爬虫的爬行信息。

4、在内容(content)报告, 按来源选择可以很清晰的看到来自各爬虫的爬行信息。

使用方法转载自:http://www.robinli007.com/

相关日志

发表于:2011-03-21 13:07:25 at 13:07 分类:代码 1条评论 Tags:, , , ,

一条评论»

  1. wenjian说道:

    学习一下!

发表评论

(必填)

(必填)您的电子邮箱不会被公开。

*

正在加载信息...

Archives