个人站长网站采集经验总结

2009-08-18 16:13:53   来源:OKXUN.com

关于网站内容采集,大部分站长都了解!因为它确实可以帮助我们节约N多的时间和精力,让我们有更多的时间去推广网站;但因为搜索引擎不喜欢采集的数据和网站,有些站长一提到采集就不住摇头。那么,究竟如何使用好采集,让它即帮我们节约时间,又能给搜索引擎一种耳目一新的感觉呢?下面,根据本人经验和总结,给大家分享一下。

  一、采集器的选择

  目前大多数的CMS(PHPcms、帝国、织梦、新云等)都带有采集功能,如果用好它们,也是一个不错的省钱方法;但这些自带的采集功能,个人感觉都是鸡肋,虽然能用,但不强大。如果资金允许,建议去购买专业的采集器。

  二、摸透采集器的功能

  老话,磨刀不误砍柴工,只有把采集器的所有功能都摸透,而且能熟练运用,那么才能谈得上采集。

  三、来源网站的选择

  这个没什么说的,如果你想吊死在一颗树上,就随便。。。最好是选择多个网站,而且每个网站的内容都是原创的,切记,不要将每个网站的内容都采集过来,最好是各采集一部分数据。

  四、数据采集

  (1)、采集规则编写

  根据事先搜集的采集对象,对每个网站分别编写采集规则,切记,采集数据应包含这几项:标题、来源、作者、内容,其它的比如关键字、摘要、时间之类的就不要采了。

  (2)、弄清采集的原理和过程

  所有采集器基本上都是按以下步骤进行工作的:

  a、根据采集规则采集数据,并将数据保存在临时数据库中,功能较强大的采集器会把相应的附件(如图片、文件、软件等)也会保存在事先指定的文件中,这些数据和文件的保存有些是保存在本地计算机中,有些是保存在服务器中;

  b、根据指定的接口发布已经采集的数据,就是说把临时数据库中的数据,发布到网站的数据库中去;

  (3)、编辑数据

  当数据采集到临时数据库后,很多人因为嫌麻烦,就直接入库发布数据,就种做法就相当于复制粘贴,没什么意义,如果这样做,搜索引擎不惩罚你的可能性很小。所以,当数据采集到临时数据库中后,不管再麻烦,都要对数据进行编辑,具体要做以下几个方面:

  a、修改标题(必做)

  b、添加关键词(可手动,但有些采集器可以自动获取)

  c、写描述或摘要,最好是手动

  d、适当修改文章头部和底部的信息

  五、发布数据

  这步没什么说的,就是把已经编辑好的数据发布到网站中。

  最后,可能有些朋友会问,哪些采集器才适合,因为时间关系,也因为不想被人误认为我是马甲,在此这就不说了,如果你采集过的,你心目中应该有一款中意的。过些时候,我会给大家列一个分析表出来,将目前主流的采集器进行一个全面的比较,让大家容易区分和选择。