众所周知,采集来的内容搜索引擎不太喜欢,因此不会给予理想的权重甚至都不会收录。但是采集也并非一无是处,巧用采集也可能给网站带来意想不到的收益。
下面就以我自己的亲身经历来谈谈我对采集的一些看法和感受。
2011年11月我来到一家小型网站公司实习,他们做的是地方类门户网站,11年3月才上线的。虽然过了沙盒期,也不能算新站了,但是对于门户网站来说,这个网站的最大问题就是有足够多的分类:新闻、娱乐、电影、音乐、财经、家庭、装修、招聘等等,但是却没有足够的内容。公司不大人员不多,每个人都得当编辑,即使这样仍忙不过来。原创几乎不可能,我们也没有内容提供商,所以采集就成了无奈的选择。
当时我的采集量是一天3000到4000的文章,坚持一段时间后我觉得内容量差不多了,像是女性、母婴、婆媳、风水这种分类的文章基本上互联网上有的都采集光了。但是我回头看看这段时间的成果,也并非像我开始想的那样是纯粹的无用功。
首先在网站流量上有所增加,虽然PV不高,但是IP涨了不少。追踪一下IP来源发现很多都是我采集的文章的入口,很多我从其他门户采集的文章甚至关键词都排在了百度第一位,还有的紧随其后,也有大部分排进了第一页。
分析一下我认为是原网站的这些内容,由于改版,板块合并,网站被人投放病毒或垃圾信息或是更换服务器等等一些原因,造成了文章不被收录或是已被收录的文章被K掉,这样你采集来的文章相当于是原创了,因为百度首先看到的是你的文章就会认为你是原创。
其次采集来了大量的内容对于有的板块来说,相当于是完成了一个众包系统。像是母婴这个板块,有了足够的内容等于是做了一个母婴百科,你在文章搜索里搜索相关字眼只要是互联网上有的基本在我们这个板块都能搜索到,因为我已经把网络上的母婴文章差不多采集全了……
再有就是把基础信息做全,会给客户感觉网站内容很充实,今后每个板块每天只需发少量的文章保持更新状态,也给编辑们省了很多工作。
但在之后的工作中,原创仍然是个问题,除了心情状态还真没有能原创的文章。这时我开始教同事们进行伪原创。
所谓伪原创就是在文章原基础上进行改动:改改标题,内容上稍加修改再进行一些SEO操作,这篇文章对于搜索引擎来说就是不错的原创文章了。
然后当时由于又上了一个论坛,上了一个旅游网站,大家都忙不过来了,没时间去网上找文章进行伪原创了,所以我又想到了采集。
我把一个版块的文章比如购车心得,采集100篇,然后发到网站后台,这样编辑只需每天直接到后台伪原创3篇一发布就行了,方便省力。
谈一下我对采集的总体感受:都说网络文章一大抄,看你会抄不会抄。其实虽说网络资源无限,但是细化分类的话,每一类的资源其实就那么多,大家都在转载和伪原创,真正原创的不多。采集只是过程和手段,不是目的,你欺骗不了搜索引擎,更不能欺骗自己和客户,真正做好产品,发高质量的原创文章才是王道。巧妙合理利用采集可以获得额外收益,过分依赖采集只会徒劳无功。
最后说一下采集的相关问题,我用的采集工具是火车头采集软件。官方收费版的功能更强大,并且他们会给你定制采集模块和发布模块,像是58同城的信息,都可以采集来用,一般的文章类采集用免费版的就可以。这款软件功能十分强大,不仅仅限于采集文章,我研究了一段时间也只是感觉接触了冰山一角,喜欢钻研的朋友可以试一下。这款软件的好处就在于采集完可以直接发布,其他的软件一般采集完了不能发布,还要上传到服务器什么的很麻烦,这款软件设置好了采集加发布一键搞定,然后就可以去网站后台待审核文章去发布了。还有 就是可以制作发布模块,在Discuz,PHPwind以及其他开源程序甚至是自己开发的程序上都能用。缺点就是比较专业吧,要求对代码有一定的认识和了解,并且这款软件不是很容易上手,看过教程恐怕才会用。中途我搜索过其他的采集软件,有一款叫熊猫采集的,完全脱离代码,可视化操作,只是当时的版本还没有发布,只能采集,现在的版本中应该已经有这个功能了,感兴趣的朋友可以研究一下
发布时间:2018-11-01
推荐阅读:
夫唯学院成立于2007年,11年来与数万学员共成长。创始人夫唯先生总结的四处一词、站内站、定向锚文本、聚合等多种核心优化策略,并在众多学员网站上得到验证。夫唯先生推崇“循序渐进,基业长青”的SEO运维思想,以SEOWHY为现实实战案例,历经5年零起步创造了网站品牌。
SEO培训报名联系方式:客服QQ86594013 客服微信:seowhy2021