近一段时间,发现百度收录我的网站的几个的几个问题,在这里提出,与大家商榷,本人对百度引擎研究得不深,说得可能有所偏颇,说得不对的地方,还请大家多多包涵:
一、百度在非周三、四就就放出网站页面
这应该不是什么问题!
例如, 我周日在网站上发表的10篇文章, 周一百度几乎照单全收, 且放出来了。 我一直密切关注百度收录网站的情况, 一直以来, 都是在周三或周四凌晨一、二点左右就放出页面来, 一次更新往往较多, 最多时有一百多个页面。 非周三周四就放出页面的情况, 以前曾出现过一次, 以后就很久没有出现过。
为什么会出现这样的情况呢?我想可能与网站在百度的权重有关。
网站一直坚持原创文章, 就是转载的作品, 也精心地修改了下, 标题重拟, 尽量做到内容与原文相同的地方在三分之二以下。 今天查看我网站主标题, 前天百度排位在98, 今天提高到了第10, 网站的权重越高, 百度收录越快。
还有就是这一段时间以来, 网站勤于更新, 只要在家, 都会写写日记与文章发上去, 网站更新得快, 百度的蜘蛛就来得勤, 这也是网站权重提高的很重要的原因。
二、伪原创文章比原创文章收录更好
这是我感觉到纳闷的事, 我网站最近半个多月以来上传的好几篇原创文章和日记, 都是完全自己写的, 上传也有半个月多月, 最少的也有一周了, 而百度搜索中就是查询不到。 如《国庆黄金周期间在站长网发表的文章》、《我坚信,所有的站长都是纯朴的》、《面对情欲女作家香娜,大家都有问题吗? 》、《湖南一旅游公司的网站安全问题 》、《不要把时间浪费在无谓的工作上》、《流量, 我要真实有效的》等这些文章。 而前天传上去的几篇伪原创的东西, 百度昨天就几乎全部收录了, 如《快乐大本营:社交网络与休闲游戏相结合的交友平台》、《飞信:让你免费发送短信》、《4399:属于中小学与白领的小游戏》、《17173:中国游戏玩家的第一选择》等。
这不得不使人对百度引擎对原创的识别产生怀疑。
三、百度对于热门的关键词好象有嗜好
排除百度对于原创内容的识别有问题之外, 好象百度对于一些热门的关键词情有独钟似的。 大家都知道, 热门的关键词, 网上的信息也多, 百度也不缺乏这方面的资源。 好象是一些娱乐方面的内容, 正如百度公司的主管人员介绍, 这方面在百度的覆盖率几乎达到了百分之百。 但就是这些内容, 我上传的伪原创内容几乎百度都收录, 好象我在网站上传的有关明星写真之类的, 百度已经很多了, 但百度还是很喜欢, 几乎都收录了。 还有就是在百度最热门的一些关键词, 我上边列出的有关快乐大本营、飞信、4399、17173等都是百度排行榜中搜索前50之内的关键词, 百度一天之内就收录了, 而我的原创文章, 却是迟迟不见收录。
四、百度对于没内链或内链少的文章表现得毫无办法
这是搜索引擎的通病, 但是对于百度尤其突出。
我的网站是一个博客, 首页除了最新的10篇文章之外, 文章的内链只有评论的只有10条。 我往往一次更新10篇以上的文章, 百度对于最新的10篇文章很快就收录, 放出来了, 而对于在内页首页又没有链接的文章, 迟迟没有收录, 而这些文章有很多是原创的, 但它却表现得毫无办法.
我对比了一下谷歌和雅虎的搜索, 也有类似的情况, 但那两个引擎只是收录的时间稍慢一点, 总有办法把它找出来, 而百度在这方面的表现却是差强人意, 或许这也是人们一直对于百度搜索引擎有质疑的其中一个方面。
……