6种情况导致网站难以被搜索引擎收录

[摘要]中国IDC圈2月18日报道：对于每一个站长而言，最关键的某过于搜索引擎能够正常收录，一旦网站不能正常收录一切都是痴心妄想。为什么会出现收录困难？这是因为搜索引擎机器人是一个很简单的软件程序，...

中国IDC圈2月18日报道：对于每一个站长而言，最关键的某过于搜索引擎能够正常收录，一旦网站不能正常收录一切都是痴心妄想。为什么会出现收录困难？这是因为搜索引擎机器人是一个很简单的软件程序，它本身对站点并没有任何的理解能力，只是通过一些固有的标准来评判站点的好坏，一旦站点在写法上出现了错误，搜索引擎将无法对站点进行采集。

　　原因一：网站在没有建设好的情况下就上线了（如死链很多）

　　这个很容易被忽视的，在您的网站上线之前，哪怕去掉那些没用的死链，也不能因为“好看”而保留着。

　　原因二：站点的robots.txt文件已损坏或者在书写的时候出现错误（例如出现错别字）

　　如果搜索引擎机器人错误的理解了您的robots.txt文件，它们可能会完全无视你的网页。对于这个问题，解决的办法是仔细检查您的robots.txt文件，并确保您网页上的的参数是正确的。

　　原因三：网址中包含太多的变数网址

　　中包含太多的变数可能会造成搜索引擎机器人搜索困难。如果您的URL 包含变数太多，搜索引擎漫游器可能会忽视您的网页。对于这个问题一些比较熟悉网站建设的人可能会想到动态网页，的确就是这个问题，动态生成的网页（括ASP、PHP）可能导致抓取工具无法收录，解决办法，使用静态页面。

　　原因四：在您的网址中使用了会话ID

　　许多搜索引擎不去收录那些包含会话ID的网页，因为它们可导致内容的重复。如果可能的话，避免会话ID出现在您的网址，而使用Session存储会话ID.

　　原因五：您的网页中包含太多的代码

　　网页中包含了Java代码、CSS的代码以及其他脚本代码。这些代码与内容没有直接的联系，访问您网页并选择“查看源文件”或“查看HTML 源”，如果您很难对网站上的实际内容进行更改，那么通常情况下搜索引擎收录起来也很困难。

　　原因六：网站导航

　　大多数搜索引擎的机器人不能解析Java 或DHTML 菜单，当然Flash以及Ajax 菜单效果更差。

　　如上文所述，搜索引擎机器人是很简单的程序，它们遵循的HTML链接，一旦链接出现错误对收录也会带来困难。

网站建设是一个广义的术语，涵盖了许多不同的技能和学科中所使用的生产和维护的网站。

……

标签:6种情况导致网站难以被搜索引擎收录