对于那些动态生成网页,我们这些实际的访问者可以通过肉眼看到。但对于大多数搜索引擎的蜘蛛程序却往往是不可见的,这也就是动态网页很难被搜索引擎的SPIDER检索的原因。因而,要想让你的动态网页能够出现在搜索引擎的搜索结果中,只要保证你的网站内容对搜索引擎是可见的,即搜索引擎的Spider程序能够看到你网站的内容就可以了
所谓动态网页一般指的是采用ASP,PHP,Cold Fusion,CGI等程序动态生成的页面,该网页中的大部分内容来自与网站相连的数据库。在网络空间中并不存在这个页面,只有接到用户的访问要求后才生成并传输到用户的浏览器中。而且由于访问者能够实时得到他们想要的数据,动态网页往往容易给人留下深刻的印象。此外,动态网页还具有容易维护和更新的优点。例如,对于一个新产品或价格的调整。网站管理员只要对数据库做一下简单的改动就可以了,根本不需要去修改每个单独的静态页面。
我们可以看出,从用户角度来考虑,动态网页确实非常棒。但如果在搜索引擎的角度来看,结论却不同了。优化动态网站,动态网站的常用优化方式
动态网页的问题所在:
问题就出在这些动态网页在网络空间中并不是实际存在的,只有当用户在变量区中输入一个值以后它们才会生成。而我们大家也都知道,搜索引擎的Spider再聪明,它也只是一个搜索程序,它们无法象真正的人那样选择变量并输入数值。
亦可将查询编入主页上的一个链接中,使得该链接成为一个预先定义的网站目录的查询。用户可在一个搜索表格中键入查询条件来查询,通常动态脚本需要某些信息来返回页面内容,最常见的如Cookie数据,Session ID或一个环境变量。但对搜索引擎的Spider程序来说,它们压根不可能知道去使用你的搜索功能,或者该问什么问题。就是因为如此,Spider对网站的检索往往会在一个动态站点前不得不止步。
此外,在动态页的URL中包含了问号(?)和百分号(%)。还有一些符号诸如&,%,+和$等在一个动态页的URL中也经常能看到。这样的URL被称作“环境变量”(query string)。不过大多数SPIDER都无法解读符号“?”后的字符。例如,对于这样一个URL:, .stm, .asp, .phtml, .cfm, .php3, .php, .jsp, .jhtml, .asc, .text和.txt为扩展名的文件。不过它对后缀是.cgi的文件仍然不提供支持。如果你的网站上存在它不支持的扩展名文件,它会在网站提交的过程中通知你。
结束语:
问问你自己,是不是确实需要使用动态网页?数据库通常用作页面生成工具,你可以用它创建静态页面,尤其对于网站上不常更动的那些区域,可以考虑使用数据库来生成静态的页面内容。为了保证搜索引擎的索引,你也可以考虑为你的动态内容创建镜象静态的网页。
大多数的搜索引擎还是不习惯对动态网页的索引,到现在也如此。这是由于对一个动态生成网页的检索可能会导致搜索引擎的Spider掉进死循环的“陷阱”中而无法脱身。不过现在情况正在逐渐得到改善。 最先支持动态网页的搜索引擎是Google,在两千年底它已经能够索引动态页面(包括URL中的“?”)。此外,HotBot及其它一些搜索引擎也开始支持动态页面。
虽然这些搜索引擎能够支持动态网页,但为了确保其Spider程序免遭死循环之灾,搜索引擎将不会对来自动态生成页面中的链接进行深入访问。所以我建议大家要稍微多花点时间在你的动态生成网页上,并确保它们中的每一个都能够被搜索引擎索引到。事实上,你会发现,你所花费的这些时间绝对是一个非常棒的投资-同时它还能够为你的网站来更多的访问量。