不管开发 Web 站点所用的是何种内容管理系统或 Web 应用程序框架,都应该涵盖一些基本要素。能提供精致的用户界面和丰富的内容固然很棒,但在那之前,首选应该提供用户能查找到并能明了地表达该站点用途 的基本文件。
引言
有几个标准的文件是每个 Web 站点都必需的,但在很多时候它们却会被站点忽略。大多数这种文件都与约定有关,而非技术上的要求,但如果不能提供这些文件,就会使站点创建误入歧途。除了 URL 可以通过猜想尝试得到,通常用户很难通过猜想找到其他想要的东西。本文将对这些标准文件逐一简述。
给定的资源究竟如何提供决定于所使用的 Web 服务器层和 Web 应用程序层。在诸如 Apache 这类 “传统” 的、接近静态的服务器内,这些资源很可能就是服务器上的文字文件。但在不同的配置中,它们也有可能是数据库中的某些条目、配置文件中的某些行、服务器进程中的某些类等。本文重点放在用户最终所见之上,而非该如何让其发生。
一旦想要收集用户信息(即使只有用户名或流量日志),就要告知用户您打算如何处理这些信息。围绕 Web 站点创建者和/或用户的权力和责任的法律问题十分复杂 — 我不是一名律师,更无法解决您 法律方面的问题。不过,若能考虑到用户的个人私隐,用户还是会感觉到的。而且也许您就 应该在此时与律师 商谈一下该如何处理用户的数据。
robots.txt
如果不想让 Web 站点上的所有资源都能被自动工具编入索引,就请在 robots.txt 文件内加以说明。但如果确实 想让内容都编入索引,也请如实说明。Robots Exclusion Standard 指令并不强制用户:如果的确 不想让某些东西可见,就请不要将其放到站点,或者要确保其后有足够的许可保护。不过,所有主要的合法 Web 爬虫引擎都会遵从 robots.txt 内的要求。因此请尽量明确地说明您的意图。
如何显示整个 Web 站点的地图还未完全标准化。为制作站点地图而提供的某些东西 总是很有用的,但这些东西究竟详细到何种程度取决于站点的动态程度(或动态的方式)。而且,想要为用户显示的内容也依赖于站点的意图。比如,如果用户没有对资源 X 的使用权限,那么让用户知道资源 X 的存在可能根本就不合适。请根据自己的判断和具体情况,设法提供一些东西。