打印本文 关闭窗口 | |||||||
三种过滤技术将垃圾邮件拒之门外 | |||||||
作者:陈鹏 文章来源:eNet 点击数 更新时间:2009/9/11 23:13:55 文章录入:陈鹏 责任编辑:陈鹏 | |||||||
|
|||||||
一般说来,垃圾邮件是未经请求而发来的电子邮件,通常包含一些商业广告。除了令人生厌以外,垃圾邮件还把广告成本转嫁给ISP和消费者。当然,那些报复心理严重的网络用户发送的“邮件炸弹”也可以视作“垃圾邮件”。垃圾邮件问题已经极大地消耗了网络资源,并给人们带来了极大的不便。中国互联网协会公布的2004年中国垃圾邮件状况调查报告显示,中国当年处理垃圾邮件浪费的GDP高达48亿元人民币,中国邮件用户现在平均每人每天收到邮件7.05封,其中有1.85封为垃圾邮件,占26.2%。 每个上网的用户都会不可避免地受到垃圾邮件的骚扰和影响,平均每天需要花费5-10分钟来对个人邮箱中的垃圾邮件来进行处理。更为严重的是,由于垃圾邮件占据了邮箱空间,经常会导致正常的邮件无发投递到邮箱。有鉴于此,本文将详细介绍个人用户防范垃圾邮件的重要方法。 以下是一些个人用户防范垃圾邮件的方法,实践证明,它们非常有效,需要用户综合加以使用: ● 尽量避免在新闻组、聊天室、网站、论坛等公共场所公开自己的电子邮件地址。许多垃圾邮件发送者都是通过程序自动在Internet上进行邮箱地址采集的,一旦成为这些垃圾邮件清单中的一员,将可能源源不断地被这些垃圾邮件所追随。所以,用户在进行论坛注册、发表贴子的过程中,一定注意使自己的邮箱地址公开的程度最小化,切实保证自己不受垃圾邮件骚扰。尤为重要的是,很多交友网站、外国的色情网站等等用户一定不要注册,否则不但会受到垃圾邮件影响,而且可能造成个人信息泄漏等众多方面的损失。 ● 在个人主页等需要公开邮箱地址的地方,可以采取对邮件地址进行替换的方法,这种方法可以让自动采集邮箱地址的程序失效。比如:对于邮箱地址test@sohu.com,我们可以将其替换为:test at sohu dot com,该方法目前在国外的个人主页上使用非常广泛,也是一个不错的选择。 ● 邮箱地址命名的技巧。上面提过,目前的垃圾邮件发送者是通过程序自动搜集用户的邮箱地址然后发送垃圾邮件,而他们采取的重要手段之一是根据字典枚举来对个人用户的邮箱地址进行试探。举个例子,张君的邮箱地址为:zhangjun@sina.com,这就很容易被垃圾邮件发送者猜测到,并且与此相关的zhangjunbao@sina.com,zhangjunli@sina.com都可能通过字典一一列举出来。所以用户在申请邮箱地址的时候,需要综合使用字符、数字,这样就增大了自己的地址被猜中的难度,例如zhang_jun_mailadd2005@sina.com就比较难以猜测。其实,这个与密码的设定原则是类似的。 ● 不要回复垃圾邮件。很多的垃圾邮件发送者为了验证邮件地址是否有效,往往以一种非常抱歉的语气说,如果您不需要我们的邮件,请向某地址写信,我们将立刻停止向您发送邮件。这时,最好的方法是不理不问,直接将发送人地址加人拒收邮件清单。 ● 使用免费邮箱提供的垃圾邮件过滤功能。目前,80%以上的邮件用户使用的都是诸如新浪、雅虎、搜狐、163等提供的免费邮箱功能。而这些门户网站为了赢得用户,竞相推出了自己的反垃圾邮件系统,其中尤以雅虎和163最为理想和实用。用户可以在Web页面上,通过提供关键字、黑名单、白名单、标记垃圾邮件的方法使用这些网站的反垃圾邮件功能为自己的个人邮箱“保驾护航”,免收垃圾邮件骚扰之苦。 ● 将发送比较频繁的垃圾电子邮件转发至政府或行业管理部门,予以举报(中国反垃圾邮件联盟的网址为http://anti-spam.org.cn)。 ● 充分地利用垃圾邮件客户端的过滤功能。当你拥有2个以上的邮箱,邮件客户端软件就是同时管理这些邮箱的最佳手段。对于一般用户来说,借助必要的工具进行垃圾邮件过滤是非常重要的。而常用的邮件客户端软件几乎都加入了反垃圾邮件功能,如Outlook Express 6、Foxmail 5.0等。此外,还可以使用第三方垃圾邮件防范工具,如Norton AntiSpam、EQ Manager等。 在上面所列的几点方法当中,邮件客户端的过滤功能是最实用的,下面就以Foxmail 5.0为例详细介绍一下使用客户端过滤垃圾邮件的具体方法。Outlook Express 6的使用方法与其类似。 在Foxmail 5.0主窗口中,点击“工具→反垃圾邮件设置”即可启动反垃圾邮件设置对话框(如图1所示)。该客户端提供了黑名单过滤、白名单过滤以及具有机器学习智能的基于内容的贝叶斯过滤方法,功能强大,使用方便。 图1 启动反垃圾邮件设置对话框 下面详细介绍使用Foxmail 5.0过滤垃圾邮件的方法: 黑名单过滤 黑名单过滤技术最初是使用于服务器端的,它是基于用户投诉和采样积累而建立的、由域名或IP组成的数据库,最著名的是RBL、DCC和Razor等。这些数据库保存了频繁发送垃圾邮件的主机名或IP地址,供MTA进行实时查询以决定是否拒收相应的邮件。简单地说,即数据库中保存的IP地址或者域名都应该是非法的,都应该被阻断。该技术应用于客户端时,就是保存一个不为本地邮件用户欢迎的邮箱地址列表。图2给出了使用黑名单过滤的图示,这里主要是通过设置用户已经确定了的不受欢迎的邮箱地址的方法来阻断这些邮件,这种方法比较直观,阻断效率也很高。 图2 黑名单过滤 白名单过滤 白名单过滤是相对于上述的黑名单过滤来说的。它建立的数据库的内容和黑名单的一样,但是其性质是:库中存在的都是合法的,不应该被阻断。该过滤方法存在的缺点与黑名单类似,就是更新和维护难以达到实时,一些正常的、不为系统白名单所收集的邮件有可能被阻断。从应用的角度来说,在小范围内使用白名单是比较成功的,可以在企业或者公司的网关处通过一段时间的监控来生成白名单。图3设置了用户确认的白名单信息,这些邮箱发送的邮件将被Foxmail客户端正常地接收。 图3 白名单过滤
贝叶斯方法过滤 即使采用了前面的技术,仍然会有相当一部分垃圾邮件漏网。因为垃圾邮件的最直观和最核心的部分往往存在于邮件体当中。对此种情况,目前最有效、最根本的方法是基于邮件正文的内容过滤。其中比较简单的方法是,结合内容扫描引擎,根据垃圾邮件的常用语、垃圾邮件受益者的姓名、电话号码、Web地址等信息进行过滤。Foxmail提供了“贝叶斯过滤”功能,它是一种成熟的基于机器学习理论的方法。要想使用该功能,必须统计到足够多的垃圾邮件和非垃圾邮件的关键字,也就是说需要尽量多地学会识别垃圾邮件和非垃圾邮件才能且确定垃圾与非垃圾邮件的分类。图4至图6给出了使用贝叶斯方法过滤的步骤,通过对用户选定的收件箱中的邮件进行学习,该贝叶斯方法学习到了正常邮件的一些特点,所以能够识别异于正常邮件的“非法邮件”。特别需要提醒用户的是,在使用该方法过滤的时候,用户需要权衡到底选定收件箱、发件箱还是垃圾邮件箱进行学习,这直接影响到使用贝叶斯方法的学习效果,从而影响到垃圾邮件过滤的效果。强烈建议用户对自己确认的垃圾邮件箱中的邮件进行“垃圾邮件”类型的学习,因为这样即算漏掉了部分垃圾邮件,也不会造成比较严重的后果;否则如果设置不当的话,该方法极有可能将用户的正常邮件过滤掉(比如说很久没有和自己联系的好友的信件,用户由于选择了对收件箱中的邮件进行正常邮件类别的学习,那么当该封邮件来到的时候,这封邮件极有可能被判为垃圾邮件而丢弃),引起不必要的损失。 图4 开始贝叶斯学习 图5 选定待学习的邮箱 图6 选定待学习的类别 在使用垃圾邮件客户端的过程中,用户需要特别注意:需要固定时间、固定周期地对其黑名单、白名单进行更新,并根据实际情况使用贝叶斯方法进行再学习,不断提升过滤效果。因为,垃圾邮件的种类和特征在一段时间之后是有可能发生改变的,所以需要动态地对垃圾邮件客户端进行配置。 将垃圾邮件有效地拒之门外是一个长期的过程,用户需要综合使用上述方法进行垃圾邮件防御工作,尽可能地避免垃圾邮件的骚扰。同时,用户也应该多从反垃圾邮件的过程中多吸取教训和总结经验,这样才能在这场长期的战斗中处于有利的地位,保护自己的权益。
|
|||||||
打印本文 关闭窗口 |