首页

贝叶斯算法 在反垃圾邮件技能中贝叶斯算法的使用

点击:0时间:2019-11-04 21:03:07

徐锐

摘 要:在当今的社会,网络技能的运用现已进入到了日子中的各个方面,而在日常作业傍边电子邮件现已成为相互交流传递信息的一项重要手法。但在电子邮件的运用进程中,咱们都会遇到一个困扰那就是废物邮件。针对废物邮件互联尽管现已推出了许多办法,可是废物邮件并未因而而得到有用遏止,反而日益猖獗。本文首要介绍了一种较新式的反废物邮件技能——贝叶斯过滤技能,剖析其基本原理,长处和缺陷,以作为防备废物邮件的技能讨论。

关键词:废物邮件 反废物邮件 贝叶斯算法

自电子邮件被越来越多的人们运用以来,废物邮件的问题一向困扰着电子邮件的运用者,人们也找到了许多的处理之道,从前期的关键字匹配,到经过衔接频率来进步发送废物邮件的本钱,再到建立专用服务器,供给RBL实时黑名单查询,直到全世界范围内关于废物邮件立法的呼吁。不管哪种方式办法,要想从根本上免除废物邮件的众多,仍是需求一套可以有用防备废物邮件的安全技能。

一、废物邮件的发作和无法防止的技能原因

废物邮件(SPAM) 也称作UCE(Unsoticited Commercial Email.未经许可的商业电子邮件)或UBE(Unsolicited Bulk Email,未经许可的许多电子邮件)。初次关于废物邮l件的记载是1985年8月的一封经过电子邮件发送的连锁信,一向继续到1993年6月呈现了名为“Make Money Fast 的电子邮件。1994年4月SPAM一詞初次呈现.其时Canter和Siegel律师事务所把一封信发送到6000多个新闻组,宣扬取得美国国内绿卡的法令支撑。这时开端,许多商人瓤运用废物邮件广告。1995年首个专门用于发送废物邮件的程序Floodgate发布,诙程序可以自动地把邮件发送给大批人。同年8月开端呈现出售邮件地址的事情。从此,废物邮件一再呈现.也引起了人们的恶感。[1]

当时邮件传输的首要协议是SMTP协议,从规划之初,为了满意简略传输的需求,该协议没有任何认证手法,因而缺省的SMTP邮件服务器关于邮件的来历和目的地不做操控而是支撑发送。[2]

跟着废物邮件的众多,大部分的邮件服务器都封闭了OpenRelay,在发送方和发送服务器之间进行认证,然后确保只要合法用户才干运用这台服务器发送邮件,这就是增强的ESMTP协议。但是这个办法无法处理在发送服务器和接纳服务器之间的合法认证,废物邮件依然无法防止。[3]

2.贝叶斯算法的好坏

贝叶斯危险是衡量一个决议计划规律的好坏的规范。一般来说,大都情况下,关于某一个(或某些)状况θ值,决议计划规律δ?的危险函数值ρ(θ,δ?)最小;而关于另一个(或另一些)θ值,另一个决议计划规律δ?的危险函数最小,因而,点评一个决议计划规律的好坏,只能用在各种不同状况下其危险函数的均匀值来衡量。贝叶斯风脸β(δ)就是当决议计划规律为δ,在状况θ下危险函数的均匀值,决议计划规律一经断定,其贝叶斯危险即为一常数。它反映出运用这一决议计划规律决议计划的均匀丢失。

由于贝叶斯算法是根据先验概率和样本信息来核算后验概率的办法,所以其关于样本堆集的数量具有很大的依赖性,需求一个较长的进程,开端的时分,可能会发作很大的误判和漏判现象,只要当堆集的样本数量足够多,其检测精度才干抵达必定高度并为用户所承受。

3.结和展望

跟着网络老练,将贝叶斯过滤技能运用到反废物邮件技能中, 可以说是一种测验,也是反废物邮件技能范畴中的一个研讨方向。现在,关于贝叶斯技能的运用正在成为反废物邮件范畴的一个研讨热门,越来越多的专用发废物邮件产品正在测验运用贝叶斯过滤技能来进步其产品的检测精度,下降办理本钱。

参考文献

[1]倪加勋,袁卫,运用统计学,北京我国人民大学出版社,1993.

[2]郭泓,电子邮件过滤技能浅析,信息网络安全.2002.

[3]王斌,潘文峰,根据内容的废物邮件过滤技能总述,我国科学院核算机技能研讨所硕士毕业论文.2004.

[4]托马斯·贝叶斯 .智库[引证日期2013-03-07].

[5]条件概率和贝叶斯定理 .我国敞开教育资源联合体[引证日期2013-01-07].

[6]An Essay towards solving a Problem in the Doctrine of Chance. Philosophical Transactions of the Royal Society of London .1763[引证日期2015-03-31].

[7]贝叶斯定理-贝叶斯 .贝叶斯定理.2014-03-21[引证日期2014-03-21].

相关新闻
最新新闻
关闭