百度360必应搜狗淘宝本站头条
当前位置:网站首页 > SEO教程 > 正文

安全使者——百度网址安全中心解密

gaoyangw 2025-03-20 14:46 7 浏览 0 评论

在平时使用百度搜索网站的时候,如果是恶意网站,百度经常会弹出“检测到XX是不安全网址”的提示。这样预先的防范可以让我们避开对恶意网站的访问,这个防范操作是借助百度网址安全中心实现的。今天就让我们一探究竟,看看这个安全中心究竟如何运作,以及对于恶意网站的检测又用到什么技术。

对付恶意网站,常见安全措施有这些

由于现在大部分威胁都来自网上,现在的恶意网站主要是钓鱼网站和暗藏木马、病毒网站。当然前者也大多暗藏木马、病毒,它的主要威胁是模仿网银、在线支付等网站,会给我们财产带来损失;后者则主要通过恶意脚本、代码等来对来访者进行侵袭。

对于这些恶意网站的防范,常规的方法是通过电脑安装的杀毒软件等安全软件进行检测,这些安全软件会在我们打开网址进行访问的时候,在后台自动对访问的网址进行检测,如果是恶意网站则会拦截浏览器对其的访问。这些常规的防范主要借助杀毒软件更新的病毒库进行检测,但是现在这类网站每天层出不穷,而且使用各种变种、难以查杀的代码来绕过杀毒软件的检测。因此为了可以更好保护网民的安全,现在百度、腾讯等公司则使用更为全面、先进网址安全中心服务来阻止我们对恶意网站的访问。比如百度网址安全中心会对互联网上数以亿计的网站预先进行检测,并将可能包含恶意代码的网站在搜索结果中进行标注,这样我们在使用百度进行搜索时就可以避免对这类网站的访问(图1)。

图1 百度网址安全中心会对恶意网站进行标注

安全检测,百度网址安全中心背后的技术

大家知道现在网上恶意网站非常多,那么百度网址安全中心是怎么对其进行鉴别?其背后又使用了哪些前沿技术?

首先对于互联网上数以亿计的网页,百度使用“搜索引擎爬虫”来进行自动访问。对于这些恶意网站的访问,网络爬虫并不是简单在网站门口“瞄一眼”(建立网页快照),因为很多恶意网站存在跳转、加密,简单的表面访问并不能发现这些暗藏的危险因素。爬虫在访问这些网站的时候会利用种种技术手段,把这些异常代码、跳转等全部记录下来。

爬虫收集到所有网站的信息后会汇总到安全服务器,接下来就是对收集到的网页进行安全检测。网址安全检测的幕后功臣则是“网址安全检测引擎”,它会针对不同种类的恶意网址使用不同方法进行检测。比如对于恶意挂马网页的检测方式是使用特征代码进行检测,百度网址安全中心工程师利用类似“沙盘”的虚拟系统对网页进行打开进行测试,如果网址报警,则在搜索引擎数据库中将这个网址标注为红色风险页面,这样搜索用户一看就知道是恶意网页(图2)。

图2 恶意网址

对于恶意网址,百度网址安全中心则使用一种名为“TF-IDF算法”来进行判定。该算法可以提取网页内能够表述网页内容的关键词,找到在这个网页中出现频繁,但是其他网页中并不普遍的词汇,比如某网址页面频繁出现那些粗俗、下流的关键字,则判定其为非法页面(图3)。

图3 TF-IDF算法原理图解

对于钓鱼网站的鉴别则借助“SIMHASH 算法”来判定,该算法把一个网页内容转换成一个64位的“特征字”(类似文件的哈希值),如果两个内容的特征字距离小于规定值,那么就判定二者相似度极高。比如百度会先将工行网站首页进行识别并生成特征字,如果爬虫收集到的某个网址,经过“SIMHASH 算法”得出的特征字和工行很类似,那么网址安全中心就会将其判定为工行钓鱼网站,并在搜索结果中进行标注,从而可以让大家不去访问这些钓鱼网站。

不过除了模仿银行钓鱼网站,还有相当多虚假中奖页面并没有模仿元素。对于这类网址,百度安全中心使用“人工智能”技术进行识别。人工智能的核心是训练机器来模拟人的判断,从而让机器拥有类似人工的智能,可以对常见的恶意网页拥有辨别的能力。如很多虚假的中奖页面大多具备如下特征:

网页中的图片比例很高,呈现瀑布流状。

而这类网页链接由于频繁变动,经常是一些和正常网址不一样的奇怪域名。

这类网站也会引用大量的外部链接。

这样工程师把虚假中奖页面这些特征特征参数放到深度学习引擎中,机器通过学习大量的中奖页面后就可以对自动对爬虫搜集到的网址进行鉴别,从而实现自动的智能识别(图4)。

图4 人工智能学习技术图解

写在最后:道高一尺魔高一丈,安全靠大家

俗话说“道高一尺魔高一丈”。对于百度安全中心推出各种安全检测手段,恶意网页的制作者也不会束手就擒。比如为了躲避类似百度安全中心的检测,一些恶意网站将原来频繁出现的关键字变化为图片,从而躲过百度对关键字的检测。对于这种变化,百度网址安全中心则使用OCR识别技术对图片文字进行识别,同时生成对应的规则让机器学习,这样通过强大的人工智能技术可以让这种恶意网页这种变化无所遁形。

不过现在网络安全形式仍然十分严峻,类似百度网址安全中心并不能完全保护我们的安全。一方面是安全中心并不能100%检测到所有恶意网页,每天在网上仍然会出现各种各样的恶意网址,另一方面出于好奇,即使明知是风险页面,很多朋友仍然会主动尝试打开,这大大增加中招的风险。因此要让自己电脑更加安全,平时我们就要养成良好操作习惯,比如类似支付宝、网银等页面,平时将其官网添加到收藏夹,访问时是通过收藏夹进行打开,这样可以避免很多钓鱼网站的攻击!

相关推荐

义乌推广营销公司seo,霸屏推广多少?

推广营销公司SEO是指通过优化网站内容、结构和关键词,提高网站在搜索引擎中的排名,以吸引更多的潜在客户和流量,从而实现营销目标。...

搜索效果差,试试这几个办法

搜索质量差,找不到所需内容时,可以尝试以下几种方法:换搜索工具;优化关键词;使用搜索指令;多看一些结果。1、换搜索工具搜索效果差,那就换个搜索工具,看看其它搜索引擎的结果。...

铲除网站死链接详细操作指南

死链接会危机网站的安全,死链接的存在意味着网站存在毛病。首先要认识HTTP状态码含义:不能访问的链接称为死链接。当我们访问我们网站页面的时候,它会返回一个三位数的信号给我们的浏览器。比如我打电话给你,...

想要网站快速地被收录,你试过这些方法了没?

做网站优化的,都有一个共同的梦想那就是想要网站可以快速地被搜索引擎收录,而且收录量还要大。然而现实总是残酷的,在现在这搜索引擎算法中不使用作弊的手法情况下,想要网站达到秒收录绝不是网上那些随便说的一些...

百度收录URL无标题泛目录站群系统

尽量使用满年备案米或者历史备案米,白板备案米需要强引蜘蛛,历史米可以保留主站直接开目录本地先操作(服务器操作也是可以)1:本地先配置关键字,其它不用管,一行一个。2:data/url这个文件夹设置自己...

网站快速收录工具大公开!用对方法流量轻松翻倍

大家都知道,搜索引擎可是网站流量的关键入口。要是网站的URL不能及时被收录,哪怕内容再好,也很难获得满意的曝光量。不过别担心,147seo新推出了一款超实用的URL批量推送收录工具,而且它支持...

利用专题页打造关键词排名绿色通道

很多朋友在做SEO的时候,经常会遇到大量长尾词没有排名,针对性的做了大量的工作,但是作用不大,关键词仍旧难以上来,非常纠结。今天悟道SEO跟大家分享一下利用专题页面,为你的大量长尾关键词开通排名绿色通...

如何解决关键词排名急剧下降的方法

1、搜索引擎自身的原因搜索引擎的算法时常都会有细微的改变,这样或多或少的会影响到网站排名,这种情况有的时候过几天就恢复了,有的一直不会恢复。解决办法:对于这种原因,你先要分析下原因,并且到大型的seo...

网站关键词排名:网站排名上不去怎么办?

多数企业都知道,网站优化很重要,网站关键词排名也是。咱们都希望站点收录更多更快,但是很多企业网站建成后,只被收录,排名却上不去,一点流量都没有。而且网站关键词排名老是出现较大波动,时高时低,让人琢磨不...

郑州企业网站关键词排名最专业的公司

网站的关键词排名在当今时代,却受到了人们更高的关注率。因为网站的关键词排名,会直接影响到网站曝光率、点击率和访问量,尤其是企业网站,会直接决定该企业网站的潜在意向客户资源的积累量。现在上网的人几乎都...

关键词如何快速排名

关键词如何快速排名关键词排名是指在搜索引擎中,某个关键词对应的网页在搜索结果中的位置。在互联网时代,关键词排名对于网站的流量和曝光度至关重要。然而,随着搜索引擎算法的不断升级和优化,关键词排名变得越来...

网站关键词排名会被哪些操作影响?

  相信各位做网站优化的朋友们都知道一件事是,内容为王,很多朋友为了达到这一目的,埋头苦干,但是还是没有排名,这是为什么呢?网站关键词排名会被哪些操作影响?那么,接下来小编就跟大家分享下影响网站关键词...

核心关键词排名一夜消失?未被惩罚的网站如何应对幽灵降权!

深夜的流量监控面板上,原本稳定的核心关键词排名突然集体下滑。没有警告邮件,GoogleSearchConsole后台也没有任何人工处罚记录——这正是让众多网站管理者困惑的"幽灵更新"...

SEO关键词优化全攻略,从选词到排名的实战技巧

做SEO的小伙伴们肯定都有个头疼的问题:到底怎么优化关键词才最有效呢?别急,当你弄清楚目标关键词和长尾关键词的区别,学会挖掘长尾词之后,就该正式开启关键词优化之旅啦!...

SE排名与Moz:找到正确的搜索引擎优化工具,用于2025

厌倦了搜索引擎优化工具,没有真正帮助你发展?如你计划2025年的战略,找到正确的平台,可以改变一切。两个名字你可能遇到:SE排名与Moz.两者都提供的功能等级跟踪关键的研究,并建立链接,但他们适...

取消回复欢迎 发表评论: