百度360必应搜狗淘宝本站头条
当前位置:网站首页 > SEO教程 > 正文

安全使者——百度网址安全中心解密

gaoyangw 2025-03-20 14:46 17 浏览 0 评论

在平时使用百度搜索网站的时候,如果是恶意网站,百度经常会弹出“检测到XX是不安全网址”的提示。这样预先的防范可以让我们避开对恶意网站的访问,这个防范操作是借助百度网址安全中心实现的。今天就让我们一探究竟,看看这个安全中心究竟如何运作,以及对于恶意网站的检测又用到什么技术。

对付恶意网站,常见安全措施有这些

由于现在大部分威胁都来自网上,现在的恶意网站主要是钓鱼网站和暗藏木马、病毒网站。当然前者也大多暗藏木马、病毒,它的主要威胁是模仿网银、在线支付等网站,会给我们财产带来损失;后者则主要通过恶意脚本、代码等来对来访者进行侵袭。

对于这些恶意网站的防范,常规的方法是通过电脑安装的杀毒软件等安全软件进行检测,这些安全软件会在我们打开网址进行访问的时候,在后台自动对访问的网址进行检测,如果是恶意网站则会拦截浏览器对其的访问。这些常规的防范主要借助杀毒软件更新的病毒库进行检测,但是现在这类网站每天层出不穷,而且使用各种变种、难以查杀的代码来绕过杀毒软件的检测。因此为了可以更好保护网民的安全,现在百度、腾讯等公司则使用更为全面、先进网址安全中心服务来阻止我们对恶意网站的访问。比如百度网址安全中心会对互联网上数以亿计的网站预先进行检测,并将可能包含恶意代码的网站在搜索结果中进行标注,这样我们在使用百度进行搜索时就可以避免对这类网站的访问(图1)。

图1 百度网址安全中心会对恶意网站进行标注

安全检测,百度网址安全中心背后的技术

大家知道现在网上恶意网站非常多,那么百度网址安全中心是怎么对其进行鉴别?其背后又使用了哪些前沿技术?

首先对于互联网上数以亿计的网页,百度使用“搜索引擎爬虫”来进行自动访问。对于这些恶意网站的访问,网络爬虫并不是简单在网站门口“瞄一眼”(建立网页快照),因为很多恶意网站存在跳转、加密,简单的表面访问并不能发现这些暗藏的危险因素。爬虫在访问这些网站的时候会利用种种技术手段,把这些异常代码、跳转等全部记录下来。

爬虫收集到所有网站的信息后会汇总到安全服务器,接下来就是对收集到的网页进行安全检测。网址安全检测的幕后功臣则是“网址安全检测引擎”,它会针对不同种类的恶意网址使用不同方法进行检测。比如对于恶意挂马网页的检测方式是使用特征代码进行检测,百度网址安全中心工程师利用类似“沙盘”的虚拟系统对网页进行打开进行测试,如果网址报警,则在搜索引擎数据库中将这个网址标注为红色风险页面,这样搜索用户一看就知道是恶意网页(图2)。

图2 恶意网址

对于恶意网址,百度网址安全中心则使用一种名为“TF-IDF算法”来进行判定。该算法可以提取网页内能够表述网页内容的关键词,找到在这个网页中出现频繁,但是其他网页中并不普遍的词汇,比如某网址页面频繁出现那些粗俗、下流的关键字,则判定其为非法页面(图3)。

图3 TF-IDF算法原理图解

对于钓鱼网站的鉴别则借助“SIMHASH 算法”来判定,该算法把一个网页内容转换成一个64位的“特征字”(类似文件的哈希值),如果两个内容的特征字距离小于规定值,那么就判定二者相似度极高。比如百度会先将工行网站首页进行识别并生成特征字,如果爬虫收集到的某个网址,经过“SIMHASH 算法”得出的特征字和工行很类似,那么网址安全中心就会将其判定为工行钓鱼网站,并在搜索结果中进行标注,从而可以让大家不去访问这些钓鱼网站。

不过除了模仿银行钓鱼网站,还有相当多虚假中奖页面并没有模仿元素。对于这类网址,百度安全中心使用“人工智能”技术进行识别。人工智能的核心是训练机器来模拟人的判断,从而让机器拥有类似人工的智能,可以对常见的恶意网页拥有辨别的能力。如很多虚假的中奖页面大多具备如下特征:

网页中的图片比例很高,呈现瀑布流状。

而这类网页链接由于频繁变动,经常是一些和正常网址不一样的奇怪域名。

这类网站也会引用大量的外部链接。

这样工程师把虚假中奖页面这些特征特征参数放到深度学习引擎中,机器通过学习大量的中奖页面后就可以对自动对爬虫搜集到的网址进行鉴别,从而实现自动的智能识别(图4)。

图4 人工智能学习技术图解

写在最后:道高一尺魔高一丈,安全靠大家

俗话说“道高一尺魔高一丈”。对于百度安全中心推出各种安全检测手段,恶意网页的制作者也不会束手就擒。比如为了躲避类似百度安全中心的检测,一些恶意网站将原来频繁出现的关键字变化为图片,从而躲过百度对关键字的检测。对于这种变化,百度网址安全中心则使用OCR识别技术对图片文字进行识别,同时生成对应的规则让机器学习,这样通过强大的人工智能技术可以让这种恶意网页这种变化无所遁形。

不过现在网络安全形式仍然十分严峻,类似百度网址安全中心并不能完全保护我们的安全。一方面是安全中心并不能100%检测到所有恶意网页,每天在网上仍然会出现各种各样的恶意网址,另一方面出于好奇,即使明知是风险页面,很多朋友仍然会主动尝试打开,这大大增加中招的风险。因此要让自己电脑更加安全,平时我们就要养成良好操作习惯,比如类似支付宝、网银等页面,平时将其官网添加到收藏夹,访问时是通过收藏夹进行打开,这样可以避免很多钓鱼网站的攻击!

相关推荐

手把手教你30分钟搭建企业官网:零基础也能搞定的傻瓜式教程

想给公司做个网站展示产品,又怕被程序员忽悠花冤枉钱?今天教你个绝招——用现成的网站模板"拼"网站!就像搭乐高一样简单,全程鼠标点点就能搞定,连代码都不用碰。第一步:挑个合身的"...

以Twig模板为例浅学一手SSTI(twig中文)

什么是SSTISSTI:开局一张图,姿势全靠ySSTI,即服务器端模板注入(Server-SideTemplateInjection)...

成功上岸腾讯运营,教你如何写校招简历?

产品策划/运营的校招简历应该怎么写?作者从自身实际情况出发,总结分享了相关经验,希望对你有用。写在前面红红火火恍恍惚惚,本人是一位2020届本科毕业生,校招意向互联网产品类。此前有过产品相关的项目&a...

50个精彩的响应式HTML和CSS模板:上

自由设计固然是一件好事儿,然而经常关注先进的设计作品,久而久之,就会帮你节省更多的布景设计时间,视觉效果也明显会更为专业,可以参考以下这些响应式HTML/CSS模板,实用性高,你肯定能从中汲取不...

你的人生,有多少“模板”?(扣好人生第一粒扣子手抄报模板可打印)

你浏览网页时,注意过那些海报吗?海报不仅仅是广告,还可以传递新闻信息,也常常摘要一些金句热词。作为一种新的传播形式,海报传递信息,简洁快捷,鲜明突出,往往有意想不到的效果。然而,做一张网络海报并不容易...

5款值的推荐的高效工具软件(高效工作软件哪个好用)

现在,有很多实用的工具和软件可以帮助我们更高效地完成各种任务。以下是几个值得推荐的工具和软件,能够极大地提高我们的工作效率。1.矢量设计——AffinityDesigner...

广州津虹YY直播成立“麦絮”厂牌 打造直播界短剧新标杆

3月31日,广州津虹YY直播在广州举办了生态大会暨麦絮短剧星光点映礼,宣布正式成立短剧厂牌“麦絮”,旨在宣传和推广自制短剧。广州津虹YY直播计划聚焦生态故事,与旗下公会、主播,以及百度、七猫、爱奇艺、...

广州哪家小程序开发公司比较靠谱?这三家值得推荐

小程序已成为企业数字化的重要工具,广州作为互联网产业重镇,小程序开发公司众多。如何选择靠谱的服务商?本文推荐三家实力突出的公司,供您参考。一、广州聆科网络技术有限公司本土老牌技术团队,专注小程序定制开...

西北嚎狼解析SEOer如何写好优质的软文

什么是软文?狭义:指企业花钱在报纸或杂志等宣传载体上刊登的纯文字性的广告。广义:企业通过策划在杂志或网络等宣传载体上刊登的提升企业品牌形象和知名度。软文:以摆事实讲道理的方式使用使消费者走进企业设定的...

花了15分钟答题,成功成为内容品鉴官了

午后的阳光在手机屏上碎成光斑,我盯着弹窗里闪烁的「恭喜」二字,指尖悬停在半空忘了动作。第三次了,那些被题库支配到深夜的郁结,此刻正顺着喉咙往上涌,最终化成一声压在胸腔里的叹息——这次终究是不同的。(一...

怎样写出能突破一切封锁的好广告(怎样写出能突破一切封锁的好广告作文)

每天拿出一分钟来学习,你得生命会更加精彩,我是洪雨有个朋友跟我讲,“现在发广告真难啊,发个链接就被删了,有时候你起的名字里带点广告都不行,引流真难啊……洪雨为什么你几乎可以在任何地方做广告,是怎么做到...

你能看出几个广告?软文分享《一个程序员的一天》

从电视广告到平面广告,再到各个banner、病毒视频、软文、HTML5等等等,各家公司为了给自家的产品做广告费尽了心思,无所不用其极。小编近日看见一篇文章,一时间竟没反应出这是一篇软文!只能说6666...

中小企业发稿总被拒?资深编辑教你3招软文发布轻松过审

中小企业新闻媒体发稿经常被拒怎么办?资深编辑教你3招软文发布轻松过审:发稿流程和投稿要点、注意事项分享...

「源生活」那些让人惊喜的中秋节软文广告

说起中秋节,我相信很多人会想起来很多物品,小编想到的是:水果,月亮,月饼,鲜花。此外还有数不尽好广告,好文案。当然了中秋节作为下半年的第一个大节日,显得就比较重要了。特别是又是传统佳节,又是法定节假日...

软文案例标题和内容怎么写(软文优秀案例)

1:软文营销专家南昌牛推科技(媒介星软文平台)全网营销+一对一服务成长软文案例标题和内容怎么写?软文营销专家南昌牛推科技(媒介星软文平台)全网营销+一对一服务成长,从业务经验出发分享一些心得。软文标题...

取消回复欢迎 发表评论: