百度360必应搜狗淘宝本站头条
当前位置:网站首页 > SEO教程 > 正文

SEO新手入门系列2022(三):搜索引擎工作原理

gaoyangw 2024-12-02 17:40 14 浏览 0 评论

通过《SEO新手入门系列2022(二):SEO 101》这篇文章已经简单的介绍了什么是SEO,和搜索引擎,这一篇文章来详细的介绍下搜索引擎的工作原理,搜索引擎的工作顺序大致是:抓取网页(Crawing)建立索引(Indexing),排名显示(Ranking)

就像在前一篇文章提到的,搜索引擎就是一个问答机器,他们去挖掘,理解,组织网上能发现的任何信息,然后把他们以相关的方式组织起来,再返回给使用者,为了能把你的网站展现给用户之前,最重要的一件事就是你的网站能够被搜索引擎发现 ,否则在SEPRs(搜索引擎结果页)是不会有你网站信息的。

搜索引擎是怎么工作的?

就如SEO小也开头说的,搜索引擎想把网站信息提供给用户,需要完成三个主要任务:

  • 爬取网站(Crawing)会有很多蜘蛛程序,顺着URL一个网站一个网站的爬取网站内容。
  • 创建索引(Indexing)对蜘蛛爬取的内容进行分类,创建相关索引,并储存在数据库中。
  • 建立排名(Ranking)为可能的问题建立相关性排名,相关性最高的内容排在靠前的位置。

当然其中的技术实现是非常复杂的,作一名SEO新人,可能占时不需要深究这些问题,SEO小也在大学毕业的时候,作的毕业设计就是搜索引擎,当然那时候是使用第三方的索引分词库,我们大部分时间只要配置规则就可以,更深入的内容我会另写些篇文章来分享。

搜索引擎抓取(Crawing)

搜索引擎要想把相关内容展示给用户,第一步做的就是派出他的小弟——搜索引擎爬虫(蜘蛛),他们会不停的抓取互联网上新的内容,或者更新数据库中旧的内容,内容的形式多种多样,有可能是网页,PDF文件,MP3音频文件,什么形式都有,但是他们都是通过URL去找到这些内容的。



搜索引擎一开始会有一些种子URL,这些URL都是一些质量比较高的链接地址,而且蜘蛛们就会顺着这些地址不断的往下抓取,在这个过程中,新发现的链接又会被作为新一轮爬取任务的种子URL,直到没有新的链接可以爬取。

搜索引擎索引(Indexing)

建立索引是一个非常复杂的过程,这个过程涉及的内容比较多的是计算机方面的内容,有算法,有地理环境,有社会学研究等等因素,搜索引擎会根据很多参数去控制这些内容的分类,但是最重要的一点,就是这些内容的相关性,相关性越高,被分在同一个分类的可能性就越高,建立索引是为了后期能快速展现给用户作准备,也是为排名提供数据基础。

搜索引擎排名(Ranking)

用户在搜索引擎输入框输入他的关键词,搜索引擎会用惊人的效率在他庞大的索引数据库中找到相关的内容,并按内容的相关性和一些其它的参数来对内容进行排序,这个过程就是搜索引擎排名,靠前的内容,在搜索引擎看来就是和用户的问题相关性越高的回答。

如果我们不想让搜索引擎把一些内容展示给用户,这也是可以办到的,但是大多数情况下我们不会这么做,搜索引擎优化的目的就是为了让用户看到我们,并能让搜索引擎优先展示我们想给用户看的内容。

搜索引擎能找到你么?

就像前面说的,如果要让自己的网站出现在SERPs中,那前提就是让网站被搜索引擎蜘蛛爬取和索引,如果你已经有了网站,你可以使用site命令来查看自己网站被收录的情况,就拿SEO小也为例,在谷歌搜索框输入site:www.seozen.top你可以看到如下类似的结果:



可以看到SEO小也已经有135个网页已经被谷歌收录,这个结果是经常会变动的,能看到一个大概的数据,并不是特别的精准,还有很多没有显示的网页,用一些关键词也是能搜索到。如果想看更精准的结果,可以使用Google Search Console在收录功能中查看,这就相当于我们百度的站长平台,但是SEO小也个人觉得比百度站长的作用要大的多,所以SEO小也一般只会看GSC的数据,很少去看百度站长平台的数据,以后也会专门写几篇文章来介绍。

如果你使用site命令找不到网站的收录,那有可能是下面几种原因:

  • 网站是新站,搜索引擎还没有收录。
  • 网站没有外部导入链接,可以到一些平台发一些外链。
  • 网站目录结构太深,太复杂,让搜索引擎爬虫抓取的效率太低。
  • 网站可能包含一些阻止搜索引擎爬虫的代码,如noindexnofollow
  • 网站可能被搜索引擎处罚,因为一些作弊或者垃圾广告等。

我们有时候把精力太多的放在如何让搜索引擎抓取内容,却忽略如何不让搜索引擎不要爬取一些内容,比如说一些重复的页面,一些搜索参数,还有比如说公司的联系方式,留言等,这些内容被收录意义并不大,而且还会让搜索引擎不知道具体哪个界面是你最想展示给用户的,所以这时候我们就要告诉搜索引擎,哪些资源他不要花时间去爬取,这就要robots.txt文件出场了,这篇SEO教程先到这。

相关推荐

企业网站建设流程中的八大步骤(企业网站建设的基本流程)

在企业网站建设中,有很多环节需要考虑。通过与客户密切合作,我们可以全面了解他们的需求,并提供专业的建议。在确定细节后,我们将根据客户的需求和设计来制作网站。无论网站的规模大小或功能复杂度如何,这个一般...

企业建设网站有哪些流程(企业网站建设的基本流程)

今天我们来探讨一下企业建站的流程有哪些,下面我们就来一起看看吧。1、肯定网站的风格和功能...

非遗美食之广东——高埗矮仔肠(矮仔祥腊肠官网)

东莞高埗矮仔肠是广式腊味中的一种,其外观与普通腊肠有着很大的差别,比较短而粗,其名字也是源于此。...

东莞企业新网站如何做好百度首页关键词排名?

随着电子商务快速发展,越来越多的传统企业开始建立自己的网站,进而推广自己的产品。有很多朋友都想知道新网站如何做好SEO优化?今天我以自己的实战经历,简单聊聊,一个新建的网站,如何从0开始做好SEO优化...

WordPress 技术革命:企业级应用全解析

作为全球38.2%网站的技术底座(W3Techs数据),WordPress早已不是那个2003年诞生的简单博客系统。从个人创作者到《纽约时报》这样的媒体巨头,从中小企业官网到跨国品牌数字化...

东莞网络推广,常用方法-东莞网络推广

在如今的互联网时代中,企业想要获得更好的推广效果,就需要合理的运用各种东莞网络推广方式,只有这样才能扩大企业的宣传范围,提升企业的曝光度,从而也就能够吸引更多的用户关注,进而产生更多的流量和转化。那么...

新闻源推送权威度增强技巧(新闻如何推送才能准确优质)

新闻源推送权威度增强技巧在信息过载的互联网环境中,新闻源推送的权威性直接影响内容的传播效果与用户信任度。以下从内容优化、平台选择、SEO策略等维度,系统梳理提升新闻源推送权威度的核心技巧:一、内容质量...

玄凤鹦鹉和牡丹鹦鹉哪个好?价格,说话能力,智商,寿命等特点

玄凤鹦鹉和牡丹鹦鹉哪个好?这个问题没有准确的答案,因为有很多人喜欢牡丹鹦鹉,他们会说牡丹鹦鹉好,也有很多人喜欢玄凤,他们会说玄凤鹦鹉好。那么,到底是喜欢牡丹鹦鹉的人多,还是喜欢玄凤鹦鹉的人多呢?总体而...

服务类网站排名首页的seo策略(服务型的网站)

什么是服务类网站?答:服务类网站是以满足用户需求、提供服务为主,比如:做家政服务、做公司注册、做装修装饰服务等之类的网站统称为服务类网站。怎么运营服务类网站?首先要知道百度有一个算法是“百度区域性算法...

抖音搜索SEO底层逻辑是什么?(抖音搜索seo底层逻辑是什么意思)

抖音搜索SEO底层逻辑是什么?...

地方服务类型网站该怎么做好SEO优化

地方服务类型网站该怎么做好SEO优化。我们都知道想了解信息用百度,想购物上淘宝,想聊天呱呱蛋用微信或者QQ。服务类型的网站大部分的流量都来自搜索引擎;而且搜索引擎大部分的流量就来自关键词;而关键词流量...

SEO资料-09 关键词定义及分类-头脑风暴,核心词运营的产品和服务

关键词选择三步走这是课程目标...

百度搜索异常 营销者不要丢了SEO(百度出现奇怪的搜索记录)

百度一下你就知道这句话已经深入人心,在PC端、在搜索时代百度已经深入人心。虽然现如今大家都在谈移动互联网,但有人就有搜索,况且百度移动搜索份额也不低,今天下午百度搜索异常,从网民反应来看,守护袁昆认为...

品牌如何打造自己的爆款话题(打造品牌文案)

在注意力极度稀缺的当下,谁能制造出高频被提及、主动被讨论的话题,谁就拥有了“控制传播节奏”的能力。对于品牌而言,一个设计得当的爆款话题,远比一次硬广投放更容易“借势上榜”,实现声量破圈。打造爆款话题,...

AI搜索优化实战手册:让品牌成为AI信任的“高价值信息源”

当AI搜索直接在结果页呈现答案,品牌方对能否干预AI搜索结果充满疑问。深入分析AI搜索逻辑,才能找到AI搜索优化的关键路径。一、AI搜索的逻辑:从机械匹配到智能理解与传统搜索引擎依赖关键词匹配和网页权...

取消回复欢迎 发表评论: