统计
  • 文章总数:27 篇
  • 评论总数:0 条
  • 分类总数:3 个
  • 最后更新:6月13日
原创工作交流

百度搜索引擎是如何收录网站内容,然后展现给搜索用户的?

本文阅读 5 分钟
首页 工作交流 正文

刚接触网站的小白可能经常听别人说网站收录、收录,到底百度或者各大搜索引擎是如何将网页收录再反馈给搜索用户的呢?16今天来给大家分享一下搜索引擎的工作原理,参透搜索引擎工作原理,做SEO就手到擒来了!

大家知道的搜索引擎流程:

我们都知道百度有个蜘蛛的程序或者脚本,通过互联网爬取咋们的网页,只要我们网页不限制,基本都能抓取到,没被抓取的也有提交入口,抓取到了然后将网页反馈给搜索用户!完事儿,就是这么简单,这是大家的一个通俗理解。

SEO拆分重点:
1.刚才提到的网页限制,那就是根目录的robots.txt文件,具体设置这里不多说了,具体可以百度查询如何去写这个文件限制。
2.提交入口(百度提供提交入口,当你用“site:”命令的时候没有收录的会自动提示你提交!点击提交自己的网址即可!)

完整的搜索引擎流程:

16在网上找了一下,看了很多从网页抓取到展现的流程图,有的太复杂,有的又太轻浮,觉得下面这张图最具有代表性,也最一目了然。
lt8grutk.png

简单概述一下:

蜘蛛通过互联网获取到URL,也就是你的网站,会进行爬取你的url,这里的爬取也是一个复杂的关系,所以这里也有关于url的一些SEO优化技巧,如何让爬虫更快更精准的爬取网页,这个放到下面简单讲一讲吧。
下一步就是抓取网页到临时库,临时库里面的内容并不能被搜索用户搜索到,这点大家要注意!
临时库会经过重重筛选机制,这里肯定就有咋们的去重、防抄袭、劣质等等过滤。符合规定的就进入索引区,不符合规定的就被丢弃掉。
索引区的内容通过专业首段匹配,分类归档然后将结果筛选反馈给用户。
这就是一个完整的工作原理,当然里面还有很多技术层面的东西这个谁也不知道,当然,搜索引擎肯定也不会对外公布,但咋们只要知道他的大致流程,就能围绕他的逻辑来做出更大的曝光文章、和更多的流量了不是么!

SEO拆分重点

这里应该有SEO拆分重点么?16觉得很多笔者应该都不会将这一步告诉大家,今天16就破例给大家讲讲,拆分重点:
1.前面说道的url的设定和逻辑关系,这里是关于url的优化,第一是url的一个链接优化,最好是采用数字或者音文+数字的方式,这是建议,16也没说中文就不被收录额,专牛角尖的小伙伴儿就不要来了,还有就是栏目的布局一定要利于抓取,页尾最好配上webmap为佳!
2.前端代码的结构优化,前端代码不能臃肿,删除多余无用代码和修改结构混乱代码和去除网站死链接。
3.就是上面说到的防重和原创,什么是原创?手写的就是原创?答案是,错!!!搜索引擎理解的原创就是上图中所有临时库和索引里没有的内容就叫原创,这个索引是整个互联网的索引,并非单一你自己网站内部的索引,当然也包括其中。
然后如何去创作就看自己了,前面的文字有给大家分享过如何批量产出原创文的方法,不知道的小伙伴儿可以去学一学,今天分享就到这里!

原创文章,作者:成都毛毛,如若转载,请注明出处:https://maomao.hhpi.cn/start.html
成都毛毛个人网站建好了,大概规划了一下我的分类和以后的一个更新方向!
下一篇 » 03-02

发表评论

发表评论
    请配置好页面缩略名选项

热门文章

标签TAG

没有任何标签

热评文章

最近回复