全栈工程师修炼指南
熊燚(四火)
Oracle 首席软件工程师
32206 人已学习
新⼈⾸单¥59
登录后,你可以任选4讲全文学习
课程目录
已完结/共 46 讲
全栈回顾 (1讲)
加餐 (1讲)
全栈工程师修炼指南
15
15
1.0x
00:00/00:00
登录|注册

32 | 和搜索引擎的对话:SEO的原理和基础

返回结果(Serving Results)
建立索引(Indexing)
爬取(Crawling)
扩展阅读
统计分析
网站地图
robots.txt
站内优化和站外优化
白帽和黑帽
PageRank
组成部分
总结思考
SEO 相关技术
互联网搜索引擎
和搜索引擎的对话:SEO的原理和基础

该思维导图由 AI 生成,仅供参考

你好,我是四火。
今天,我们来聊一聊搜索引擎和 SEO(Search Engine Optimization)。当网站发布上线以后,我们希望通过适当的优化调整,让它可以被搜索引擎更好地“理解”,在用户使用搜索引擎搜索的时候,网站的内容可以更恰当地暴露给用户。
作为程序员,和更擅长于与内容打交道的运营相比,我们的角度是不一样的,我们更关注工程实现而非网页内容,也更需要从原理的角度去理解 SEO。这一讲,就让我们从理解互联网搜索引擎的工作原理开始。

互联网搜索引擎

要说 SEO,我觉得我们需要先来简单了解一下互联网上的搜索引擎。

组成部分

对于 Google 和百度这样的巨型 Web 搜索引擎来说,这里面的机制很复杂,而它们之间又有很多区别。比如被搜索的数据是怎样产生的,权重是怎样分配的,用户的输入又是怎样被理解的等等,但是大体上,它总是包含这样三部分。
1. 爬取(Crawling)
搜索引擎会有若干个“爬虫”客户端定期地访问你的网站,如果数据有了变更,它们会将可访问的网页下载下来。搜索引擎发现网页的方式,和人是一样的,就是通过超链接。因此理论上,如果你建立了一个网站,但是你没有主动“告知”搜索引擎,也没有任何网站页面有超链接指向它,那么它是无法被搜索引擎的爬虫发现的。
确认放弃笔记?
放弃后所记笔记将不保留。
新功能上线,你的历史笔记已初始化为私密笔记,是否一键批量公开?
批量公开的笔记不会为你同步至部落
公开
同步至部落
取消
完成
0/2000
荧光笔
直线
曲线
笔记
复制
AI
  • 深入了解
  • 翻译
    • 英语
    • 中文简体
    • 中文繁体
    • 法语
    • 德语
    • 日语
    • 韩语
    • 俄语
    • 西班牙语
    • 阿拉伯语
  • 解释
  • 总结

搜索引擎优化(SEO)是提高网站在搜索引擎结果中排名的关键技术。本文从搜索引擎工作原理出发,介绍了爬取、索引建立和结果返回的步骤,以及PageRank算法的重要性。此外,还探讨了站内外优化、roberts.txt文件配置、网站地图的重要性和Google Analytics的使用原理。这些内容为读者提供了全面的SEO知识概览。对于想要了解搜索引擎工作原理和SEO技术的读者来说,本文是一篇很有价值的文章。 SEO技术的实现需要站内外优化、roberts.txt文件的配置、网站地图的重要性以及统计分析工具的使用,这些内容为读者提供了全面的SEO知识概览。同时,文章还提到了一些扩展阅读建议,包括SEO黑帽法、Google Analytics官方资料以及PageRank算法的学习材料,为读者拓展了更多相关知识的学习途径。

仅可试看部分内容,如需阅读全部内容,请付费购买文章所属专栏
《全栈工程师修炼指南》
新⼈⾸单¥59
立即购买
登录 后留言

全部留言(6)

  • 最新
  • 精选
  • 💢 星星💢
    老师你好,关于反爬虫,除了使用roberts.tx文件以及网站、页面和链接这样的软性规定。还有什么有效手段么?怎么识别它是爬虫呢?

    作者回复: 识别爬虫,就是要识别出爬虫访问和人访问的不同。 比方说,可以设置一个token,如果爬虫访问,这个token无法被准确和顺利地生成,那么请求就可以屏蔽。 比方说,人访问的点击都是符合某些特征的,比如过高频率的点击,可以认为是爬虫所为。 一些大厂甚至会采用机器学习的方法来识别爬虫,以提高识别率和准确率。

    2020-03-31
    2
  • Long
    老师你好,请问 在白帽子做法中的,网页在站点访问的深度,这句话是什么意思, 可以理解为网站本身的构造有多深吗?

    作者回复: 这里的深度,指的是从首页开始,最短通过几次跳转(超链接)可以到达。

    2019-12-14
  • 四喜
    像淘宝京东等电商网站,都不能容许流量池子被别人撕开口子。搜索只能在站内,竞价排名也只能在自家站内买。 那么除了搜索引擎的爬虫本身主动被动的遵守robots.txt,是不是电商网站也绞尽脑汁做了各种反爬虫的手段呢?

    作者回复: 对的。据我所知,电商网站也确实是做了各种反爬虫的手段的,特别是竞争对手的爬虫。(我以前在 Amazon 工作,所以知道)

    2019-11-27
  • 許敲敲
    老师你好,我想了解下,我自己在github上搭建一些静态博客,使用google analytic就可以分析我网站的一些被浏览信息是嘛? 不知道配置这个麻烦吗,今天下班去翻个墙研究下。

    作者回复: 对你说的这几个组合起来,我没有尝试过,但是技术上看,配置 Google Analytics 应该是非常简单的,一小段脚本就可以了。

    2019-11-22
    4
  • Geek_74d3ac
    老师不进一步不讨论一下单页应用的seo 问题,以及实际上的竞价排行问题 和让 seo 或者搜索引擎本身逐渐失去意义的移动应用生态圈封闭问题么?
    2020-09-16
  • 丁丁历险记
    百度已成为了一家广告公司。
    2019-11-28
收起评论
显示
设置
留言
6
收藏
沉浸
阅读
分享
手机端
快捷键
回顶部