32 | 和搜索引擎的对话：SEO的原理和基础

四火



该思维导图由 AI 生成，仅供参考

你好，我是四火。
今天，我们来聊一聊搜索引擎和 SEO（Search Engine Optimization）。当网站发布上线以后，我们希望通过适当的优化调整，让它可以被搜索引擎更好地“理解”，在用户使用搜索引擎搜索的时候，网站的内容可以更恰当地暴露给用户。
作为程序员，和更擅长于与内容打交道的运营相比，我们的角度是不一样的，我们更关注工程实现而非网页内容，也更需要从原理的角度去理解 SEO。这一讲，就让我们从理解互联网搜索引擎的工作原理开始。
互联网搜索引擎要说 SEO，我觉得我们需要先来简单了解一下互联网上的搜索引擎。
组成部分对于 Google 和百度这样的巨型 Web 搜索引擎来说，这里面的机制很复杂，而它们之间又有很多区别。比如被搜索的数据是怎样产生的，权重是怎样分配的，用户的输入又是怎样被理解的等等，但是大体上，它总是包含这样三部分。
1. 爬取（Crawling）
搜索引擎会有若干个“爬虫”客户端定期地访问你的网站，如果数据有了变更，它们会将可访问的网页下载下来。搜索引擎发现网页的方式，和人是一样的，就是通过超链接。因此理论上，如果你建立了一个网站，但是你没有主动“告知”搜索引擎，也没有任何网站页面有超链接指向它，那么它是无法被搜索引擎的爬虫发现的。

公开

同步至部落

取消

完成

0/2000

荧光笔

直线

曲线

笔记

复制

AI

深入了解
翻译
英语
中文简体
中文繁体
法语
德语
日语
韩语
俄语
西班牙语
阿拉伯语
解释
总结

搜索引擎优化（SEO）是提高网站在搜索引擎结果中排名的关键技术。本文从搜索引擎工作原理出发，介绍了爬取、索引建立和结果返回的步骤，以及PageRank算法的重要性。此外，还探讨了站内外优化、roberts.txt文件配置、网站地图的重要性和Google Analytics的使用原理。这些内容为读者提供了全面的SEO知识概览。对于想要了解搜索引擎工作原理和SEO技术的读者来说，本文是一篇很有价值的文章。 SEO技术的实现需要站内外优化、roberts.txt文件的配置、网站地图的重要性以及统计分析工具的使用，这些内容为读者提供了全面的SEO知识概览。同时，文章还提到了一些扩展阅读建议，包括SEO黑帽法、Google Analytics官方资料以及PageRank算法的学习材料，为读者拓展了更多相关知识的学习途径。

仅可试看部分内容，如需阅读全部内容，请付费购买文章所属专栏
《全栈工程师修炼指南》，新⼈⾸单¥59

立即购买

登录后留言

全部留言(6)

最新
精选

💢 星星💢
老师你好，关于反爬虫，除了使用roberts.tx文件以及网站、页面和链接这样的软性规定。还有什么有效手段么?怎么识别它是爬虫呢？
作者回复: 识别爬虫，就是要识别出爬虫访问和人访问的不同。比方说，可以设置一个token，如果爬虫访问，这个token无法被准确和顺利地生成，那么请求就可以屏蔽。比方说，人访问的点击都是符合某些特征的，比如过高频率的点击，可以认为是爬虫所为。一些大厂甚至会采用机器学习的方法来识别爬虫，以提高识别率和准确率。
2020-03-31

2
Long
老师你好，请问在白帽子做法中的，网页在站点访问的深度，这句话是什么意思，可以理解为网站本身的构造有多深吗？
作者回复: 这里的深度，指的是从首页开始，最短通过几次跳转（超链接）可以到达。
2019-12-14


四喜
像淘宝京东等电商网站，都不能容许流量池子被别人撕开口子。搜索只能在站内，竞价排名也只能在自家站内买。那么除了搜索引擎的爬虫本身主动被动的遵守robots.txt，是不是电商网站也绞尽脑汁做了各种反爬虫的手段呢？
作者回复: 对的。据我所知，电商网站也确实是做了各种反爬虫的手段的，特别是竞争对手的爬虫。（我以前在 Amazon 工作，所以知道）
2019-11-27


許敲敲
老师你好，我想了解下，我自己在github上搭建一些静态博客，使用google analytic就可以分析我网站的一些被浏览信息是嘛？不知道配置这个麻烦吗，今天下班去翻个墙研究下。
作者回复: 对你说的这几个组合起来，我没有尝试过，但是技术上看，配置 Google Analytics 应该是非常简单的，一小段脚本就可以了。
2019-11-22
4

Geek_74d3ac
老师不进一步不讨论一下单页应用的seo 问题，以及实际上的竞价排行问题和让 seo 或者搜索引擎本身逐渐失去意义的移动应用生态圈封闭问题么？
2020-09-16


丁丁历险记
百度已成为了一家广告公司。
2019-11-28



收起评论