32 | 和搜索引擎的对话:SEO的原理和基础
四火
该思维导图由 AI 生成,仅供参考
你好,我是四火。
今天,我们来聊一聊搜索引擎和 SEO(Search Engine Optimization)。当网站发布上线以后,我们希望通过适当的优化调整,让它可以被搜索引擎更好地“理解”,在用户使用搜索引擎搜索的时候,网站的内容可以更恰当地暴露给用户。
作为程序员,和更擅长于与内容打交道的运营相比,我们的角度是不一样的,我们更关注工程实现而非网页内容,也更需要从原理的角度去理解 SEO。这一讲,就让我们从理解互联网搜索引擎的工作原理开始。
互联网搜索引擎
要说 SEO,我觉得我们需要先来简单了解一下互联网上的搜索引擎。
组成部分
对于 Google 和百度这样的巨型 Web 搜索引擎来说,这里面的机制很复杂,而它们之间又有很多区别。比如被搜索的数据是怎样产生的,权重是怎样分配的,用户的输入又是怎样被理解的等等,但是大体上,它总是包含这样三部分。
1. 爬取(Crawling)
搜索引擎会有若干个“爬虫”客户端定期地访问你的网站,如果数据有了变更,它们会将可访问的网页下载下来。搜索引擎发现网页的方式,和人是一样的,就是通过超链接。因此理论上,如果你建立了一个网站,但是你没有主动“告知”搜索引擎,也没有任何网站页面有超链接指向它,那么它是无法被搜索引擎的爬虫发现的。
公开
同步至部落
取消
完成
0/2000
荧光笔
直线
曲线
笔记
复制
AI
- 深入了解
- 翻译
- 解释
- 总结
搜索引擎优化(SEO)是提高网站在搜索引擎结果中排名的关键技术。本文从搜索引擎工作原理出发,介绍了爬取、索引建立和结果返回的步骤,以及PageRank算法的重要性。此外,还探讨了站内外优化、roberts.txt文件配置、网站地图的重要性和Google Analytics的使用原理。这些内容为读者提供了全面的SEO知识概览。对于想要了解搜索引擎工作原理和SEO技术的读者来说,本文是一篇很有价值的文章。 SEO技术的实现需要站内外优化、roberts.txt文件的配置、网站地图的重要性以及统计分析工具的使用,这些内容为读者提供了全面的SEO知识概览。同时,文章还提到了一些扩展阅读建议,包括SEO黑帽法、Google Analytics官方资料以及PageRank算法的学习材料,为读者拓展了更多相关知识的学习途径。
仅可试看部分内容,如需阅读全部内容,请付费购买文章所属专栏
《全栈工程师修炼指南》,新⼈⾸单¥59
《全栈工程师修炼指南》,新⼈⾸单¥59
立即购买
© 版权归极客邦科技所有,未经许可不得传播售卖。 页面已增加防盗追踪,如有侵权极客邦将依法追究其法律责任。
登录 后留言
全部留言(6)
- 最新
- 精选
- 💢 星星💢老师你好,关于反爬虫,除了使用roberts.tx文件以及网站、页面和链接这样的软性规定。还有什么有效手段么?怎么识别它是爬虫呢?
作者回复: 识别爬虫,就是要识别出爬虫访问和人访问的不同。 比方说,可以设置一个token,如果爬虫访问,这个token无法被准确和顺利地生成,那么请求就可以屏蔽。 比方说,人访问的点击都是符合某些特征的,比如过高频率的点击,可以认为是爬虫所为。 一些大厂甚至会采用机器学习的方法来识别爬虫,以提高识别率和准确率。
2020-03-312 - Long老师你好,请问 在白帽子做法中的,网页在站点访问的深度,这句话是什么意思, 可以理解为网站本身的构造有多深吗?
作者回复: 这里的深度,指的是从首页开始,最短通过几次跳转(超链接)可以到达。
2019-12-14 - 四喜像淘宝京东等电商网站,都不能容许流量池子被别人撕开口子。搜索只能在站内,竞价排名也只能在自家站内买。 那么除了搜索引擎的爬虫本身主动被动的遵守robots.txt,是不是电商网站也绞尽脑汁做了各种反爬虫的手段呢?
作者回复: 对的。据我所知,电商网站也确实是做了各种反爬虫的手段的,特别是竞争对手的爬虫。(我以前在 Amazon 工作,所以知道)
2019-11-27 - 許敲敲老师你好,我想了解下,我自己在github上搭建一些静态博客,使用google analytic就可以分析我网站的一些被浏览信息是嘛? 不知道配置这个麻烦吗,今天下班去翻个墙研究下。
作者回复: 对你说的这几个组合起来,我没有尝试过,但是技术上看,配置 Google Analytics 应该是非常简单的,一小段脚本就可以了。
2019-11-224 - Geek_74d3ac老师不进一步不讨论一下单页应用的seo 问题,以及实际上的竞价排行问题 和让 seo 或者搜索引擎本身逐渐失去意义的移动应用生态圈封闭问题么?2020-09-16
- 丁丁历险记百度已成为了一家广告公司。2019-11-28
收起评论