开篇词 | 学会检索,快人一步!
该思维导图由 AI 生成,仅供参考
为什么要学习检索技术?
为什么检索技术难学?
专栏是如何设计的?
- 深入了解
- 翻译
- 解释
- 总结
陈东,北京大学本硕毕业,现任奇虎360商业产品事业部资深总监,分享了他多年从事检索技术的经验。他介绍了检索技术的广泛应用,不仅限于搜索引擎和数据库,而是涉及到海量信息快速筛选的通用技术。文章指出,掌握检索技术对于提升程序执行效率、应对信息爆炸时代的挑战至关重要。为解决学习检索技术的难题,陈东精心准备了《检索技术核心20讲》专栏,旨在帮助读者快速系统地掌握这门实用的知识。 该专栏的设计目标包括聚焦核心知识、注重实用性、破除“高门槛”,帮助读者全面了解检索技术、解决实际工作中的问题,并提高学习效率。专栏内容分为基础技术篇、进阶实战篇和系统案例篇,涵盖了数据结构、算法、实际应用案例和行业分析等内容,旨在帮助读者建立自己的检索知识体系。 陈东鼓励读者积极参与,无论是对检索技术一窍不通的新人还是有多年经验的高级工程师,都可以在专栏中学习、分享和探讨。通过学习该专栏,读者不仅能够掌握基础的数据结构和算法,还能深入理解和应用在存储系统、搜索引擎、广告系统和推荐系统等热门架构中的高效设计思想和技术处理方式。 总之,该专栏旨在帮助读者从理解检索技术到应用解决实际问题,并深入理解其原理和设计思想,为读者提供了一个系统、实用的学习平台。
2020-03-2318人觉得很赞给文章提建议
《检索技术核心 20 讲》,新⼈⾸单¥59
全部留言(31)
- 最新
- 精选
- 零下一度如何搭建公司的搜索引擎系统,希望做到业务数据不受到搜索引擎服务的影响,同时搜索引擎能比较实时提供查询统计功能。
作者回复: 这个具体要看你们的“实时查询统计”的需求到底是怎么样的。如果是简单的一些固定统计,那么elastic search就可以提供;但如果是偏OLAP的灵活分析查询需求,那其实Druid和clickhouse是更合适的选择。 ps:Druid和clickhouse都是基于lsm树实现的。lsm树在进阶实战篇和系统案例篇中我都会介绍。
2020-03-24314 - 吉米检索就像大脑的提取,我们锻炼大脑的提取速度,也要学习计算机检索的相关知识
作者回复: 是的!人的大脑处理数据,其实也是信息提取过程。在第五课中,你就会发现,给你一首古诗的题目,你可以快速背出这首诗;但问你有哪些古诗中包含“极”和“客”字,大脑就很难处理。这其实就会对应到正排索引和倒排索引的检索技术。
2020-03-2314 - fomy我理解的检索就是普通的查询,从海量数据中查询自己想要的内容。 我希望从专栏中学到为什么?比如es是怎么做到高效查询的。还有就是为什么用?为什么文本搜索使用es呢?在哪些场景下应该使用什么技术做优化?
作者回复: 这个专栏会让你明白es的底层检索技术是怎么样的,在有了这些知识以后,无论是对es进行优化,还是在其他场景使用更合适的技术,你就会更有把握。
2020-04-0926 - 不记年数据检索是几乎所有业务系统中使用频率最高的部分,其性能与准确度深刻的影响着业务系统的发展,对检索系统的设计是贯穿前后端的系统性工程
作者回复: 是的。任何系统基本都要支持“增删查改”。其中“查”就是数据检索。
2020-03-232 - Arnold我理解的搜索: 从倒排经过一系列的条件找到ID的过程。
作者回复: 倒排是检索的一种方法。但对于不同的场景,我们会有更多的检索技术支持,而不仅仅是倒排。
2021-07-121 - 蚂蚁码代码检索这方面是小白,希望跟着老师,好好补补这个空缺
作者回复: 欢迎开始学习。整个专栏会按由浅到深的方式进行展开。有觉得说得不明白的地方可以留言提问,希望能让你有所收获。
2020-11-05 - mickey检索,即利用有限的空间,在一定的时间内,准确的找到需要查找的信息。
作者回复: 这个总结不错。检索是需要在时间和空间进行权衡,根据业务需要采用合适的技术实现。不过有意思的一点是,检索结果不一定是100%精准的,这其实也和检索目标和检索代价有关系。在专栏中后面会进行介绍。
2020-06-19 - chqlb好奇 IBM 的故事,你是怎么解决问题了?核心的难点和解决方案是怎么样的?😄
作者回复: 如果你往后面学习的话,你会发现,地理位置检索,图片检索和相似用户推荐其实从某种角度来说是一样的,都是n维空间的近似点的检索问题。掌握了这个核心,就可以结合项目需求,使用合适的相关技术来实现。这些方法在进阶篇和系统篇中都有介绍。
2020-06-09 - 阿斯蒂芬老师讲的「从知道“检索技术是什么”,到学会“利用检索技术解决实际问题”,并且更深入理解“为什么这么用”。」符合学习步骤「是什么、怎么用、为什么 」灵魂三部曲,赞~ 老师还讲「只要你熟悉数组和链表,知道怎么评估时间代价,你就可以学习这个专栏」。恰好温习了下数据结构,flag立起来,打卡敦促自己跟上这门「检索」课程,keep fighting
作者回复: 加油!可以多看看讨论区和我的部落动态,里面也有一些知识补充。
2020-04-08 - jesse想咨询下 我用es7 做检索 比如有mysql 的测站数据 测站相关属性数据(根据测站类型不同 属性字段不同) 测站相关监测数据(根据测站类型不同监测数据字段也不同)。如何建立数据模型,建完模型有的能根据logtash 直接通过sql语句导入,有的没法导入 如何导入到es中呢,是不是要手动编码从mysql 写入到es中
作者回复: 自己动手写代码和脚本导入肯定更灵活。 不过logstash已经是常见工具了,一般来说可以根据错误提示排查问题解决的。常见问题往往都是字段定义冲突这类问题,你可以看一下提示,然后检查一下你们数据库的字段设计,看看能否统一处理?
2020-03-302