“搜索”的原理，架构，实现，实践，面试不用再怕了（值得收藏）！！！

发布时间：2019-04-01 15:13:23 所属栏目：建站来源：58沈剑

导读：可能99%的同学不做搜索引擎，但99%的同学一定实现过检索功能。搜索，检索，这里面到底包含哪些技术的东西，希望本文能够给大家一些启示。全网搜索引擎架构与流程如何? 全网搜索引擎的宏观架构如上图，核心子系统主要分为三部分(粉色部分)： (1)spider爬虫

当有查询请求发生时，会同时查询各个级别的索引，将结果合并，得到最新的数据：

分级索引能够保证实时性，那么，新的问题来了，小时库数据何时反映到天库中，天库中的数据何时反映到全量库中呢?

dump&merge，索引的导出与合并，由这两个异步的工具完成：

小时库，一小时一次，合并到天库中去;

天库，一天一次，合并到全量库中去;

这样就保证了小时库和天库的数据量都不会特别大;

如果数据量和并发量更大，还能增加星期库，月库来缓冲。

简单小结一下：

超大数据量，超高并发量，实时搜索引擎的两个架构要点：

关于“搜索”与“检索”，GET到新技能了吗?

【本文为51CTO专栏作者“58沈剑”原创稿件，转载请联系原作者】

戳这里，看该作者更多好文

【编辑推荐】

【责任编辑：赵宁宁 TEL：（010）68476606】
点赞 0

（编辑：核心网）

【声明】本站内容均来自网络，其相关言论仅代表作者个人观点，不代表本站立场。若无意侵犯到您的权利，请及时与联系站长删除相关内容!

杭州网站优化的几个注	网站优化效果不好怎么
网站结构怎么优化？对	网站文章内容持续更新