1、主要内容: ①、与索引构建相关的计算机硬件的基本知识; ②、面向静态文档记得高效单击索引算法---基于块的排序索引构建算法; ③、内存是单遍扫描索引构建算法; ④、
1、主要内容:对查询中存在拼写错误或存在不同拼写形式具有鲁棒性的拼写矫正技术 ①、支持词典快速查找的多个数据结构; ②、通配符查询; ③、拼写上存在错误的查询,自动校正技术(针
1、主要内容: 信息检索系统中两个重要的数据结构:词项词典和全体倒排记录表,为了构建高效的IR系统,需要对这两个数据结构进行压缩。进行压缩有两个隐含的优点:①、能增加高速缓存(cache)技术的