倒排索引压缩
时间:2017-04-12 11:03:21
收藏:0
阅读:183
索引压缩的作用
- 提高磁盘利用率
- 提高内存缓存利用率
- 提高磁盘到内存的传输率
词典压缩
- 将词典看成单一字符串,每个词结尾处保存指向下一个词的指针。
- 按块存储
- 前端编码(公共前缀)
- 完美哈希(无法动态更新)
倒排记录表压缩
- Delta编码
- 可变字节码
- 基于位编码(γ编码)
参考资料:《信息检索导论》-- 第五章
原文:http://www.cnblogs.com/sheeva/p/6698114.html
评论(0)