倒排索引压缩

时间:2017-04-12 11:03:21   收藏:0   阅读:183

索引压缩的作用

  1. 提高磁盘利用率
  2. 提高内存缓存利用率
  3. 提高磁盘到内存的传输率

词典压缩

  1. 将词典看成单一字符串,每个词结尾处保存指向下一个词的指针。
  2. 按块存储
  3. 前端编码(公共前缀)
  4. 完美哈希(无法动态更新)

 

 

倒排记录表压缩

  1. Delta编码
  2. 可变字节码
  3. 基于位编码(γ编码)

参考资料:《信息检索导论》-- 第五章

原文:http://www.cnblogs.com/sheeva/p/6698114.html

评论(0
© 2014 bubuko.com 版权所有 - 联系我们:wmxa8@hotmail.com
打开技术之扣,分享程序人生!