Log-2010-03-15[Bloom]

1、最近Cassandra比较热,看了几篇文章。
Cassandra存储机制

看了里面的一个Key来hash的算法,想起来以前面试的一个题目,垃圾邮件的存储和判断,原来用到的就是 Bloom Filter,所以也看了一下 概念和原理。如果允许一定错误率发生的话,可以采用这样的算法。只有把好人误判成坏人的情况,不会出现坏人的误判,除非坏人就不在存储库里。

2、哈希表的存储效率一般只有 50%

3、信息指纹及应用

发表评论

Get Adobe Flash playerPlugin by wpburn.com wordpress themes