Log-2010-03-15[Bloom]
1、最近Cassandra比较热,看了几篇文章。
Cassandra存储机制
看了里面的一个Key来hash的算法,想起来以前面试的一个题目,垃圾邮件的存储和判断,原来用到的就是 Bloom Filter,所以也看了一下 概念和原理。如果允许一定错误率发生的话,可以采用这样的算法。只有把好人误判成坏人的情况,不会出现坏人的误判,除非坏人就不在存储库里。

2、哈希表的存储效率一般只有 50%
3、信息指纹及应用
Archive for March 2010
1、最近Cassandra比较热,看了几篇文章。
Cassandra存储机制
看了里面的一个Key来hash的算法,想起来以前面试的一个题目,垃圾邮件的存储和判断,原来用到的就是 Bloom Filter,所以也看了一下 概念和原理。如果允许一定错误率发生的话,可以采用这样的算法。只有把好人误判成坏人的情况,不会出现坏人的误判,除非坏人就不在存储库里。

2、哈希表的存储效率一般只有 50%
3、信息指纹及应用
1、今天加班,早上1点多不到到了公司,觉得杭州支持的三个同事更像一个团队,我们现在还缺少干劲,当然原因很多,需要像杭州的同事学习。
2、重新搞了一下linux环境,arch配置起来还是比较复杂,暂时没有特别的需求,还是在Ubuntu下混着好了。
3、学些Samson的Update,至少不让Blog空着。
4、反思了一下自己的一些问题,进度控制,风险控制,及时沟通等都需要努力,目前仅仅专注在系统层面,关注代码质量
1、重新登录了Blog
2、升级了以下WordPress
3、Akismet Stats 的API key申请了下,看什么效果
4、最近每周六天时间上班