SpringBoot + Redis实现布隆过滤器
创始人
2024-05-21 10:57:40
0

一、简述

关于布隆过滤器的详细介绍,我在这里就不再赘述一遍了

我们首先知道:BloomFilter使用长度为m bit的字节数组,使用k个hash函数,增加一个元素: 通过k次hash将元素映射到字节数组中k个位置中,并设置对应位置的字节为1。查询元素是否存在: 将元素k次hash得到k个位置,如果对应k个位置的bit是1则认为存在,反之则认为不存在。

Guava 中已经有具体的实现,而在我们实际生产环境中,本地的存储往往无法满足我们实际的 需求。所以在这时候,就需要我们使用 redis 了。

二、Redis 安装 Bloom Filter

git clone https://github.com/RedisLabsModules/redisbloom.git
cd redisbloom
make # 编译vi redis.conf
## 增加配置
loadmodule /usr/local/web/redis/RedisBloom-1.1.1/rebloom.so##redis 重启
#关闭
./redis-cli -h 127.0.0.1 -p 6379 shutdown
#启动
./redis-server ../redis.conf &

三、基本指令

#创建布隆过滤器,并设置一个期望的错误率和初始大小
bf.reserve userid 0.01 100000
#往过滤器中添加元素
bf.add userid 'sbc@163.com'
#判断指定key的value是否在bloomfilter里存在,存在:返回1,不存在:返回0
bf.exists userid 'sbc@163.com'

四、结合 SpingBoot

搭建一个简单的 springboot 框架

1、方式一:使用Redisson

配置maven


4.0.0com.bloomtest-bloomfilter1.0-SNAPSHOTorg.springframework.bootspring-boot-starter-parent1.5.8.RELEASE org.springframework.bootspring-boot-starterorg.apache.commonscommons-lang33.0.1

redis本身对布隆过滤器就有一个很好地实现,在 java 端,我们直接导入 redisson 的 jar包即可

org.redissonredisson3.8.2

将 Redisson实例 注入 SpringIOC 容器中

@Configuration
public class RedissonConfig {@Value("${redisson.redis.address}")private String address;@Value("${redisson.redis.password}")private String password;@Beanpublic Config redissionConfig() {Config config = new Config();SingleServerConfig singleServerConfig = config.useSingleServer();singleServerConfig.setAddress(address);if (StringUtils.isNotEmpty(password)) {singleServerConfig.setPassword(password);}return config;}@Beanpublic RedissonClient redissonClient() {return Redisson.create(redissionConfig());}
}

配置yml文件

redisson.redis.address=redis://127.0.0.1:6379
redisson.redis.password=

最后测试我们的布隆过滤器

@SpringBootApplication
public class BloomApplication {public static void main(String[] args) {ConfigurableApplicationContext context = SpringApplication.run(BloomApplication.class, args);RedissonClient redisson = context.getBean(RedissonClient.class);RBloomFilter bf = redisson.getBloomFilter("test-bloom-filter");bf.tryInit(100000L, 0.03);Set set = new HashSet(1000);List list = new ArrayList(1000);//向布隆过滤器中填充数据,为了测试真实,我们记录了 1000 个 uuid,另外 9000个作为干扰数据for (int i = 0; i < 10000; i++) {String uuid = UUID.randomUUID().toString();if(i<1000){set.add(uuid);list.add(uuid);}bf.add(uuid);}int wrong = 0; // 布隆过滤器误判的次数int right = 0;// 布隆过滤器正确次数for (int i = 0; i < 10000; i++) {String str = i % 10 == 0 ? list.get(i / 10) : UUID.randomUUID().toString();if (bf.contains(str)) {if (set.contains(str)) {right++;} else {wrong++;}}}//right 为1000System.out.println("right:" + right);//因为误差率为3%,所以一万条数据wrong的值在30左右System.out.println("wrong:" + wrong);//过滤器剩余空间大小System.out.println(bf.count());}
}

以上使我们使用 redisson 的使用方式,下面介绍一种比较原始的方式,使用lua脚本的方式

2、方式二:使用lua脚本

bf_add.lua

local bloomName = KEYS[1]
local value = KEYS[2]
local result = redis.call('BF.ADD',bloomName,value)
return result

bf_exist.lua

local bloomName = KEYS[1]
local value = KEYS[2]local result = redis.call('BF.EXISTS',bloomName,value)
return result
@Service
public class RedisBloomFilterService {@Autowiredprivate RedisTemplate redisTemplate;//我们依旧用刚刚的那个过滤器public static final String BLOOMFILTER_NAME = "test-bloom-filter";/*** 向布隆过滤器添加元素* @param str* @return*/public Boolean bloomAdd(String str) {DefaultRedisScript LuaScript = new DefaultRedisScript();LuaScript.setScriptSource(new ResourceScriptSource(new ClassPathResource("bf_add.lua")));LuaScript.setResultType(Boolean.class);//封装传递脚本参数List params = new ArrayList();params.add(BLOOMFILTER_NAME);params.add(str);return (Boolean) redisTemplate.execute(LuaScript, params);}/*** 检验元素是否可能存在于布隆过滤器中 * @param id * @return*/public Boolean bloomExist(String str) {DefaultRedisScript LuaScript = new DefaultRedisScript();LuaScript.setScriptSource(new ResourceScriptSource(new ClassPathResource("bf_exist.lua")));LuaScript.setResultType(Boolean.class);//封装传递脚本参数ArrayList params = new ArrayList();params.add(BLOOMFILTER_NAME);params.add(String.valueOf(str));return (Boolean) redisTemplate.execute(LuaScript, params);}
}

最后我们还是用上面的启动器执行测试代码

@SpringBootApplication
public class BloomApplication {public static void main(String[] args) {ConfigurableApplicationContext context = SpringApplication.run(BloomApplication.class, args);RedisBloomFilterService filterService = context.getBean(RedisBloomFilterService.class);Set set = new HashSet(1000);List list = new ArrayList(1000);//向布隆过滤器中填充数据,为了测试真实,我们记录了 1000 个 uuid,另外 9000个作为干扰数据for (int i = 0; i < 10000; i++) {String uuid = UUID.randomUUID().toString();if (i < 1000) {set.add(uuid);list.add(uuid);}filterService.bloomAdd(uuid);}int wrong = 0; // 布隆过滤器误判的次数int right = 0;// 布隆过滤器正确次数for (int i = 0; i < 10000; i++) {String str = i % 10 == 0 ? list.get(i / 10) : UUID.randomUUID().toString();if (filterService.bloomExist(str)) {if (set.contains(str)) {right++;} else {wrong++;}}}//right 为1000System.out.println("right:" + right);//因为误差率为3%,所以一万条数据wrong的值在30左右System.out.println("wrong:" + wrong);}
}

3、总结

相比而言,个人比较推荐第一种,实现的原理都是差不多,redis 官方已经为我封装好了执行脚本,和相关 api,用官方的会更好一点

相关内容

热门资讯

喜欢穿一身黑的男生性格(喜欢穿... 今天百科达人给各位分享喜欢穿一身黑的男生性格的知识,其中也会对喜欢穿一身黑衣服的男人人好相处吗进行解...
发春是什么意思(思春和发春是什... 本篇文章极速百科给大家谈谈发春是什么意思,以及思春和发春是什么意思对应的知识点,希望对各位有所帮助,...
网络用语zl是什么意思(zl是... 今天给各位分享网络用语zl是什么意思的知识,其中也会对zl是啥意思是什么网络用语进行解释,如果能碰巧...
为什么酷狗音乐自己唱的歌不能下... 本篇文章极速百科小编给大家谈谈为什么酷狗音乐自己唱的歌不能下载到本地?,以及为什么酷狗下载的歌曲不是...
华为下载未安装的文件去哪找(华... 今天百科达人给各位分享华为下载未安装的文件去哪找的知识,其中也会对华为下载未安装的文件去哪找到进行解...
怎么往应用助手里添加应用(应用... 今天百科达人给各位分享怎么往应用助手里添加应用的知识,其中也会对应用助手怎么添加微信进行解释,如果能...
家里可以做假山养金鱼吗(假山能... 今天百科达人给各位分享家里可以做假山养金鱼吗的知识,其中也会对假山能放鱼缸里吗进行解释,如果能碰巧解...
四分五裂是什么生肖什么动物(四... 本篇文章极速百科小编给大家谈谈四分五裂是什么生肖什么动物,以及四分五裂打一生肖是什么对应的知识点,希...
一帆风顺二龙腾飞三阳开泰祝福语... 本篇文章极速百科给大家谈谈一帆风顺二龙腾飞三阳开泰祝福语,以及一帆风顺二龙腾飞三阳开泰祝福语结婚对应...
美团联名卡审核成功待激活(美团... 今天百科达人给各位分享美团联名卡审核成功待激活的知识,其中也会对美团联名卡审核未通过进行解释,如果能...