企业🤖AI智能体构建引擎,智能编排和调试,一键部署,支持知识库和私有化部署方案 广告
## 问题 现在有50亿个电话号码,现有10W个电话号码,要快速准确判断这些电话号码是否存在? 1. 通过数据库查询:实现快速有点难; 2. 数据预放在集合中:50亿 * 8字节 ==40GB(内存浪费或不够); 3. hyperloglog:准确有点难; ## 相似的问题还有很多 1. 垃圾邮件过滤 2. 文字处理软件(例如Word)错误单词检测; 3. 网络爬虫重复URL检测; 4. Hbase行过滤;