对于 1 亿个字符串(10~30 字符长度) 求一个算法尽量均匀映射到 128 个哈希桶
資深大佬 : therethere9 5
字符串是数据库的主键,考虑到数据量比较大,想根据字符串的哈希值建立对应的 128 个表,这样每个表只需要存储 1 百万条记录。
请教有比较好的类似哈希函数吗?主要考虑因为哈希函数调用量非常频繁,挑选的哈希函数运算开销尽量要小,哈希映射的均匀分布质量的话,其实只要差不多就行了(不需要达到完全均匀分布,各个映射到的桶之间差 30%以内都可以接受) 语言目前为 python
请教有比较好的类似哈希函数吗?主要考虑因为哈希函数调用量非常频繁,挑选的哈希函数运算开销尽量要小,哈希映射的均匀分布质量的话,其实只要差不多就行了(不需要达到完全均匀分布,各个映射到的桶之间差 30%以内都可以接受) 语言目前为 python
大佬有話說 (3)