请教一个关键词检测问题.
某些用户会关注一些关键字 如:西瓜 牛奶 香蕉 等,大概如下结构:
{'key_1':[u1,u2,u3,u4]} {'key_2':[u4]} {'key_3':[u2,u3,u4]}
恩,其实就是一个 key 对应多个用户.
如果以用户角度来看,其实就是:
{u1:[key_1]} {u2:[key_1,key_3]} ....
现在有大量文本需要检测是否包含上面所有的 key.如果包含 就取到对应的 key 与 id[ux] 这种数据应该怎么存储比较合适呢并检索? 如果有可用的工具 最好越轻越好.. key 大概 2w-5w 备注:文本大概 100 字以内