针对中文无监督文本切分的优质路子有哪些?
資深大佬 : CodeAsPoetry 15
具体案例是:“《步步惊心》改编自著名作家桐华的同名清穿小说《甄嬛传》改编自流潋紫所著的同名小说电视剧《何以笙箫默》改编自顾漫同名小说《花千骨》改编自 fresh 果果同名小说《裸婚时代》是月影兰析创作的一部情感小说《琅琊榜》是根据海宴同名网络小说改编电视剧《宫锁心玉》,又名《宫》《雪豹》,该剧改编自网络小说《特战先驱》《我是特种兵》由红遍网络的小说《最后一颗子弹留给我》改编电视剧《来不及说我爱你》改编自匪我思存同名小说《来不及说我爱你》”这么长的一条样本进行实体关系抽取,我尼玛,不切分直接 gank,召回率低得无法直视。
大佬有話說 (0)