跳至主要內容
  • Hostloc 空間訪問刷分
  • 售賣場
  • 廣告位
  • 賣站?

4563博客

全新的繁體中文 WordPress 網站
  • 首頁
  • 如何工程化计算搜索准确率和召回率?
未分類
12 2 月 2021

如何工程化计算搜索准确率和召回率?

如何工程化计算搜索准确率和召回率?

資深大佬 : yongzhong 3

最近在调研工程化计算搜索准召率相关的东西,无奈相关资料太少,目前只了解到人工标记以及 A/B test 的方式

网上搜了一番后知道阿里有个搜索问题排查平台,但不知道具体是什么样的功能和实现

有了解这方面的大佬指点一下吗

大佬有話說 (10)

  • 資深大佬 : jdhao

    什么叫“工程化计算准召率”?和通常定义的准召率有区别?

  • 主 資深大佬 : yongzhong

    @jdhao #1 自动化,平台化,少人工介入的

  • 資深大佬 : jdhao

    没有人工,ground truth 不好判断

  • 主 資深大佬 : yongzhong

    @jdhao 大佬一般用什么方法?

  • 資深大佬 : jdhao

    @yongzhong 没搞过自动化的,一般是抽样标注。然后再测试。

  • 資深大佬 : p2pCoder

    核心是把日志串起来
    在线的话直接把召回结果落盘,看覆盖和分布,然后召回结果与最终点击曝光的正负样本进行 join,进行分析

  • 資深大佬 : movistar

    抽样加人工标注
    不过这样也就是评估一下准确率,召回率不好评估。
    在非给定集合内(用户生成的自然结果)去评估召回率,这个暂时没有什么好的评估方式。
    一般论文的准召率都是在给定候选集下评估出来的,什么 query 应该有什么结果是固定的,直接 diff 一下就知道效果。

  • 資深大佬 : czfy

    理论上人工是无法完全排除的,只能转移,例如从供给方转移到使用方
    例如在搜索结果之后给个量表,让用户从 1 分到 5 分评价本次搜索结果的质量,当然不保证回收率

  • 資深大佬 : LukeChien

    https://www.douban.com/note/727142741/,我们现在用 SBS 和 DCG 为主

  • 資深大佬 : TimePPT

    准召评测离不开人的,如果假定一段时间 Query 需求分布变化不大,可以只用一个高质量验证集打下效果就行。

文章導覽

上一篇文章
下一篇文章

AD

其他操作

  • 登入
  • 訂閱網站內容的資訊提供
  • 訂閱留言的資訊提供
  • WordPress.org 台灣繁體中文

51la

4563博客

全新的繁體中文 WordPress 網站
返回頂端
本站採用 WordPress 建置 | 佈景主題採用 GretaThemes 所設計的 Memory
4563博客
  • Hostloc 空間訪問刷分
  • 售賣場
  • 廣告位
  • 賣站?
在這裡新增小工具