跳至主要內容
  • Hostloc 空間訪問刷分
  • 售賣場
  • 廣告位
  • 賣站?

4563博客

全新的繁體中文 WordPress 網站
  • 首頁
  • 可以不进行 onehot 吗?
未分類
26 11 月 2020

可以不进行 onehot 吗?

可以不进行 onehot 吗?

資深大佬 : galileo1214 0

如果特征种类过多,或者是数量级的,可以不 onehot 吗,还是需要分类
如果大多数都是数量级的,是否可以直接扔进模型呢,还是要做个标准化
大佬有話說 (7)

  • 資深大佬 : cclin

    举个例子,你用 l2 距离,北京是 0,上海是 1,广州是 2,不做 onehot 意味着在这个维度广州和北京距离是广州到上海的二倍,然而实际上他们的距离应该相同

  • 主 資深大佬 : galileo1214

    @cclin 类型过多会离散化

  • 資深大佬 : levylll

    图省事儿可以做特征 hash,压缩特征到同一个 hash 空间

  • 資深大佬 : Escapist367

    有的模型不需要 one-hot

  • 資深大佬 : TimePPT

    one-hot encoding 不是万能的,这些分类变量编码方法你值得拥有
    https://www.jiqizhixin.com/articles/2020-09-16-6

    机器学习中的特征工程总结!
    https://mp.weixin.qq.com/s/RgSejEbxwhnFUKR2POmqmg

    一文讲解特征工程!经典外文 PPT 及中文解析
    https://mp.weixin.qq.com/s/GWMZ1jwbchE8O0r6EduYtQ

  • 主 資深大佬 : galileo1214

    @TimePPT #5 谢谢

  • 資深大佬 : TimePPT

    @galileo1214 客气
    俗话说得好
    特征做得好,模型差不了

文章導覽

上一篇文章
下一篇文章

AD

其他操作

  • 登入
  • 訂閱網站內容的資訊提供
  • 訂閱留言的資訊提供
  • WordPress.org 台灣繁體中文

51la

4563博客

全新的繁體中文 WordPress 網站
返回頂端
本站採用 WordPress 建置 | 佈景主題採用 GretaThemes 所設計的 Memory
4563博客
  • Hostloc 空間訪問刷分
  • 售賣場
  • 廣告位
  • 賣站?
在這裡新增小工具