跳至主要內容
  • Hostloc 空間訪問刷分
  • 售賣場
  • 廣告位
  • 賣站?

4563博客

全新的繁體中文 WordPress 網站
  • 首頁
  • 用深度学习来识别二维码,应该挺简单吧?
未分類
3 10 月 2020

用深度学习来识别二维码,应该挺简单吧?

用深度学习来识别二维码,应该挺简单吧?

資深大佬 : sillydaddy 0

训练素材基本不是问题,对着一个二维码,从各个角度和光照下都录一段视频,每帧图像都可以作为训练数据。

另外,二维码的特性也非常适于深度学习来解决:边角的特征、图像单元的特征。并没有比识别猫、狗复杂。

我试过 zxing/zbar 这些程序,检测正确率没有微信、支付宝这些商业软件高。

不用 AI 是移动端运算效率的问题吗?

网上搜索发现了一个用云端 AI 检测的: “人工智能二维码识别” ( https://yq.aliyun.com/articles/710415 )

大佬有話說 (9)

  • 資深大佬 : Ricardoo

    二维码这种标准格式的根本没必要上深度学习。深度学习是提取图像特征,但是二维码本身的格式规范就是一种有效的“特征”,绕远路放弃这种特征反而去搞深度学习不是本末倒置吗?至于你说的阿里云上的“人工智能二维码识别”可能仅仅是加上了一个图像变换

  • 資深大佬 : BrettD

    二维码本来就有清晰定义的识别方法,用深度学习识别二维码不是舍近求远吗?

  • 資深大佬 : dingwen07

    二维码机器学习可能只能帮着在图像中正确找到二维码的定位点
    从二维码中读取信息不应该用机器学习,二维码本身就是设计为方便机器读取的,和猫狗有着本质上的区别,没必要用机器学习。

  • 資深大佬 : kop1989

    lz 的表达可能有说的有点偏。我揣测 lz 是想说通过 ai 来进行二维码图片自纠,或者叫识别效率的提升。并不是做识别解析本身。

    机器学习是用来找复杂事务的规律的。
    换句话说,是通过迭代验证来建立人脑无法抽象建立的复杂规则模型。

    二维码 QR 标准本身就是一个非常准确的量化模型,不需要学习。
    lz 发出来的这个其实他的 ai 就是用在了图片的自纠上。

    不过这个产品未必用的是机器学习这条路。因为 QR 码本身足够稳定,人工来优化应该就能得到很好的效果。“大数据”,“人工智能”没准只是销售词汇。

  • 資深大佬 : imn1

    学习什么?用途?目的?

    是分析照片中有没有二维码,还是分析二维码的类别?

  • 主 資深大佬 : sillydaddy

    @Ricardoo
    @BrettD
    @dingwen07
    @kop1989

    二维码的定义是非常清晰,然后它的定位点也是非常适合算法识别:“只要扫描图形的一行像素,发现黑白像素的数目比例符合 1:1:3”就找到二维码角点了,图像旋转、稍微倾斜都不影响这一点。

    但有个现实的问题就是:zxing/zbar 这些算法,利用上面的算法,还是不能达到很好的识别效果,不够智能。比如有光影的变化,黑白的失真,比如像我发的链接里面有大的倾斜,比如二维码占据的图像部分或大或小。

    总之是 zxing/zbar 这些不够智能。这里的智能的标准就是:只要一张二维码图像,用人肉眼可以识别出来(一个个地数黑白格子),那么机器就应该识别出来。

  • 資深大佬 : charten

    当初微信为了小程序,专门搞了一个二维码的变种“小程序码”,但是基本的图形特征还是有的。这说明了一些公司对于二维码个性化还是有追求的,而且对于目前二维码的特征样式有所不满。与其去识别目前的二维码,不如思考一下,设计一个弱特征点的二维码,最好是相对美观而且更容易契合宣传物料的,然后训练 AI 识别出来。人眼可以一下子识别出来,但是对于计算机视觉比较困难,这个不正式 AI 的一个优势之处么?

  • 資深大佬 : futou

    二维码是一个完善的编解码系统,由信息到二维码再到信息的编码和解码是唯一的,同时考虑到拍摄条件的鲁棒性。深度学习可能也就在鲁棒性这个地方有一丢丢用武之地了。
    前几年还有人研究美观问题,是怎样将目标图片和二维码混到一起而不影响信息读取的问题,比如 “2015_TMM_Efficient QR code beautification xxx”。这几年很多自定标准的二维码出来后研究的就少了。

  • 資深大佬 : superlc

    非要做的话,应该是用 DL 的方法做降噪 /提取 /锐化 /超像素,然后再用传统方法识别,相当于预处理。实际上这部分已经存在在很多手机的摄像头驱动里了

    DL 的本质是拟合高维函数,在原编解码方式已知的情况下去拟合,是我拟我自己,相当于放着开源代码不看去做逆向工程,没意义的

    至于为什么不做专门的二维码降噪,我在生活中的体验是现在微信的二维码扫描已经基本无敌了,几乎很少有肉眼能看清但是扫不出来的情况存在。更何况糊到一定程度信息就丢失了,别说 ai 了怕是神仙也难救。花大价钱解决很少的几个 case,估计不怎么能回本

文章導覽

上一篇文章
下一篇文章

AD

其他操作

  • 登入
  • 訂閱網站內容的資訊提供
  • 訂閱留言的資訊提供
  • WordPress.org 台灣繁體中文

51la

4563博客

全新的繁體中文 WordPress 網站
返回頂端
本站採用 WordPress 建置 | 佈景主題採用 GretaThemes 所設計的 Memory
4563博客
  • Hostloc 空間訪問刷分
  • 售賣場
  • 廣告位
  • 賣站?
在這裡新增小工具