都在讨论 app 监听,那智能家居的监听是不是存在
那干监听这件事就收不回成本
用户画像不必搞得这么重
基本上用在手表,平板,耳机,小音箱,电梯呼叫系统等需要离线以及在线语音控制的场合。小爱同学这类音响,离线识别唤醒词,命令词基本上也是一样的做法,没有 asic 的时候,据说是 DSP 的方式,纯软件算法。。语义分析对话这种应该都是录音回传服务器,再传回来的做法。本地的话成本过于高了。
说的确实好像是那么一回事, 但几位开有发过相关的监控业务吗?
reddit 上有过亚马逊 echo 的员工专门说过, 没唤醒的情况下不会收集用户的声音.
我只是用户,我拒绝使用这些语音助手的原因:有一次去听语音助手上传的语音,真的是一言难尽,一些误触发的片段听起来很尬,也很怕。
如果有的话, 总是会有相关消息泄露的. (比如按照用户输入法行为去投放广告, 虽然搜狗不明说, 但很多人都知道
1. 如果全程录音,只要一有人说话就录音,上传到服务器分析。现在国内大厂的 app 至少几个亿的真实用户,每天上传多少流量?服务器需要分析多少 TB 的数据?
据那些信监听的人的反映,都是短时间内就出结果马上推广告,最慢的也是第二天就推广告,这么大的数据量这么快的分析速度,可能吗?
2. 假设在本地分析,手机跑 AI 还不发热可能吗?
3. 假设只设少量关键词来触发。据那些信监听的人的反映,都说很冷门的关键词,这不是很矛盾吗?事先设关键词,而且还设冷门关键词,动用到 24 小时监听几亿用户这么大规模的事情,就为了做那几个冷门的广告?
4. 如果监听去做流行产品的广告呢?这也很矛盾,因为流行的广告就无法证明有监听。
大概思路:本地识别->转化为文本->关键名词提取->上报关键字
手表,小音箱,智能耳机,智能 mic 这类产品大部分时间靠电池供电的,不可能用通用芯片,一直监听说话,分析关键字,功耗压不住,现在都是本地识别芯片,低功耗,uW 级别,VAD 监测,然后唤醒主芯片,匹配唤醒词,然后录音再上传服务器,靠云端解决更复杂的分析,如果有需求的话。
另外我们也给某米某为授权过语音类功能的芯片 IP 。