人脸识别、语音助手、智能识图、AI美颜、智慧识屏、随行翻译……过去一年,手机行业搭载AI技术的新卖点层出不穷,究竟哪些才是最常使用的功能?哪些功能是徒增成本、并无实用的“花瓶”? 上一期南都记者实测了5款主流手机产品的语音助手功能,发现目前AI语音的应用仍处于早期阶段,唤醒、导航、连续对话等基础功能都尚待完善。视觉识别作为人工智能手机的第二大核心功能,在具体的应用场景中又会表现如何? 上期实测内容请戳:实测苹果、荣耀等五手机:除了拜年、讨红包,语音助手还能这么玩 人脸解锁刷脸技术从2D到3D 人脸解锁是密码锁、指纹解锁之后又一个主流解锁方式。今年发布的旗舰产品中使用人脸解锁功能的机型除了iPhoneXs系列还包括:vivo X21、三星S9+、小米8、vivo Z3、华为Mate 20Pro、OPPO Find X、魅族16th、荣耀V20等。 据了解,人脸解锁主要包括2D与3D两种技术方案,2D人脸识别是对于人脸的平面特征进行识别,目前应用较广,而3D Sensing人脸识别是基于立体深度的面部特征进行识别,主要有结构光、TOF和立体视觉三类,在安全性和识别率方面都优于2D方案。 其中,小米8、OPPO Find X、魅族16th是在搭载了屏下指纹解锁方案的同时,以2D人脸智能识别解锁功能作为辅助进行手机解锁,华为Mate 20Pro、iPhone XS和小米8透明探索版则利用3D结构光技术进行人脸解锁。 一句话点评:刷脸时代到来,AI能否斗得过整容医生? 图片识别苹果准确率最高,老虎和鸟难倒大多数 苹果、荣耀、vivo、OPPO均支持相册分类及搜索功能。南都记者在上述手机中导入包含动物、人像、花草、风景在内的100张图片,随后通过检索关键词,搜索出相应的图片,以此验证AI图像识别的准确率。 可以看出,iPhoneX的识别准确率最高,为87%,其中导入的较难识别的两张鸟和老虎均被准确识别了出来,但犯了一个明显的错误是将一张猫的图片识别成了人。 iPhoneX将一张猫的图片识别成了人 荣耀和OPPO是图像识别准确率为53.2%,在难度较高的老虎和鸟这两个分类中,荣耀准确识别出了2张老虎,OPPO只识别出了1张鸟;vivo的识别准确率为50%,难度系数最高的老虎和鸟均未能识别,但这三款机型没有出现误识别现象。 小米此次识别准确率最低,为32.38%,对老虎、鸟和花朵均未能成功识别,其中一张狗的图片被识别为人类。 一句话点评:生物老师看了想打人!达尔文知道了想原地复活! 智慧识物遇到动物简笔画全部蒙圈 除了苹果手机没有智慧识图功能外,小米、荣耀、vivo、OPPO等手机都有智慧识图功能,即识别物体属性的功能。对此,我们以“西瓜坐垫”和“可乐”为对象测试其识图能力。 首先在对瓶装可乐的识别上,“可乐”作为标准化规格制造的商品,以上手机都准确识别其属性。其中OPPO手机识别出可乐后会提供卡路里、营养元素的分析,而荣耀、小米、vivo则在识别出瓶装可乐后直接进入淘宝购物页面。 荣耀、小米、vivo在识别出瓶装可乐后直接进入淘宝购物页面。 在对“西瓜坐垫”进行识别的过程,荣耀和小米的识别最为准确。其中荣耀和小米进行扫描后准确识别为西瓜坐垫,并给出相对应的商品链接;而OPPO、vivo则是将其视为西瓜并显示相应的营养元素和卡路里等信息。 小米能准确识别西瓜坐垫,并给出相对应的商品链接。 此外,南都记者将上述实物图换成动物简笔画进行测试,结果发现没有一款手机能识别出简笔画上的动物种类,可见“识物”功能仍然很弱,只能根据合作方如淘宝的“拍立淘”、百度识图等提供的技术支持来实现。而对于识别错误或者无法识别的状况,没有一家手机厂商给用户提供反馈的入口,这意味着AI与用户之间的互动只停留在单项输出,AI的识别能力的优化也只能依靠上游厂商,用户无法参与。 无一台手机能识别出动物简笔画中的动物。 一句话点评: 知错无法改,AI孺子不可教也。 【旁白】 芯片、算法支撑AI应用从单功能向组合功能升级 事实上,支撑目前市场上各色AI应用落地的技术主要包括三种:计算机视觉、语音识别、自然语言理解,此外还有尚未成熟应用的机器学习。据清华大学数据显示,计算机视觉、语音识别、自然语言处理是中国市场规模最大的三个应用方向,占比分别为34.9%、24.8%、21%。 其中,计算机视觉(computer vision)是用计算机来模拟人的视觉机理获取和处理信息的能力,也是AI手机中人脸解锁、相册分类等功能得以实现的关键。 从人脸解锁、相册分类和智慧识图来看,计算机视觉技术的发展已经可以满足手机中的应用,其中智能手机的人脸解锁速度已经达到几百毫秒,误识率约万分之一甚至百万分之一,并支持活体检测。但在具体应用层面,如何找准用户的日常需求才是关键。 “AI应用的成熟度依赖于算法成熟度、场景数据丰富度以及计算资源的充裕程度。一方面近些年来视觉识别的算法成熟度不断提高;另一方面,无论是云端还是手机终端,提供给AI应用的计算资源显著并持续提升,给予了AI应用落地的客观条件”,AI创业公司商汤科技产品总监王子彬称,但目前的AI算法仍有不少提升空间,例如在平台能力上,目前只有少数计算平台配备了AI专用计算芯片;在未来,随着算法、数据以及算力的三重发展支撑,AI在手机上的应用还有更大发挥的空间。 据商汤科技联合艾瑞咨询发布的《2018年中国人工智能手机行业研究报告》,目前AI手机产业链上游由“硬基础”供应商(主要指AI芯片提供商)和“软基础”供应商(主要指AI算法提供商)组成。 自去年以来,华为、苹果和三星均已推出自研AI芯片:如苹果的iPhone X系列上已经应用的A11、A12仿生芯片、三星的Exynos系列芯片、华为则推出了麒麟970芯片,用于高端机型Mate 10 Pro等设备中。其他厂商则纷纷联合上游芯片进行深度定制合作,如今年的9月份,小米宣布将与阿里旗下的中天微进行芯片合作。vivo NEX则向楼氏定制了专用人工智能语音芯片提高Jovi性能。 但目前应用最为广泛的仍是高通的AI芯片,如小米、OPPO、vivo仍搭载高通的AI芯片。据悉,高通通过神经处理引擎NPE对其SoC中的CPU、GPU、DSP进行调度,意图打造均衡且适配广泛的AI解决办法。而苹果、联发科、三星和华为海思则研发独立的AI处理器模块,对AI应用进行加速。上述报告认为目前这两种芯片结构在使用效果上尚无明显差别。 在算法方面,据悉,目前苹果、三星使用软硬一体的整体解决方案来打造AI手机;另一种主流的AI手机研发方式是与商汤科技、科大讯飞等技术提供商展开深度合作,华为、小米、OPPO、vivo均采用这一方案。 “从目前整个AI手机行业来看,基于单一功能点的视觉AI产品初步得到了应用,目前行业在针对不同细分场景持续优化性能指标。可以预测,未来的AI应用将会是基于应用场景的多个功能点组合”,王子彬指出,以智能相册为例,简单的照片分类不能完全满足用户的体验需求,但可以通过把人脸识别、场景识别、图像增强、自动电影生成、自动AR特效等功能组合起来形成新的应用。
|