李根 发自 凹非寺 2019年第12周,全球AI领域有诸多新进展。 量子位筛选整理出过去一周Top 10,从技术新突破、政策新风向和产业新动态3大方面,为你提供最新趋势参考。 01 新突破 中国籍博士一作登Nature封面:仿生群体机器人问世,工程学重大突破 Nature最新封面:发布了一则重大工程学突破——仿生物细胞群体机器人。这个“粒子机器人”,具有超强的鲁棒性和更高的可扩展性,实现了光向导运动和躲避障碍物。该论文一作为哈佛大学任博士后研究员、中国青年科学家李曙光。李曙光本科毕业于西安的西北工业大学,获得机械与航空航天工程学士学位。 其主要突破性研究成果包括: - 该“粒子机器人”系统可以实现鲁棒的运动和物体移动,以及光导向运动和避障;
- 与已有的仿生机器人系统相比具有更高的可扩展性和鲁棒性;
- 证明了随机性为开发具有鲁棒的确定性行为大规模群体机器人系统提供了一种有希望的方法。
简评: 在不久的将来,展示这种群体机器人系统的潜在高影响工程和医学应用将是至关重要的,而使用其他技术是不可能实现的。 成群的随机细菌驱动的微机器人可以使用粒子机器人技术将药物运送到目标区域,到达人体内部难以到达的区域。 这些菌群可能受化学梯度、氧梯度或癌组织环境pH值变化的影响。事实上,许多研究已经表明,群体细菌驱动的微虫群在靶向药物递送、医学诊断和环境传感方面具有潜在的应用。 02 新突破用AI实现隔墙“透视”,准确率达97%,这家中国公司研究入选CVPR 试想一下,自动驾驶汽车行驶到了拐弯处,即使激光雷达再强大,也无法探测到建筑物后的有什么事情发生,如果是突然有行人冲出来,后果不堪设想。 其实用激光结合强大的AI算法,可以帮你看到墙后究竟有没有人,甚至还能看出他的姿势。 最近,一家来自中国的AI创业公司合刃科技与华中科技大学、斯坦福大学等合作,尝试用墙壁散射的光去复原被遮挡数字,正确率最高能达到97%,整个过程不需要1秒,更适合用在需要实时处理的自动驾驶。 他们的论文《Direct Object Recognition Without Line-of-Sight Using Optical Coherence》已被CVPR 2019收录。 简评: 之前,量子位介绍过一种可以用墙面反射的复原屏幕内容的方法。而合刃科技提出的方法不需要复杂的图像重建过程,不仅能恢复简单的图像,甚至还能推测人体的姿势。 03 新突破涂鸦一键变逼真照片,英伟达AI新研究。 上周,英伟达出品的GauGAN大杀四方:你画一幅涂鸦,用颜色区分每一块对应着什么物体,它就能照着你的大作,合成以假乱真的真实世界效果图。在AI界,你的涂鸦有个学名,叫“语义布局”。 要实现这种能力,GauGAN靠的是空间自适应归一化合成法SPADE架构。这种算法的论文Semantic Image Synthesis with Spatially-Adaptive Normalization已经被CVPR 2019接收,而且还是口头报告(oral)。 这篇论文的一作,照例还是实习生。另外几位作者来自英伟达和MIT,CycleGAN的创造者华人小哥哥朱俊彦也在其中。 简评: 在基于语义合成图像这个领域里,这可是目前效果最强的方法。 04 新突破照片上的人出来了!云从3D人体重建登顶三项榜单,一张照片就能生成3D形象 以往的3D人体重建,往往需要多个摄像头,或者连续的多帧影像,才能重建出人体的3D模型。 不过现在,云从科技在3D重建领域刷新了榜单,而且只需要一个普通摄像头,拍摄一张照片就可以。 而且,既然一张照片就可以生成3D图像,那么连续的一段视频,就可以生成一个动画电影片段啊。 除了预测人体的3D形态和姿势,这项技术还可以实现用6万多个点完整描绘人体,帧率达到200fps。 简评: 该技术在部署上的另一个优点是,可以利用普通光学摄像头作为感知设备,不需要连续图像或者多视角拍摄。 也即是说,如果将这项技术部署在手机上,那么不需要3D结构光也可以实现3D人脸识别,或者制作3D表情。 05 新风向中央深改委会议:促进人工智能和实体经济深度融合 据新华社报道,中共中央总书记、国家主席、中央军委主席、中央全面深化改革委员会主任习近平3月19日下午主持召开中央全面深化改革委员会第七次会议并发表重要讲话。 会议审议通过了《关于促进人工智能和实体经济深度融合的指导意见》,并指出,促进人工智能和实体经济深度融合,要把握新一代人工智能发展的特点,坚持以市场需求为导向,以产业应用为目标,深化改革创新,优化制度环境,激发企业创新活力和内生动力,结合不同行业、不同区域特点,探索创新成果应用转化的路径和方法,构建数据驱动、人机协同、跨界融合、共创分享的智能经济形态。 简评: 审议通过的指导意见特别强调了人工智能要“与实体经济融合”,这是十九大报告就已经指出的方向,工信部去年也评出了100多家人工智能与实体经济深度融合创新项目。赋能实体经济是技术公司的一个重要拓展方向,也带来了对跨界人才的需求。 06 新风向阿里集团CTO张建锋宣布阿里云新战略,两年内将阿里全部技术开放输出 上周,阿里云北京峰会在京召开,阿里云智能总裁张建锋发布了阿里云的新战略: 阿里云升级为“云上的阿里巴巴”。未来1-2年内阿里巴巴的所有系统,都将基于公有云。内部技术需要第一时间放到云端,并通过云平台对外开放。 阿里云提出了“被集成”的新口号,希望阿里云的技术变成合作伙伴行业解决方案的一部分。 简评: 张建锋上任阿里云智能总裁以来,首次公布新战略。阿里巴巴要将全部技术上云,也奠定了阿里云在阿里体系内的地位。 另外,随着互联网巨头们越来越重视to B业务,本来做私有云的华为拓展到公有云,公有云这个领域的竞争越来越激烈。 阿里云虽然有先发优势,但面对众多挑战者,也需要积极应战,将阿里自身技术全部通过阿里云向外输出,可见深挖护城河的决心和诚意。 07 新动态英伟达发布99美元AI计算机,可运行所有AI模型 在2019年GTC,英伟达发布了AI计算机Jetson Nano,尺寸70×45毫米,是迄今为止最小的计算机。 Jetson Nano每秒可以完成4720亿次半精度浮点运算 ,而耗电量仅有5瓦。英伟达表示,它可以运行任何AI模型,创建数百万个智能系统。 它分为两个版本发售,一是99美元的开发者套件;二是129美元的生产就绪型模块,面向企业。 简评: 不久前谷歌发布的150美元TPU开发板,单精度浮点运算性能是每秒640亿次。相比之下,Jeston Nano算力更强,价格更加亲民,且支持更多模型。AI计算设备成本越来越低,使更多开发者有机会训练AI模型。 对于英伟达、谷歌、英特尔等巨头来说,这类低价边缘开发板,进可推广神经网络在边缘的部署,展示自家芯片在摄像头、无人机、机器人等领域的潜力,退可拉拢开发者和爱好者,扩大自家生态的影响力。 08 新动态ICCV 2019论文投稿创纪录,比上届翻一番达4328篇。 计算机视觉领域的顶级会议ICCV 2019,刚刚公布了论文投稿的情况:一共收到了4328篇论文。 这个数量是上一届,也就是ICCV 2017的两倍。 上一届ICCV 2017共收到2143篇论文投稿,其中621篇被选为大会论文(入围比例29%),其中56篇亮点报告(Spotlight),45篇口头报告(Oral)。 看起来,今年比拼肯定是要更激烈了。 上次ICCV 2017大会,参会人数再创新高,达到3107名。在30年ICCV大会历史上,已经被称为火爆出奇的一届。 ICCV 2017最佳论文(Marr Prize),颁给了何恺明为一作的Mask R-CNN。另外,何恺明参与的另一篇论文:Focal Loss for Dense Object Detection,也被大会评为最佳学生论文。 ICCV 2019将于今年10月27日在韩国首尔召开。 09 新动态 前腾讯AI Lab主任张潼加盟创新工场。 前腾讯AI Lab负责人张潼宣布加入创新工场,出任科研合伙人。 另外,香港科技大学和创新工场宣布成立计算机感知与智能控制联合实验室,张潼担任实验室主任。 创新工场主页显示,张潼目前在港科大数学系和计算机系任教。 简评: 现在的AI领域,学术界与工业界已不像从前那样泾渭分明。两者的研发思路可以互相促进互相增强,联合实验室也越来越普遍。而港科大历来是AI强校,腾讯、旷视、滴滴等企业都与之建立了联合实验室。 而对张潼来说,在经历了百度、腾讯两家大厂之后,选择落脚学术界的港科大、同时将产业界的手伸到创新工场来,便可以从投资的视角参与技术力量在产业界应用的过程。 10 新动态旷视拟以同股不同权架构在港上市,最多筹资10亿美元 香港《信报》援引消息人士称,旷视科技计划4月底至5月初向联交所递交上市申请,考虑采用同股不同权的架构上市。 旷视科技集资规模暂定为5亿至10亿美元,可能成为继小米、美团点评之后,第三家在香港上市的同股不同权企业。一旦成功上市,也是中国第一家登陆港交所的AI公司。 简评: 在我国计算机视觉领域的四只独角兽中,商汤估值60亿美元,云从33亿美元,旷视25亿美元,依图21亿美元。预计旷视上市后市值将超50亿美元 (400亿港元) ,符合港交所同股不同权的上市要求。 旷视若能成功上市,则标志着AI技术,特别是人脸识别技术的成功商业化。 旷视偏好在港上市,一个重要原因可能是港交所已从去年开始允许同股不同权架构。不过,大陆科创板也允许同股不同权,所以也不能完全排除旷视在科创板上市的可能。
作者系网易新闻·网易号“各有态度”签约作者 — 完
|