联系
我们
投稿
反馈
评论 返回
顶部

内容字号: 默认 大号超大号

段落设置: 段首缩进取消段首缩进

字体设置:切换到微软雅黑切换到宋体

如果你更新了iOS 10,你会发现智能手机正成为“超级AI计算机”

2016-10-08 08:36 出处:互联网 人气: 评论(
qq餐厅刷钱器 qq书库 qq西游寻找霓裳 sangna8 scanner 5000l scp-131-a sd敢达小溪流脚本 seqing5yuetian seqingdianyen seqingwangzan

  9月13日,苹果用户可以正式更新全新的 iOS 10 系统,更新后的 iOS 系统可以让用户随意找到在任意时间和地点、有关任意人或事物的照片。iOS 10 系统利用了人工智能神经网络技术,用户每次拍摄照片的0.1秒内会进行约110亿次运算,可以找出照片中的人物是谁,甚至以及他们处于什么样的情绪。

  本次 iOS 10 照片应用程序仅仅只是 AI 技术走向“手持设备化”趋势的一个最新例子而已。比如今年一月份所发布的应用程序Aipoly,能够识别出各种物体,并为视障人士大声播放物品名字。还有,谷歌翻译现在可以在你拿起相机对准文本内容的同时,将内容文字即时翻译成另一种语言。现在这类运算可以做到非常之快,甚至在你意识到之前就已经完成。

  Aipoly不仅能够识别出图片中的动物,还能识别出该动物的品种,然后大声地播放出它们的名称。

  就在“云技术”正成为“它是如何运作的?”这类问题的唯一答案时,智能手机却反其道而行,朝着独立运行的方向发展。

  AI 技术已经可以在手机上独立进行任务处理,而无须像以往那样,需要一个庞大的云端服务器群提供支持。这样做的结果,是用户在使用 AI 技术的时候,不会再产生网络链接数据中心时的恼人延迟,用户将会得到更自然和顺畅的使用体验。

  “当我说,‘嘿,Siri,这是什么?’的时候,需要两秒钟来把图片发送到云端才能获得响应,” 创始人之一Alberto Rizzoli说,“这有点像在与一个刚睡醒的人聊天。”实际上,Aipoly不是第一个帮助视障人士识别物体的应用程序,而是第一个通过减少对云端的依赖而在智能手机上独立运行AI技术来即时识别物体的应用程序。

  根据高通(Qualcomm)产品经理 Gary Brotman 表示,这类即时AI技术,将可以精确而又详细地绘制周围的地理环境,然后在其中植入具有丰富细节的3D物件、字符和动画,最后呈现在用户的智能手机或其他电子产品的显示屏幕上,这将远远超过游戏 Pokmon Go 里所使用的 AR 技术。

  同样,VR 技术与智能手机上的 AI 技术结合后将显得更加真实。“要实现上述效果,一切都得是完全实时的,”他说。“所以你必须能够在展示视频、音频的同时,由人工智能技术来实现眼球追踪、头部跟踪、手势跟踪和空间声源跟踪。”

  AI 技术同样也可以为人们的生活提供便利。Rizzoli表示,虚拟助手可以利用手机的摄像头来识别人们的位置,比如在一个特定的街道边或餐厅里,然后关联到相关的应用程序。而这一次,实时AI技术将使得类似的给人们带来极大便利的功能不再受到网络延迟的影响。如果未来的AI技术不再需要云端支持,那么云计算同样也不再需要人们的个人数据。

  “无论出于对隐私原因、延迟原因还是其他各种各样原因的考虑,AI技术的分析和控制中心都应该被安装在手机上,而不是云端。”Brotman说道。

  内置人工智能

  是什么在驱使着将 AI 技术应用到手持设备中?答案是视频游戏。

  “人们想要在他们的手机和ipad上体验到更好的手机游戏,”Rizzoli说。“所以苹果、高通以及其他芯片制造商在追求更佳的性能上一直表现得很出色。”实际上,这也是手机CPU和GPU往更强性能的方向上发展的重要推动力。CPU大多是按照顺序分步完成任务,而GPU在进行3D图像快速渲染时则是并行地处理数量巨大的简单任务。AI技术也需要串联地执行多个并联起来的简单任务。

  以现代图像识别领域内的主要技术——“卷积神经网络(CNN)”为例,卷积神经网络(CNN)模仿大脑视觉皮层的工作原理,把视觉领域分成重叠的图片块,然后按照特定的顺序,过滤掉简单的细节,例如所有的图片块边缘。当这些信息到达某一神经层(人类的生物层面或者软件的虚拟层面)的时候,这一层的神经元可能会把边缘结合成线,而到达另一层神经元的时候,则可能识别出图片的主要形状。每一层(数量上可能达到几十层)进一步改进图像的感知器。

  “你看一张照片时候,你同时也在确认它里面的各种信息,”Rizzoli说,“当你在确定图像边缘的时候,你也在确认图像可能存在的形状。而且所有这些确认行为可以并行地同时完成。”

  实际上,智能手机的芯片已经经历了几年的挑战。2013 年发售的iPhone 5s在本次iOS 10的更新中,仍然能够支持新的人像识别,场景识别和对象识别。Aipoly也在制作数个版本,使该软件可以在几年前发售的iphone5和安卓手机上顺利运行。然而程序员们最近才能充分利用好这种新技术,今年六月推出的照片效果处理软件Prisma,便是这种技术的最早应用者之一。

  二十五岁Aleksey Moiseenkov 创建的 Prisma,可以将智能手机的照片渲染成30种不同艺术风格的应用程序,比如“尖叫”、“蒙德里安风格”,以及一些有趣的标题诸如“美到犯罪”“火焰喷射器”以及“#进城”。与其复杂程度不相匹配的是,渲染效果的呈现几乎是瞬时完成的。

  一个Instagram上的滤镜只是通过预设之后简单地调整图像的基本参数,如颜色、对比度、亮度或是白平衡。而Prisma则需要分析图像以及识别出图像的基本信息,如形状、条纹、颜色和材质,然后就像Edvard Munch(挪威画家,1863~1944)或者 Piet Mondrian(荷兰画家,1872~1944)一样,在随意涂鸦一样重新画出来。即便开始时输入的是平庸水准的照片,通过如此处理后的成品效果依然可能会大放异彩。

  左边是一张极度无聊的照片,右边为经过Prisma的“折纸艺术”风格处理后的照片效果图。

  Prisma的所有处理过程最初全都是在云端进行的,然而Moiseenkov却认为依靠云计算可能会影响到这个应用程序的使用质量。“我们在亚洲有很多的用户,”他说,“我们需要给予他们始终如一的优质体验,无论用户是使用何种方式链接的网络,以及无论服务器或者云计算服务器位于何处。”该软件在8月份更新的iPhone版本中,已经能够在iPhone上完全独立地完成所有处理过程,Moiseenkov现正集中精力在研发该升级的Android版本。

  将同样的艺术效果渲染技术适用于视频处理的升级可能也会在9月份推出,Moiseenkov说。“按照之前在云端的处理方法,视频的处理将会复杂得多,服务器和其他相关的东西随时都有可能超载”,他说,“所以,使视频可以在手机上完成效果处理是至关重要的。”

  Moiseenkov和他的团队需要找到让AI程序能够在智能手机上流畅运行的方法,这项工作对于未来的程序员来说可能会较容易实现。

分享给小伙伴们:
本文标签:

更多文章

相关文章

  • 蛮便宜
  • 抠门网
  • Copyright © 2002-2014 版权所有