首页 资讯 技术 智能 工程 市场 科技 其它

综合

下栏目: 国际 行业 视点 综合

AI视觉成像芯片搅动千亿级新市场,毒药般SoC时代即将过去

来源:网络整理 热度:℃ 时间:02-07
摘要:这就像我们在淘宝上买东西,看到的都是卖家秀,拿到手的却是买家秀。这其中最大的差别,就是光线环境的问题。”

  这就像我们在淘宝上买东西,看到的都是卖家秀,拿到手的却是买家秀。这其中最大的差别,就是光线环境的问题。”

下载.jpg

  “图像识别的卖家秀和买家秀之间,永远隔着一盏灯光的距离。”眼擎科技(Eyemore)创始人&CEO朱继志日前在IF创新大会2018上发布全球首款AI成像芯片时说,“我们经常看到在各种图像识别比赛中,图像识别率很高。但在实际嘲中,比如人脸识别,却没有任何一家厂商敢提供识别率数据,因为现场问题实在太多了。” 

  下图是朱继志在发布会现场分享的一张PPT。左边,是《花 花公子》杂志御用模特Leina一张裸照的一部分。这张照片细节丰富、层次分明、边缘清晰,三十年来所有和图像算法相关的图片,都拿它来做标准;但实际在现场拍到的图片,却往往是右边的模样,根本无法识别。

1.jpg

       “图像识别的卖家秀和买家秀之间,永远隔着一盏灯光的距离。”

  “这就像我们在淘宝上买东西,看到的都是卖家秀,拿到手的却是买家秀。这其中最大的差别,就是光线环境的问题。”朱继志说,给美女拍照片,会设置很多灯光。然而现实生活中的光线环境是不可控的,遇到弱光、逆光、反光情况时,成像效果就很差,AI算法无法识别。

  给人看的像素时代终结,给机器看的视觉时代开启

  要解决卖家秀和买家秀的问题,就要靠视觉器官的进化,把视觉放在一个系统整体来看。首先是眼睛,在前端负责感知,产生图像;然后是大脑,在后端负责认知,它分析图像视觉;此外,还有第三部分—大脑如何控制眼睛,也就是双方怎样进行智能的交互?只有大脑、眼睛、脑眼交互这三部分都智能化了,才能说机器视觉是智能的。这也代表了人工智能在产业里发展的三个阶段:大脑的进化、器官的进化、大脑和器官交互方式的进化。 

2.jpg

视觉的三种智能

  要了解眼睛这个成像器官的进化,就要先回顾一下成像技术的历史。成像技术从30年代美国的胶卷时代开始,代表厂商是柯达;80年代进入数码时代,产业转移到了日本,今天看到的所有的数码照片,都是源自80年代日本的成像架构,包括索尼、尼康、佳能等公司。然而到了AI时代,行业对图像的需求可能会发生本质的变化:图像不再是给人看的,而是要给机器看。

  给人看的时候,关注的自然是像素,喜欢自拍的姑娘,一定会关心手机前后摄像头是多少像素。然而当大家开始用iPhone X刷脸的时候,似乎又没有多少人关心摄像头的像素问题。因为常识告诉我们,人眼看世界的时候,是没有像素概念的。

  人眼是人类长期进化的结果,最强大之处在于对环境的适应能力。正常情况下,看哪里都是清楚的,颜色都是对的,不存在卖家秀和买家秀的问题。相比之下,机器和人眼最大的差距,就是适应性太差,而要解决适应环境的问题,机器能用的资源只有三种:算力、算法和数据。

  为了解决各种复杂光线问题导致的问题,眼擎科技使用了各种新型的算法,计算复杂度是数码成像的50倍以上,通过对大量嘲数据的测试,使得成像引擎能够像人类眼睛一样自动的适应各种环境,消除各种光线环境的影响,输出稳定的视觉图像。

  从IoE到VoE,新的千亿级市场诞生

  视觉技术分为两种:成像(imaging)和图像处理(image processing)。前端成像技术负责生成视觉图像,后端图像处理负责分析、识别、处理视觉图像。换句话说,成像相当于人的眼睛,图像处理相当于人的大脑。

  目前人工智能领域的明星公司,包括商汤、旷世、地平线、云从、依图、深鉴等,都是基于图像处理算法为核心技术的独角兽公司。在过去的三年里,受深度学习技术的驱动,图像处理获得了飞速的发展,但前端的成像技术,仍然停留在二十年前的水平,成为AI视觉未来发展以及商业应用落地的严重的瓶颈,也是当前各大AI公司的下一个必争之地。

  “AI将带动成像技术和产业从像素到视觉的一次大的变革和颠覆。中国是AI视觉产业落地最快的地方,我相信,这个新的成像技术的第三个阶段,会由中国主导。”朱继志说。

  和数码时代相比,AI时代的成像在成像架构、算法模型、评判标准、光线适应性等诸多关键环节都发生了本质上的变化,传统的数码成像技术架构已不能满足AI视觉的需求,面临迅速被淘汰的窘境。未来五年,成像技术将有望完成从“图像”到“视觉”的划时代升级,视觉成像芯片和AI处理芯片一样,成为人工智能的核心部件,由此衍生的产业升级需求,将在未来五年催生出成像领域千亿级别的新增量市场。

  给机器配置视觉中枢

  算力、算法和数据集成到一起成为产品,就是一颗芯片,比如眼擎科技此番推出的全球首款AI视觉专用成像芯片Eyemore X42。这颗芯片采用了全新的成像引擎架构,集成了超过20种的新型成像算法,感光度最高可以达到40万,单次曝光动态范围可以超过16bit,最大功耗在1.5W以内。 

3.jpg

全球首款AI视觉专用成像芯片Eyemore X42

  完全自主研发的eyeMix、eyeNoise等核心成像算法构成了X42的基础。它抛弃了传统的日系全局成像架构,转而采用分区域、分层的Eyemore成像引擎架构,解决了视觉成像中存在的弱光、逆光、反光等痛点。 

5.jpg

Eyemore成像引擎

  “做成像芯片其实是一件很苦逼的事情。眼擎科技成立四年了,很多人都在问我这期间做了什么?我只能苦笑着说我们在调试图像,在调试图像,在不停的调试图像。因为成像是一个主观性比较强的事情,我们测试了500+以上的嘲,前后耗时四年,才打磨完成了这款全球首个面向AI视觉应用领域推出的成像芯片。”看得出来,朱继志在回忆往事时也是不胜唏嘘。

最热资讯