电子发烧友网 > 触控感测 > 正文

基于3D数据卷积神经网络的物体识别

2020年01月16日 16:36 次阅读

在增强现实(AR)与自动驾驶伯爵棋牌_[开户赠金]的时代来临之际,3D数据呈现爆炸式增长。在不久的将来,处理3D数据的算法将应用于像机器人自动巡航、基于AR的智能用户界面等应用程序上。受此启发,我们在Matroid公司所著的论文提出了FusionNet,这一框架用于在一个名为Princeton ModelNet的标准数据集上做3D CAD物体分类。

FusionNet的核心是全新的、应用于3D物体的三维卷积神经网络(Convolutional Neural Networks, CNN)。我们必须在多个方面调整传统的CNN以使其有效。为了解释得清楚些,我们不妨先看一下用于图像分类的二维CNN。这个思路是,机器学习研究者会构建数个隐层形成的模型,每一层与前一层都以不同的形式连接。在第一层,你会拥有一个在二维图像上滑动的一块窗口区域作为输入。因为这个区域执行了卷积操作——在窗口滑动时它交叠其上,因此它被称为卷积层。伯爵棋牌_[开户赠金]其后还有几层不同形式的隐层,最后一层用于预测潜在的输出;每一种输出对应着图像标注中的某种分类。在ModelNet40 Challenge数据集中,存在40个分类,因此模型中最后一层有40个神经元。第一类可能是“猫”,第二类可能是“车辆”,以此类推遍历数据集包含的所有分类。如果第一个神经元在40个中激发的最厉害,那么输入样本就会被判别为第一类,一只猫。

伯爵棋牌_[开户赠金]整个模型假设输入是图片形式,即二维数据。你该如何将它拓展到三维呢?一种可能的方法是,就像显示器伯爵棋牌_[开户赠金]显示三维物体那样,先把物体通过投影处理成二维图像,然后在其上运行标准的二维CNN算法。实际上,现在在Princeton ModelNet Challenge数据集上已提交的最优算法的思路是,把任何3D物体在多个角度上对物体进行一组2D投影进行“像素表达”,然后使用卷积神经网络。FusionNet确实也基于像素表达使用了CNN,但关键是,它同时还增加了一种新式的三维CNN。

与在二维图像上滑动一个区域不同的是,我们可以在物体上滑动一块三维空间了!在这种表达之下,没有必要做投影这一步。这种方法用“体积表达”来处理物体。

在我们的体积表达中,3D物体被离散化为30*30*30的体素(译者注:volumepi伯爵棋牌_[开户赠金]xel,文中简称voxel)网格。如果物体的任何部分位于1*1*1的体素中,就给体素赋值为1,反之则赋值为0. 与之前的工作不同的是,我们在学习物体特征的过程中同时用到了像素表达和体素表达,这种方法对分类3D CAD物体而言,比单独使用其中一种要好。其中一些例子如下:

基于3D数据卷积神经网络的物体识别

伯爵棋牌_[开户赠金]图 1. 两种表达。伯爵棋牌_[开户赠金] 左图:浴缸、高脚凳、坐便器与衣橱的2D投影。右图:体素化之后的浴缸、高脚凳、坐便器与衣橱。 感谢Reza Zadeh提供图片

我们建立了两种处理体素数据的卷积神经网络(V-CNN I与V-CNN II),以及一种处理像素数据的网络(MV-CNN)。 下图显示了这些网络是如何结合在一起工作,并给出对于物体分类的最终判断的。伯爵棋牌_[开户赠金]处理2D图像的标准CNN就不一样了,它们只能从图像中学到一些空间局部特征。

基于3D数据卷积神经网络的物体识别

图2. FusionNet是三种神经网络的混合,它们分别是V-CNN I, V-CNN II, and MV-CNN (最后一种神经网络是基于AlexNet结构构建的,并经过ImageNet数据集预训练过 ) 这三种网络在评分层进行了融合,通过计算打分的线性组合找到最终所预测的分类。前两个网络使用了体素化的CAD模型,最后一种网络则使用2D投影作为输入。感谢Reza Zadeh提供图片

我们使用了标准预训练神经网络模型(AlexNet)作为2D网络MV-CNN的基础,对3D物体2D投影的网络进行暖启动(warm-start)预训练基于大规模2D像素图片数据集ImageNet。受预训练影响,许多用于2D图像分类的特征不需要从头开始训练了。下图所描绘的框架是我们使用的V-CNN之一种(V-CNN I):

基于3D数据卷积神经网络的物体识别

图 3. 感谢Reza Zadeh提供图片

V-CNN I所使用的框架受到GoogLeNet(www.cs.unc.edu/~wliu/papers/GoogLeNet.pdf)启发, 使用了IncepTIon模块。IncepTIon模块对不同大小的核处理结果进行了拼接,它有助于神经网络学习不同尺度的特征,并在紧接着IncepTIon模块的下一层卷积层中共享参数。

概括来说,FusionNet是三种神经网络的融合,其中一种基于像素表达,两种基于物体的体素化表达。它利用了每一种网络的强项,提高了分类器性能。FusionNet中的每一个网络组分都在对物体分类之前以多个角度、方向观察物体。尽管从直觉来说,对物体的多角度观察确实能比单角度观察带来更多信息,但是将信息整合到一起以提高预测精度并不显而易见。我们使用了20个像素表达特征与60个CAD物体体素表达特征这么多信息用于进行物体分类。FusionNet的效果超越了在Princeton ModelNet 40类数据集榜单上排名第一的提交方案,展示了其独到的能力。

下载发烧友APP

打造属于您的人脉电子圈

关注电子发烧友微信

有趣有料的资讯及技术干货

关注发烧友课堂

锁定最新课程活动及技术直播

电子发烧友观察

一线报道 · 深度观察 · 最新资讯
收藏 人收藏
分享:

评论

相关推荐

第一届中国AI与机器学习研讨会

活动内容  人工智能技术将在未来对传统产业产生重大颠覆性影响,人工智能将在各行各业为创新设计带来新的动力,它也将催生新的
发烧友学院发表于 2018-03-29 00:00 228次阅读
第一届中国AI与机器学习研讨会

Facebook全面转战增强现实,去年专利数量大...

据国外媒体报道,Facebook 可能在适应智能手机革命方面进展缓慢,但对该公司被授予专利的分析表明....
发表于 2020-01-16 10:40 81次阅读
Facebook全面转战增强现实,去年专利数量大...

人工智能领域有什么技术性的岗位

人工智能领域目前已经逐渐形成了一个庞大的产业体系,整个产业体系结构中也涉及到大量的工作岗位。
发表于 2020-01-16 10:13 26次阅读
人工智能领域有什么技术性的岗位

人工智能全球2000位具有影响力的学者有哪一些

而当前人工智能领域热点研究话题位居前十的是:神经网络、卷积神经网络、机器学习、计算机视觉、移动设备、....
发表于 2020-01-16 09:47 15次阅读
人工智能全球2000位具有影响力的学者有哪一些

人工智能全球2000位最具影响力学者 机器学习领...

1月11日,清华—中国工程院知识智能联合研究中心和清华大学人工智能研究院联合发布了2020年人工智能....
发表于 2020-01-16 09:43 19次阅读
人工智能全球2000位最具影响力学者 机器学习领...

机器学习如何做好分布外异常检测?

近些年来,随着新细菌种类不断被发现,虽然基于已知分类训练的神经网络分类器通过交叉验证达到了很高的测量....
发表于 2020-01-16 09:39 27次阅读
机器学习如何做好分布外异常检测?

CFA二级思维导图分享:机器学习

在机器学习中,训练模型的算法数据集包括:训练样本(Trainning Sample),检验样本(va....
发表于 2020-01-16 09:25 50次阅读
CFA二级思维导图分享:机器学习

阿里巴巴在GitHub上发布了其Alink平台的...

贾指出,中国技术供应商是GitHub上十大贡献者之一,他说:“我们致力于在我们的软件开发周期中尽早与....
发表于 2020-01-16 09:16 38次阅读
阿里巴巴在GitHub上发布了其Alink平台的...

读懂NeurIPS2019最佳机器学习论文

们先重述标题。本文的研究讨论了一种用于学习半空间的算法,该算法在与分布无关的PAC模型中使用,且研究....
发表于 2020-01-16 09:03 35次阅读
读懂NeurIPS2019最佳机器学习论文

新华三在人工智能、机器学习领域的创新实力

当前,在机器学习等技术创新的驱动下,以行业+AI为基石的智能化应用正在加速各行各业的数字化转型,开启....
发表于 2020-01-16 08:20 64次阅读
新华三在人工智能、机器学习领域的创新实力

应聘机器学习工程师岗位你需要知道的12个基础面试...

假设一个简单的层计算公式 y = (Wx + b),y 在 W 上的导数就是这样:dy=dWx。因此....
发表于 2020-01-16 08:17 58次阅读
应聘机器学习工程师岗位你需要知道的12个基础面试...

机器学习预测计算机芯片执行来自各种应用程序的代码...

研究人员通过一种特殊的神经网络模型,它以“基本块”(计算指令的基本摘要)形式训练标记的数据,以自动预....
发表于 2020-01-16 08:13 41次阅读
机器学习预测计算机芯片执行来自各种应用程序的代码...

《机器学习实战-基于Sophon平台的机器学习理...

本书由星环科技人工智能平台研发团队合著,凝聚了来自算法专家及一线软件工程专家的实战经验。相比于国内学....
发表于 2020-01-16 08:11 33次阅读
《机器学习实战-基于Sophon平台的机器学习理...

Rokid新一代Rokid Glass 2 AR...

Rokid于今日发布了最新一代AR眼镜Rokid Glass 2。
发表于 2020-01-15 17:13 269次阅读
Rokid新一代Rokid Glass 2 AR...

网络安全领域的AI泡沫变小了?

机器学习不应将公司的网络安全作为单一防御层来支撑,而应将人员、流程和技术结合在一起,成为多层和全面安....
发表于 2020-01-15 17:11 59次阅读
网络安全领域的AI泡沫变小了?

换脸技术打开的“潘多拉魔盒”,人工智能亟待突破“...

目前,“人人都怕换脸术”的恐慌,已引起国家有关部门的高度关注。今年1月1日起施行的《网络音视频信息服....
发表于 2020-01-15 14:01 502次阅读
换脸技术打开的“潘多拉魔盒”,人工智能亟待突破“...

机器学习中有哪一些算法是经常用的

人工神经网络(ANN)以大脑处理机制作为基础,开发用于建立复杂模式和预测问题的算法。
发表于 2020-01-15 11:49 26次阅读
机器学习中有哪一些算法是经常用的

人工智能可以解决“三体问题”吗

研究人员并未打算让这套神经系统独挑大梁,他们认为最好让Brutus之类的程序做大部分“苦力活”,而神....
发表于 2020-01-15 10:55 41次阅读
人工智能可以解决“三体问题”吗

商业中的AI需要如何去对待

现在有一种评估人工智能(AI)的趋势,即评估它如何改善消费者购物旅程中的离散元素,而不是评估人工智能....
发表于 2020-01-15 10:47 18次阅读
商业中的AI需要如何去对待

清华人工智能研究院院长张钹:从“让数据说话”到引...

深度学习兴起之后,学界将目标转移至数据,提出“让数据说话”。张钹认为,这种强调对深度学习的发展起到积....
发表于 2020-01-15 10:41 144次阅读
清华人工智能研究院院长张钹:从“让数据说话”到引...

人工智能的介入在文学艺术圈制造了持久的喧哗

工智能的介入在文学艺术圈制造了持久的喧哗,各种观点错杂交叠。欣然接受人工智能的作家不多,反对人工智能....
发表于 2020-01-15 10:37 323次阅读
人工智能的介入在文学艺术圈制造了持久的喧哗

人工智能与金融业务是如何融合的

由于人工智能技术的应用对于很多金融机构与银行而言还属于新兴事物,而且在技术方面更具有很强的专业性,因....
发表于 2020-01-14 15:53 33次阅读
人工智能与金融业务是如何融合的

人类的发明模式受到了人工智能怎样的影响

随着人工智能和机器学习开始在影像识别和语言理解方面取得令人印象深刻的成就,已经有许多科学家认为其可以....
发表于 2020-01-13 16:59 44次阅读
人类的发明模式受到了人工智能怎样的影响

边缘处理的机器学习处理的特定领域SoC逐渐成为主...

通过SiFive的DesignShare计划进行的联合芯片开发,结合了两家公司的IP和设计优势,可为....
发表于 2020-01-13 16:14 143次阅读
边缘处理的机器学习处理的特定领域SoC逐渐成为主...

人工智能如何和加密货币创造新的商机

随着加密货币的兴起,以及可能与人工智能结合在一起,因而人工智能越来越受欢迎,不但进入主流媒体,也成为....
发表于 2020-01-13 16:02 38次阅读
人工智能如何和加密货币创造新的商机

清华大学发布人工智能全球2000位最具影响力学者...

从国家角度看,美国学者人数的占比最高,有1128人,占比61.4%,超过总人数的一半,独自领跑第一梯....
发表于 2020-01-13 15:12 238次阅读
清华大学发布人工智能全球2000位最具影响力学者...

云计算领域在2020年是怎样的展望

随着5G的扩张,我们将看到手机游戏发展将进一步加速,因为5G提供了强大的连接、低延迟和带宽能力,需要....
发表于 2020-01-13 10:04 36次阅读
云计算领域在2020年是怎样的展望

GPU技术的关键参数有哪些和应用场景详细说明

随着云计算,大数据和人工智能技术发展,边缘计算发挥着越来越重要的作用,补充数据中心算力需求。计算架构....
发表于 2020-01-12 10:25 287次阅读
GPU技术的关键参数有哪些和应用场景详细说明

Unlearn机器学习平台可加快阿尔茨海默氏症药...

查尔斯·费舍尔(Charles K. Fisher)博士说:“我们今天发布的结果令我们感到兴奋,因为....
发表于 2020-01-11 10:50 184次阅读
Unlearn机器学习平台可加快阿尔茨海默氏症药...

机器学习在库存管理中有哪一些应用

人工智能(特别是在在线零售行业中)的常见用途之一是使用自主机器人与客户进行交互。
发表于 2020-01-10 15:13 76次阅读
机器学习在库存管理中有哪一些应用

AI发明家申请专利为什么被拒绝了

人工智能成为科技行业最大热点,包括语音识别、图像识别等技术得到了更加广泛的应用,人工智能技术的能力也....
发表于 2020-01-10 14:27 343次阅读
AI发明家申请专利为什么被拒绝了

目前机器人的行为是多种多样并且不可预测的

很多人都说家庭机器人为儿童、家庭和老人提供帮助和陪伴。设计有表现力的眼睛和头部姿势的机器是特别感兴趣....
发表于 2020-01-10 11:12 118次阅读
目前机器人的行为是多种多样并且不可预测的

IBM的研究表明模拟芯片可为机器学习而大幅加速

人工智能或许能解决一些科学和行业最棘手的挑战,但要实现人工智能,需要新一代的计算机系统。
发表于 2020-01-09 15:15 113次阅读
IBM的研究表明模拟芯片可为机器学习而大幅加速

人工智能技术可帮助企业采用更多的解决方案

企业人工智能(AI)有多种形式,从强大的语音助手和聊天机器人技术到机器学习(ML)和计算机视觉解决方....
发表于 2020-01-09 11:11 258次阅读
人工智能技术可帮助企业采用更多的解决方案

专为高中生打造的人工智能教材今年出版

为推动完善人工智能教育体系,清华大学交叉信息研究院在图灵奖得主、院长姚期智院士的带领下,在计算机科学....
发表于 2020-01-08 14:45 362次阅读
专为高中生打造的人工智能教材今年出版

如今的人工智能已经可以识别医疗死亡风险

根据Geisinger的发布,Geisinger研究人员最近发现,人工智能可以检查心电图(ECG)测....
发表于 2020-01-08 11:12 276次阅读
如今的人工智能已经可以识别医疗死亡风险

主编的教材《人工智能(高中版)》,在清华大学举办...

姚期智表示,《人工智能(高中版)》编委全部来自清华大学交叉信息研究院计算机科学实验班(姚班)和人工智....
发表于 2020-01-08 11:08 620次阅读
主编的教材《人工智能(高中版)》,在清华大学举办...

瑞萨电子高效电源管理IC应用于Google Co...

瑞萨电子株式会社(TSE:6723)宣布其ISL91301B电源管理IC(PMIC),应用于最新Go....
发表于 2020-01-08 07:47 174次阅读
瑞萨电子高效电源管理IC应用于Google Co...

先考虑AI带来的好处还是带来的忧患

AI 以及机器学习等,由于需要通过收集大量数据以完成机器学习的过程,因此在企业角度来说,稍一不慎便很....
发表于 2020-01-07 17:11 86次阅读
先考虑AI带来的好处还是带来的忧患

人工智能风险不得不去思考一下

人工智能与机器学习将于未来几年造成约700万个工作机会消失,并同时创造出200万个新创的工作机会。
发表于 2020-01-07 17:08 59次阅读
人工智能风险不得不去思考一下

如今不起眼的微处理器也能实现机器学习了

来自谷歌、微软、高通、三星和6所大学的一组研究人员齐聚加州圣何塞,讨论将机器学习带到网络最远端的挑战....
发表于 2020-01-07 15:40 378次阅读
如今不起眼的微处理器也能实现机器学习了

如何让汽车有自我思考的能力

世界各国的各地政府正在朝着一个长期目标迈进,那就是让智慧城市拥有自动驾驶和高度自动化的车辆,并将其集....
发表于 2020-01-07 15:32 99次阅读
如何让汽车有自我思考的能力

哪些领域要关注人工智能带来的改变

将数据与带有人工智能技术的学习程序一起使用,有助于提升人的体验,而不是取代人的体验,这是我们听到的与....
发表于 2020-01-07 14:47 66次阅读
哪些领域要关注人工智能带来的改变

机器设计会如何受到AI的影响

人工智能如今应用越来越广泛。在大多数情况下,健壮和自适应的人工智能可以为人类的专业知识提供补充,而不....
发表于 2020-01-07 14:38 60次阅读
机器设计会如何受到AI的影响

神经符号人工智能如何书写未来

符号人工智能和神经网络还是完完全全的两个世界,相互对立。人工智能领域的大佬们常常各执一词,在支持一种....
发表于 2020-01-07 13:38 274次阅读
神经符号人工智能如何书写未来

限制 AI 软件出口是为了什么

使用经过训练的深度卷积神经网络,通过将正样本中的旋转模式与地理空间图像中目标的旋转模式进行匹配,来识....
发表于 2020-01-07 11:33 735次阅读
限制 AI 软件出口是为了什么

一篇机器学习综述,总结了当前机器学习研究的几个方向,并以统计机器学习为重点梳理了几个核心原则

发表于 2019-12-14 00:44 435次阅读
一篇机器学习综述,总结了当前机器学习研究的几个方向,并以统计机器学习为重点梳理了几个核心原则

机器学习的十大经典算法,附有详细原理说明,有助于机器学习的学习和运用

发表于 2019-12-14 00:42 246次阅读
机器学习的十大经典算法,附有详细原理说明,有助于机器学习的学习和运用

BP模糊神经网络纯电动汽车电机控制

针对传统比例积分(PI)控制在电机控制中控制效果不良的问题,设计了一种基于向后传播算法(BP)模糊神经网络的P...
发表于 2019-12-10 16:32 378次阅读
BP模糊神经网络纯电动汽车电机控制

史上最全AI人工智能入门+进阶学习视频全集(200G)【免费领取】

近几年来,人工智能(AI)概念很火热,几乎人人都在学习人工智能,AI市场人才的抢夺也非常的激烈。根据百科的解释...
发表于 2019-11-27 12:10 784次阅读
史上最全AI人工智能入门+进阶学习视频全集(200G)【免费领取】

BiLSTM模型的CRF层是怎么工作的?

BiLSTM模型中CRF层的运行原理-1
发表于 2019-11-06 09:26 124次阅读
BiLSTM模型的CRF层是怎么工作的?

平衡Winnow算法在短信过滤系统上有什么应用?

手机短信以其短小、迅速、简便、价格低廉等优点成为一种重要的通信和交流方式,受到众多人士的青睐。然而, 手机短信与...
发表于 2019-11-01 07:04 150次阅读
平衡Winnow算法在短信过滤系统上有什么应用?

机器学习的回归任务

常见线性回归理论与算法实现
发表于 2019-10-29 11:09 124次阅读
机器学习的回归任务

浅析监督学习算法MLPClassifier

sklearn 神经网络 MLPClassifier简单应用与参数说明...
发表于 2019-10-23 10:46 148次阅读
浅析监督学习算法MLPClassifier

ZCU102,ZCU104和ZCU106有什么区别?

嗨, 看起来ZCU104是ZCU102和ZCU106的升级版本,具有支持机器学习的额外功能,但更便宜? 最好的祝愿, 花...
发表于 2019-10-22 09:19 321次阅读
ZCU102,ZCU104和ZCU106有什么区别?

深入浅出学习机器学习

万万没想到,枯燥的“机器学习”还可以这样学!...
发表于 2019-10-18 14:17 155次阅读
深入浅出学习机器学习

页面底部区域 foot.htm