近几年来,深度学习和人工智能异常火热,从高校科研人员到小学生都在学习人工智能。那么,到底什么是人工智能和深度学习?
、深度学习与人工智能人工智能(AI,ArtificialIntelligence)是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新技术科学。机器学习(ML,MachineLearning)是人工智能的一种途径或子集,它强调学习而不是计算机程序。
深度学习(DL,DeepLearning)是机器学习领域中一个新的研究方向,它的灵感来源于人类大脑的工作方式,是利用深度神经网络来解决特征表达的一种学习过程。从本质上讲,深度学习和所有机器学习方法一样,是一种用数学模型对真实世界中的特定问题进行建模,以解决该领域内相似问题的过程。
神经网络(NN,NeuralNetwork)最初是一个生物学的概念,一般是指大脑神经元,触点,细胞等组成的网络,用于产生意识,帮助生物思考和行动,后来人工智能受神经网络的启发,发展出了人工神经网络。
人工智能、机器学习、深度学习和神经网络的关系如下图。
2、深度学习的应用领域
机器学习来源于早期的人工智能领域,传统的算法包括回归、神经网络、聚类、支持向量机(SVM)、降维和推荐算法等等。从学习方法上来分,机器学习算法可以分为监督学习(线性回归,逻辑回归,神经网络,SVM)、非监督学习(聚类算法,降维算法)、半监督学习、集成学习、深度学习和强化学习等。
传统的机器学习算法在指纹识别、基于Haar的人脸检测、基于HoG特征的物体检测等领域的应用基本达到了商业化的要求或者特定场景的商业化水平,但每前进一步都异常艰难,直到深度学习算法的出现。
深度学习主要应用于文字识别、人脸技术、语义分析、智能监控等领域。目前,深度学习在计算机视觉、自然语言处理和语音识别等领域的应用效果远超过传统的机器学习方法。
计算机视觉(CV,ComputerVision)是一门研究如何使机器“看”的科学,更进一步的说,就是指用摄影机和电脑代替人眼对目标进行识别、跟踪和测量等机器视觉,并进一步做图形处理,使电脑处理成为更适合人眼观察或传送给仪器检测的图像。
自然语言处理(NLP,NaturalLanguageProcessing)是研究计算机处理人类语言的一门技术,目的是弥补人类交流(自然语言)和计算机理解(机器语言)之间的差距。NLP包含句法语义分析、信息抽取、文本挖掘、机器翻译、信息检索、问答系统和对话系统等领域。
语音识别(SpeechRecognition)又称为自动语音识别(ASR,AutomaticSpeechRecognition),其目标是将人类的语音中的词汇内容转换为计算机可读的输入,例如按键、二进制编码或者字符序列。
3、深度学习常用神经网络模型深度学习常用的神经网络模型包括深度神经网络、卷积神经网络和循环神经网络。
深度神经网络(DNN,DeepNeuralNetwork)又被称为深度前馈网络,可以理解为有很多隐藏层的神经网络。按不同层的位置划分,DNN内部的神经网络层可以分为:输入层,隐藏层和输出层,一般第一层是输入层,最后一层是输出层,而中间的层数都是隐藏层。层与层之间是全连接的,即第i层的任意一个神经元一定与第i+层的任意一个神经元相连。
卷积神经网络(CNN,ConvolutionalNeuralNetwork)是一种前馈型的神经网络(见下图),其在大型图像处理方面有出色的表现,目前已经被大范围使用到图像分类、定位等领域中。CNN包括一维卷积神经网络,二维卷积神经网络以及三维卷积神经网络。一维卷积神经网络主要用于序列类的数据处理,二维卷积神经网络常应用于图像类文本的识别,三维卷积神经网络主要应用于医学图像以及视频类数据识别。目前图像分类中的ResNet,目标检测领域占统治地位的FasterR-CNN,分割中最牛的Mask-RCNN,UNet和经典的FCN都属于卷积神经网络。
循环神经网络(RNN,RecurrentNeuralNetwork),用于解决训练样本输入是连续的序列,且序列的长短不一的问题,比如基于时间序列的问题。基础的神经网络只在层与层之间建立了权连接,RNN最大的不同之处就是在层之间的神经元之间也建立的权连接。RNN神经网络的结构如下:
卷积神经网络在图像处理方面应用效果较好,循环神经网络在自然语言处理方面应用比较广泛。
4、深度学习与遥感影像处理深度学习在遥感影像处理方面的应用主要包括遥感影像分类和目标识别等,其应用领域在不断扩展中。
、遥感影像分类
遥感影像分类是一个复杂的数据处理过程,从传统的目视解译到基于影像的光谱纹理,通过统计模式识别方法(最大似然法、最小距离法、K-均值聚类法),再到机器学习(支持向量机、遗传算法、面向对象方法),遥感影像分类和解译经历了一个长期的发展过程,但自动化程度不高。
深度学习的出现为遥感影像的分类提供了一种新的方法,它是一种深层次结构的神经网络,在影像分类中取得比以往更高的精度,能够更好的推动遥感影像分类往自动化和智能化方向发展。
2、遥感影像目标检测
目标检测的任务是找出图像中所有感兴趣的目标(物体),确定它们的位置和大小。由于各类物体有不同的外观,形状,姿态,加上成像时光照,遮挡等因素的干扰,目标检测一直是机器视觉领域最具有挑战性的问题。在遥感影像处理领域,目标检测是确定航空或卫星影像中是否包含一个或多个属于感兴趣类的目标。
遥感图像目标检测主要使用深度学习中的卷积神经网络,并对其不断扩展和优化。从年到年,从最早的R-CNN、FastR-CNN到后来的YOLOv2、YOLOv3再到M2Det,新模型层出不穷,性能也越来越好。
5、遥感影像分类数据集介绍利用深度学习进行遥感影像分类或目标识别需要使用一定数量的样本进行训练和验证,因此许多科研工作者制作了包含多种分类样本的遥感影像数据集。
、RSD46-WHU数据集
RSD46-WHU由武汉大学肖志峰教授团队制作,它是一个大尺度、开放的遥感影像场景分类数据集,该数据集影像样本来源于谷歌地球和天地图,影像样本最大空间分辨率为0.5m,其他约为2m,样本影像尺寸大小为*。该数据集有46个分类场景,每个分类样本数-个,共有影像样本约.7万个。
下载
转载请注明:http://www.0431gb208.com/sjslczl/793.html