Skip to content

Commit

Permalink
chapter_convolutional-neural-networks/index (d2l-ai#899)
Browse files Browse the repository at this point in the history
* end of fix errors in 6.

* change 'pooling' translation from '池化' 到 '汇聚'

* Update index.md

* retrigger

* Update index.md

* retrigiger

Co-authored-by: goldmermaid <[email protected]>
  • Loading branch information
zhuyuanxiang and goldmermaid authored Jul 16, 2021
1 parent 333e6e1 commit 8d396a2
Showing 1 changed file with 17 additions and 4 deletions.
21 changes: 17 additions & 4 deletions chapter_convolutional-neural-networks/index.md
Original file line number Diff line number Diff line change
@@ -1,13 +1,26 @@
# 卷积神经网络
:label:`chap_cnn`

在前面的章节中,我们曾讨论过图像数据。对于图像数据,每个样本都由一个二维像素网格组成。取决于我们处理的是黑白图像还是彩色图像,每个像素可能与一个或多个数值相关。到目前为止,我们处理二维结构的方式还十分有限:先将每个图像的空间结构展平成一维向量,再放入一个多层感知机中。由于这些网络相对于特征元素的顺序不变,所以无论我们保持像素在二维空间的顺序,或是在拟合多层感知机的参数之前对二维矩阵的列进行交换,我们都可以训练相似的神经网络。而最优情况是利用先验知识,即利用相近像素之间的相互关联性,建立图像数据的有效模型。
在前面的章节中,我们遇到过图像数据。
这种数据的每个样本都由一个二维像素网格组成,
每个像素可能是一个或者多个数值,取决于是黑白还是彩色图像。
到目前为止,我们处理这类结构丰富的数据的方式还不够有效。
我们仅仅通过将图像数据展平成一维向量而忽略了每个图像的空间结构信息,再将数据送入一个全连接的多层感知机中。
因为这些网络特征元素的顺序是不变的,因此最优的结果是利用先验知识,即利用相近像素之间的相互关联性,从图像数据中学习得到有效的模型。

本章介绍的卷积神经网络(convolutional neural network,CNN)是一类强大的神经网络,正是为处理图像数据而设计的。基于卷积神经网络结构的模型在计算机视觉领域中已经占主导地位,当今几乎所有的图像识别、对象检测或语义分割相关的学术竞赛、商业应用都以这种方法为基础。
本章介绍的*卷积神经网络*(convolutional neural network,CNN)是一类强大的、为处理图像数据而设计的神经网络。
基于卷积神经网络结构的模型在计算机视觉领域中已经占主导地位,当今几乎所有的图像识别、对象检测或语义分割相关的学术竞赛和商业应用都以这种方法为基础。

现代卷积神经网络的设计得益于生物学、群论和大量的实验研究。除了在获得精确模型的采样效率外,卷积神经网络在计算上也是极其高效的。这是因为卷积神经网络需要的参数比多层感知机少,而且卷积神经网络很容易用GPU并行计算。因此,实践者经常尽可能多地应用卷积神经网络。即使在一维序列结构的任务上(例如音频、文本和时间序列分析),通常大家使用的是循环神经网络,而实践者也会经常使用到卷积神经网络。通过对卷积神经网络一些巧妙的调整,也使它们在图结构数据和推荐系统中发挥作用。
现代卷积神经网络的设计得益于生物学、群论和一系列的补充实验。
卷积神经网络需要的参数少于全连接结构的网络,而且卷积也很容易用GPU并行计算。
因此卷积神经网络除了能够高效地采样从而获得精确的模型,还能够高效地计算。
久而久之,从业人员更能多地应用卷积神经网络,即使在通常使用循环神经网络的一维序列结构任务上(例如音频、文本和时间序列分析),卷积神经网络也越来越受欢迎。
通过对卷积神经网络一些巧妙的调整,也使它们在图结构数据和推荐系统中发挥作用。

在本章的开始,我们将介绍构成所有卷积网络主干的基本元素。这包括卷积层本身、填充(padding)和步幅(stride)、用于在相邻空间区域聚集信息的汇聚层(pooling)、每层中多通道(channel)的使用以及有关现代卷积网络架构的全面介绍。在本章的最后,我们将介绍一个完整的、可运行的LeNet模型:这是第一个卷积神经网络,早在现代深度学习兴起之前就已经得到成功应用。在下一章中,我们将深入研究一些流行的、相对较新并具有一定代表性的卷积网络架构。
在本章的开始,我们将介绍构成所有卷积网络主干的基本元素。
这包括卷积层本身、填充(padding)和步幅(stride)的基本细节、用于在相邻区域的汇聚层(pooling)、在每一层中多通道(channel)的使用,以及有关现代卷积网络架构的仔细讨论。
在本章的最后,我们将介绍一个完整的、可运行的LeNet模型:这是第一个成功应用的卷积神经网络,比现代深度学习兴起时间还要早。
在下一章中,我们将深入研究一些流行的、相对较新的卷积神经网络架构的完整实现,这些网络架构涵盖了现代从业者通常使用的大多数经典技术。

```toc
:maxdepth: 2
Expand Down

0 comments on commit 8d396a2

Please sign in to comment.