深度学习入门教程
深度學(xué)習入門教程
1. 引言
在深度學(xué)習十分火熱的今天,不時會涌現(xiàn)出各種新型的人工神經(jīng)網(wǎng)絡(luò),想要實時了解這些新型神經(jīng)網(wǎng)絡(luò)的架構(gòu)還真是不容易 。光是知道各式各樣的神經(jīng)網(wǎng)絡(luò)模型縮寫(如:DCIGN、BiLSTM、DCGAN……還有哪些 ?),就已經(jīng)讓人招架不住了。
因此 ,這里整理出一份清單來梳理所有這些架構(gòu)。其中大部分是人工神經(jīng)網(wǎng)絡(luò),也有一些完全不同的怪物。盡管所有這些架構(gòu)都各不相同 、功能獨特,當我在畫它們的節(jié)點圖時……其中潛在的關(guān)系開始逐漸清晰起來 。
把這些架構(gòu)做成節(jié)點圖,會存在一個問題 :它無法展示神經(jīng)網(wǎng)絡(luò)架構(gòu)內(nèi)部的工作原理 。舉例來說,變分自編碼機(VAE:variational autoencoders )看起來跟自編碼機(AE :autoencoders)差不多,但它們的訓(xùn)練過程卻大不相同。訓(xùn)練后的模型在使用場景上差別更大 :VAE是生成器,通過插入噪音數(shù)據(jù)來獲取新樣本;而AE僅僅是把他們所收到的任何信息作為輸入,映射到“記憶中”最相似的訓(xùn)練樣本上 。
在介紹不同模型的神經(jīng)元和神經(jīng)細胞層之間的連接方式前 ,我們一步一步來,先來了解不同的神經(jīng)元節(jié)點內(nèi)部是如何工作的。
1.1 神經(jīng)元
對不同類型的神經(jīng)元標記不同的顏色,可以更好地在各種網(wǎng)絡(luò)架構(gòu)之間進行區(qū)分。但是 ,這些神經(jīng)元的工作方式卻是大同小異 。在下圖的基本神經(jīng)元結(jié)構(gòu)后面 ,你會看到詳細的講解:
基本的人工神經(jīng)網(wǎng)絡(luò)神經(jīng)元(basic neural network cell)相當簡單,這種簡單的類型可以在常規(guī)的前饋人工神經(jīng)網(wǎng)絡(luò)架構(gòu)里面找到。這種神經(jīng)元與其它神經(jīng)元之間的連接具有權(quán)重,也就是說 ,它可以和前一層神經(jīng)網(wǎng)絡(luò)層中的所有神經(jīng)元有連接 。
每一個連接都有各自的權(quán)重,通常情況下是一些隨機值(關(guān)于如何對人工神經(jīng)網(wǎng)絡(luò)的權(quán)重進行初始化是一個非常重要的話題 ,這將會直接影響到之后的訓(xùn)練過程 ,以及最終整個模型的性能) 。這個權(quán)重可以是負值 ,正值,非常小 ,或者非常大,也可以是零 。和這個神經(jīng)元連接的所有神經(jīng)元的值都會乘以各自對應(yīng)的權(quán)重 。然后,把這些值都求和