av色综合网,成年片色大黄全免费网站久久,免费大片黄在线观看,japanese乱熟另类,国产成人午夜高潮毛片

公務(wù)員期刊網(wǎng) 精選范文 卷積神經(jīng)網(wǎng)絡(luò)的步驟范文

卷積神經(jīng)網(wǎng)絡(luò)的步驟精選(九篇)

前言:一篇好文章的誕生,需要你不斷地搜集資料、整理思路,本站小編為你收集了豐富的卷積神經(jīng)網(wǎng)絡(luò)的步驟主題范文,僅供參考,歡迎閱讀并收藏。

卷積神經(jīng)網(wǎng)絡(luò)的步驟

第1篇:卷積神經(jīng)網(wǎng)絡(luò)的步驟范文

1.神經(jīng)網(wǎng)絡(luò)的架構(gòu)正變得越來越復(fù)雜。感知和翻譯等大多數(shù)神經(jīng)網(wǎng)絡(luò)的架構(gòu)正變得越來越復(fù)雜,遠(yuǎn)非此前簡單的前饋神經(jīng)網(wǎng)絡(luò)或卷積神經(jīng)網(wǎng)絡(luò)(CNN)所能比。特別需要注意的是,神經(jīng)網(wǎng)絡(luò)正與不同的技術(shù)(如LSTMs、自定義目標(biāo)函數(shù)等)相混合。

神經(jīng)網(wǎng)絡(luò)是多數(shù)深度學(xué)習(xí)項(xiàng)目的根基。深度學(xué)習(xí)基于人腦結(jié)構(gòu),一層層互相連接的人工模擬神經(jīng)元模仿大腦的行為,處理視覺和語言等復(fù)雜問題。這些人工神經(jīng)網(wǎng)絡(luò)可以收集信息,也可以對其做出反應(yīng)。它們能對事物的外形和聲音做出解釋,還可以自行學(xué)習(xí)與工作。

2.長短期記憶網(wǎng)絡(luò)(LSTMs)。當(dāng)你閱讀本文時,你是在理解前面詞語的基礎(chǔ)上來理解每個詞語的。你的思想具有連續(xù)性,你不會丟棄已知信息而從頭開始思考。傳統(tǒng)神經(jīng)網(wǎng)絡(luò)的一大缺陷便無法做到這一點(diǎn),而遞歸神經(jīng)網(wǎng)絡(luò)能夠解決這一問題。

RNN(循環(huán)神經(jīng)網(wǎng)絡(luò))擁有循環(huán)結(jié)構(gòu),可以持續(xù)保存信息。過去幾年里,RNN在語音識別和翻譯等許多問題上取得了難以置信的成功,而成功的關(guān)鍵在于一種特殊的RNN――長短期記憶網(wǎng)絡(luò)。

3.“注意力模型”。“注意力”是指神經(jīng)網(wǎng)絡(luò)在執(zhí)行任務(wù)時知道把焦點(diǎn)放在何處。我們可以讓神經(jīng)網(wǎng)絡(luò)在每一步都從更大的信息集中挑選信息作為輸入。例如,當(dāng)神經(jīng)網(wǎng)絡(luò)為一張圖片生成標(biāo)題時,它可以挑選圖像的關(guān)鍵部分作為輸入。

4.神經(jīng)圖靈機(jī)依然有趣,但還無法勝任實(shí)際工作。當(dāng)你翻譯一句話時,并不會逐詞進(jìn)行,而會從句子的整體結(jié)構(gòu)出發(fā)。機(jī)器難以做到這一點(diǎn),這一挑戰(zhàn)就被稱為“強(qiáng)耦合輸出整體估計(jì)”。

神經(jīng)圖靈機(jī)就是研究者們在硅片中重現(xiàn)人類大腦短期記憶的嘗試。它的背后是一種特殊類型的神經(jīng)網(wǎng)絡(luò),它們可以適應(yīng)與外部存儲器共同工作,這使得神經(jīng)網(wǎng)絡(luò)可以存儲記憶,還能在此后檢索記憶并執(zhí)行一些有邏輯性的任務(wù)。

5.深度學(xué)習(xí)讓計(jì)算機(jī)視覺和自然語言處理不再是孤島。卷積神經(jīng)網(wǎng)絡(luò)最早出現(xiàn)在計(jì)算機(jī)視覺中,但現(xiàn)在許多自然語言處理(NLP)系統(tǒng)也會使用。LSTMs與遞歸神經(jīng)網(wǎng)絡(luò)深度學(xué)習(xí)最早出現(xiàn)在NLP中,但現(xiàn)在也被納入計(jì)算機(jī)視覺神經(jīng)網(wǎng)絡(luò)。

此外,計(jì)算機(jī)視覺與NLP的交匯仍然擁有無限前景。

6.符號微分式越來越重要。隨著神經(jīng)網(wǎng)絡(luò)架構(gòu)及其目標(biāo)函數(shù)變得日益復(fù)雜,手動推導(dǎo)出“反向傳播”的梯度也變得更加困難而且容易出錯。谷歌的TensorFlow等最新的工具包已經(jīng)可以超負(fù)荷試驗(yàn)符號微分式,能夠自動計(jì)算出正確的微分,以確保訓(xùn)練時誤差梯度可被反向傳播。

7.神經(jīng)網(wǎng)絡(luò)模型壓縮的驚人成果。多個團(tuán)隊(duì)以不同方法大幅壓縮了訓(xùn)練一個良好模型所需的素材體量,這些方法包括二值化、固定浮點(diǎn)數(shù)、迭代修剪和精細(xì)調(diào)優(yōu)步驟等。

這些技術(shù)潛在的應(yīng)用前景廣闊,可能將會適應(yīng)在移動設(shè)備上進(jìn)行復(fù)雜模型的訓(xùn)練。例如,不需要延遲就可以得到語音識別結(jié)果。此外,如果運(yùn)算所需要的空間和時間極大降低,我們就可以極高幀率(如30 FPS)查詢一個模型,這樣,在移動設(shè)備上也可以運(yùn)用復(fù)雜神經(jīng)網(wǎng)絡(luò)模型,近乎實(shí)時地完成計(jì)算機(jī)視覺任務(wù)。

8.深度學(xué)習(xí)和強(qiáng)化學(xué)習(xí)繼續(xù)交匯。在“端對端”機(jī)器人等領(lǐng)域出現(xiàn)了令人激動的進(jìn)展,現(xiàn)在機(jī)器人已經(jīng)可以一起運(yùn)用深度和強(qiáng)化學(xué)習(xí),從而將原始感官數(shù)據(jù)直接轉(zhuǎn)化為實(shí)際動作驅(qū)動。我們正在超越“分類”等簡單工作,嘗試將“計(jì)劃”與“行動”納入方程。

第2篇:卷積神經(jīng)網(wǎng)絡(luò)的步驟范文

【關(guān)鍵詞】神經(jīng)網(wǎng)絡(luò);故障測距;小波包;相對誤差

0 引言

我國礦井配電網(wǎng)多為6kV單側(cè)電源供電系統(tǒng),采取中性點(diǎn)非有效接地方式,屬于小電流接地系統(tǒng)(NUGS)。饋電回路選用多段短電纜徑向延伸為各種井下高低壓電機(jī)、電氣設(shè)備、照明及各種通信、自動化裝置和儀表、儀器提供電能。由于井下工作環(huán)境惡劣,供電電纜經(jīng)常發(fā)生接地、斷線、短路等故障,據(jù)電力部門統(tǒng)計(jì),其中單相接地故障的發(fā)生率最高。盡管發(fā)生單相接地故障時,線電壓仍然對稱,暫時不影響對負(fù)荷的連續(xù)供電,但就礦井這類危險(xiǎn)易爆場所而言,當(dāng)發(fā)生單相接地故障時,應(yīng)盡快跳閘斷電以確保安全。為此,必須及時對故障點(diǎn)進(jìn)行定位、排除故障、加快恢復(fù)線路供電。

NUGS饋線的故障定位問題一直以來未得到滿意的解決,這與其自身的特點(diǎn)有關(guān)。由于電網(wǎng)變壓器中性點(diǎn)不直接接地,造成單相接地電流無法形成小阻抗回路,故障電流主要由線路對地電容電流提供,其數(shù)值較小,且基波分量幅值故障前后變化不大,使得定位保護(hù)裝置很難準(zhǔn)確進(jìn)行故障選線和定位??紤]到井下環(huán)境條件和負(fù)荷的特殊性,礦井配電網(wǎng)與傳統(tǒng)意義上的NUGS存在一定的差異:單相接地產(chǎn)生的暫態(tài)分量較穩(wěn)態(tài)分量大得多,暫態(tài)波形畸變嚴(yán)重,應(yīng)研究利用暫態(tài)電氣量進(jìn)行故障測距的可行性;饋電線路分支少、長度短,對測距精度要求高[1]。

鑒于上述原因,本文就井下配電網(wǎng)故障測距問題進(jìn)行研究,以期提高故障測距的精度和可靠性。

1 BP網(wǎng)絡(luò)的結(jié)構(gòu)和算法

BP網(wǎng)絡(luò)結(jié)構(gòu)上類似于多層感知器,是一種多層前饋神經(jīng)網(wǎng)絡(luò),網(wǎng)絡(luò)權(quán)值的訓(xùn)練算法為誤差反向傳播(BP)學(xué)習(xí)算法。如圖1所示為一典型3層BP網(wǎng)絡(luò)模型。

圖1 3層BP網(wǎng)絡(luò)模型

以圖示BP網(wǎng)絡(luò)模型為例說明網(wǎng)絡(luò)的學(xué)習(xí)過程:

(1)初始化。為每個連接權(quán)值wij、wjt、閥值θj、θt賦予(-1,1)區(qū)間的隨機(jī)值。

(2)給定輸入輸出目標(biāo)樣本。給定輸入向量Xp=(x1,x2,...,xn)和期望目標(biāo)向量Tp=(t1,t2,...,tm),p∈1,2,...,P。

(3)計(jì)算網(wǎng)絡(luò)各層的輸出。由輸入樣本、連接權(quán)值、閥值及各層神經(jīng)元傳遞函數(shù)計(jì)算隱含層和輸出層的輸出。

(4)計(jì)算網(wǎng)絡(luò)實(shí)際輸出與期望輸出的一般化誤差。系統(tǒng)的目標(biāo)函數(shù)為:

E=■■■(t■-y■)2=■E■(1)

網(wǎng)絡(luò)通過調(diào)整權(quán)值和閥值使?jié)M足預(yù)先設(shè)定的一個極小值。

(5) 利用目標(biāo)函數(shù)調(diào)整網(wǎng)絡(luò)的權(quán)值和閥值。BP算法按照目標(biāo)函數(shù)梯度的反方向?qū)W(wǎng)絡(luò)參數(shù)進(jìn)行調(diào)整,使目標(biāo)函數(shù)收斂,即實(shí)際輸出接近目標(biāo)輸出。對于第p個輸入樣本的權(quán)值、閥值,按下式修正,式中?濁為學(xué)習(xí)速率。

?駐w=-?濁■, ?駐θ=-?濁■(2)

對應(yīng)的權(quán)值、閥值按下式調(diào)整,式中為迭代步數(shù)。

w(k+1)=w(k)+?駐wθ(k+1)=θ(k)+?駐θ(3)

(6)隨機(jī)選擇下一組學(xué)習(xí)樣本向量進(jìn)行訓(xùn)練,直到P個樣本對訓(xùn)練完畢。

(7)重新從P個學(xué)習(xí)樣本中隨機(jī)選取一組輸入、目標(biāo)樣本對,返回步驟(3),直到目標(biāo)函數(shù)E收斂于給定值,若訓(xùn)練次數(shù)大于設(shè)定的最大訓(xùn)練次數(shù),則網(wǎng)絡(luò)不收斂。

由于BP算法學(xué)習(xí)速率為固定值,收斂速度較慢,且可能會產(chǎn)生多個局部極小值,另外網(wǎng)絡(luò)的隱含層層數(shù)和神經(jīng)元數(shù)目的選擇尚無理論指導(dǎo),因此網(wǎng)絡(luò)具有較大的冗余性。為了克服以上不足,提出了許多改進(jìn)算法,從改進(jìn)途徑上分為兩類:

一類為啟發(fā)式學(xué)習(xí)算法,如動量BP算法、彈性算法、學(xué)習(xí)率可變的BP算法等;另一類為快速優(yōu)化算法,如擬牛頓算法、LM算法等。

2 基于BP小波神經(jīng)網(wǎng)絡(luò)的故障測距

小波包具有正交特性、信號分解后的信息量是完整的,因此利用小波包算法分析信號頻率的分布情況,能夠有效提取信號的暫態(tài)特征。對于電纜線路而言,其暫態(tài)零序電流的自由振蕩頻率一般在1500~3000Hz之間[2-3]。本文利用小波包提取該頻段的暫態(tài)零序電流信號模極大值作為神經(jīng)網(wǎng)絡(luò)模型的輸入,以期實(shí)現(xiàn)高精度的故障測距。

2.1 小波基的選擇

在利用小波包提取模極大值時,小波基的選擇十分重要,選擇不同的小波基對信號進(jìn)行分解,可以突出不同特點(diǎn)的信號特征。Daubechies小波系是信號分析處理中常用的一類小波,具有緊支性、正交性,滿足精確重構(gòu)條件,但由于其不具有對稱性,因而其邊界效應(yīng)會隨尺度的增加而擴(kuò)大,引起分解誤差;Morlet小波常用于信號表示、圖像特征的提取和識別;Mexican hat小波則用于系統(tǒng)辨識。

3次B樣條小波是一種具有線性相位的緊支對稱小波,分頻能力強(qiáng),頻帶相干小,由于具有對稱性,只要采取合理的延拓方式,其邊界效應(yīng)引起的誤差可忽略不計(jì)。

B樣條基函數(shù)的遞推公式如下:

N■(x)=1,x■≤x≤x■0,x?埸x■,x■N■(x)=■N■(x)+■N■(x)(4)

3次B樣條基函數(shù)N■(x)在xi,xi+4上具有局部支集性,表達(dá)式如(5)所示。

(5)若取參數(shù)x■=i(i=0,1,...,n)為節(jié)點(diǎn)即為均勻B樣條基,再對均勻B樣條基作參數(shù)變換,在每個子區(qū)間內(nèi)以參數(shù)代換,在每個子區(qū)間的值均為u0,1。3次B樣條基函數(shù)的表達(dá)式如式6所示。

由于二進(jìn)小波包變換具有平移不變性,不會引起正交小波包變換在所分析信號不連續(xù)處產(chǎn)生的偽吉布斯現(xiàn)象[4]。故本文利用3次B樣條小波包對短路故障電流進(jìn)行卷積型二進(jìn)小波包分解,以期獲得更顯著的故障特征信息。

N■(x)=■,x■≤x≤x■■+■,x■≤x≤x■■+■,x■≤x≤x■■,x■≤x≤x■0,x?埸x,x■

(5)

N■(u)=■u3■(-3u3+3u2+3u+1)■(3u3-6u2+4)■(-u3+3u2-3u+1) 0≤u≤1(6)

2.2 分解尺度的選擇

如何選擇分解尺度對于零序電流暫態(tài)分量的模極大值提取至關(guān)重要,尺度取得越大,信號與噪聲的表現(xiàn)差異越明顯,越有利于兩者的分離。但分解尺度取得越大,則對應(yīng)的頻帶寬度越窄,采樣點(diǎn)數(shù)過小,不利于下一步的信號分析[5-7]。

由于本文仿真的采樣頻率取1MHz,則Nyquist頻率為5kHz,為提取暫態(tài)零序電流1500~3000Hz頻率段分量,小波包分解層數(shù)為3,考慮小波包頻帶劃分規(guī)則,?。?,3)、(3,7)頻帶的零序電流暫態(tài)分量即可滿足要求。

2.3 BP網(wǎng)絡(luò)結(jié)構(gòu)參數(shù)的選擇

欲利用BP小波神經(jīng)網(wǎng)絡(luò)計(jì)算井下配電網(wǎng)故障測距,必須首先確定BP網(wǎng)絡(luò)的結(jié)構(gòu)和參數(shù),如各層的初始權(quán)值、閥值,學(xué)習(xí)速率,各層節(jié)點(diǎn)數(shù)、傳遞函數(shù)等,只有確定了網(wǎng)絡(luò)的最佳配置,才能有效解決所提出的問題[8]。

(1)網(wǎng)絡(luò)層數(shù)的確定。Hecht-Nielsen已經(jīng)證明,在不限制隱層節(jié)點(diǎn)數(shù)的情況下,含有一個隱層的BP網(wǎng)絡(luò)能夠?qū)崿F(xiàn)任意非線性映射。Cybenko指出,當(dāng)隱層傳遞函數(shù)選用S型傳遞函數(shù)時,單隱層足以滿足解決任意判決分類問題的需要,兩個隱層則能夠?qū)崿F(xiàn)輸入圖形的映射。增加隱層數(shù)可以進(jìn)一步提高精度,但同時會增加網(wǎng)絡(luò)權(quán)值的訓(xùn)練時間。另外,增加隱層神經(jīng)元個數(shù)也能降低誤差,訓(xùn)練效果也更易觀察,因此,應(yīng)優(yōu)先考慮增加隱含層神經(jīng)元的個數(shù)。對于本文研究的故障測距問題,網(wǎng)絡(luò)需要較快的收斂速度,因此采用單隱層網(wǎng)絡(luò)。

(2)各層節(jié)點(diǎn)數(shù)目的確定。網(wǎng)絡(luò)輸入層節(jié)點(diǎn)數(shù)等于輸入向量的維數(shù)。由于井下電網(wǎng)大多數(shù)實(shí)時運(yùn)行參數(shù)如負(fù)荷、系統(tǒng)等效阻抗可由監(jiān)控終端獲得,其它隨機(jī)性因素如發(fā)生故障線路、故障時刻可由故障后可測信息準(zhǔn)確識別,不可知變化因素僅包括接地過渡電阻及故障點(diǎn)位置,并且神經(jīng)網(wǎng)絡(luò)的內(nèi)插性能優(yōu)于外推性能,故輸入向量維數(shù)等于3,分別為(3,3)、(3,7)頻帶零序電流暫態(tài)分量的模極大值和故障點(diǎn)過渡電阻值。輸出層節(jié)點(diǎn)數(shù)為1,表示故障點(diǎn)位置。隱含層節(jié)點(diǎn)數(shù)的選擇比較復(fù)雜,需要依據(jù)經(jīng)驗(yàn)和經(jīng)過多次實(shí)驗(yàn)確定,選取過多將導(dǎo)致學(xué)習(xí)時間過長,過少將引起容錯性差,對未經(jīng)學(xué)習(xí)的樣本識別能力低。根據(jù)Hebe準(zhǔn)則可以確定最佳隱含層節(jié)點(diǎn)數(shù)的參考值。另外,也可先令隱含層節(jié)點(diǎn)數(shù)可變,開始時給以較小數(shù)值,學(xué)習(xí)到給定訓(xùn)練次數(shù)最大值,若未達(dá)到收斂精度則再增加節(jié)點(diǎn)數(shù),直至達(dá)到合理數(shù)值為止。經(jīng)過多次仿真訓(xùn)練,隱層節(jié)點(diǎn)數(shù)為11時,網(wǎng)絡(luò)的訓(xùn)練誤差最小。

(3)初始權(quán)值的選取。初始權(quán)值的選擇對于網(wǎng)絡(luò)能否收斂和訓(xùn)練的速度關(guān)系密切。若權(quán)值選擇過大,會使加權(quán)輸入處于激勵函數(shù)的飽和區(qū),導(dǎo)致無法進(jìn)行權(quán)值的調(diào)整。威得羅等人提出一種權(quán)值初定策略,選擇權(quán)值的量級為S1的r次方,其中S1為第一層神經(jīng)元數(shù)目,利用此方法可以在較少的訓(xùn)練次數(shù)下獲得滿意的訓(xùn)練結(jié)果。本文選擇的輸入層及隱含層至輸出層的初始權(quán)值均為0.25。

(4)訓(xùn)練算法的選擇。給定一個具體問題,采用何種訓(xùn)練算法對于是否能夠達(dá)到目標(biāo)誤差及網(wǎng)絡(luò)收斂速度的影響很大。就中等規(guī)模的前饋神經(jīng)網(wǎng)絡(luò)而言,LM算法的訓(xùn)練函數(shù)trainlm可以獲得比其它任何一種算法更小的均方誤差,且收斂速度最快,在精度要求較高時,該算法的優(yōu)點(diǎn)尤其突出。本文選擇LM算法對BP網(wǎng)絡(luò)進(jìn)行訓(xùn)練。

(5)學(xué)習(xí)速率的選擇。一般情況下傾向于選擇較小的學(xué)習(xí)速率以保證訓(xùn)練過程的穩(wěn)定性,但是過小的學(xué)習(xí)速率會導(dǎo)致訓(xùn)練時間過長,收斂速度很慢,無法保證網(wǎng)絡(luò)的誤差值跳出誤差曲面的低谷而最終趨于最小誤差,一般選擇范圍在0.01~0.9之間。

3 系統(tǒng)仿真及測距結(jié)果

深井供電系統(tǒng)仿真模型如圖2所示。各模塊參數(shù)如下:進(jìn)線電纜(In line)采用YJV42,線路正序參數(shù)為:R1=0.078/km,L1=0.27mH/km,C1=0.695F/km,零序參數(shù)為:R0=0.106/km,L0=1.223mH/km,C0=0.358F/km;配電電纜(Line)采用YJV32;采區(qū)電纜(Mine line)、負(fù)荷電纜(Load line)采用UPQ,正序參數(shù)為:R1=0.024/km,L1=0.516mH/km,C1=0.308F/km,零序參數(shù)為:R0=0.196/km,L0=3.98mH/km,C0=0.203F/km;采區(qū)變壓器(MineT1)型號為KBSG-200/6/0.69kV,Ud%=4%,I0%=2.5%;隔爆移動變電站(MineT2)選用KBSGZY-315/6/1.2kV,P0=1400W,Pd=2200W。負(fù)荷變壓器采用SL7-100/6/0.4kV。線路長度分別為:進(jìn)線電纜取1km;

配電電纜1、3、4取0.5km;配電電纜2取0.4km;采區(qū)電纜長度均取0.3km;負(fù)荷電纜取0.2km。電源線電壓有效值6.3kV,X/R ratio=7。

考慮配電線路1在不同故障點(diǎn)位置和過渡電阻下發(fā)生單相接地故障(數(shù)據(jù)窗取故障前1ms至故障后4ms共5ms)得到的暫態(tài)零序電流經(jīng)小波包分析后(3,3)、(3,7)頻帶的模極大值(為防止邊界效應(yīng)引起的信號值突變,取前2000個采樣值進(jìn)行模極大值分析)經(jīng)歸一化處理后所形成的訓(xùn)練和測試樣本集,對BP網(wǎng)絡(luò)進(jìn)行訓(xùn)練,并測試網(wǎng)絡(luò)的測距性能。

選取的訓(xùn)練樣本集如下:

(1)過渡電阻值分別為0.01、5、50、100、150、200、250、300、350、400、450、500;

(2)在靠近線路兩端發(fā)生故障時,應(yīng)適當(dāng)減小故障距離以提高測距精度。故障點(diǎn)位置分別為:0.01km、0.02km、0.025km、0.075km、0.125km、0.175km、0.225km、0.25km、0.3km、0.325km、0.375km、0.425km、0.475km、0.48km、0.49km。

組合兩因素可形成12×15=180個訓(xùn)練樣本集。

訓(xùn)練誤差曲線如圖3所示,經(jīng)2794次迭代后誤差收斂于0.00099829,基本達(dá)到了設(shè)定的目標(biāo)誤差0.001。

為檢驗(yàn)訓(xùn)練后BP網(wǎng)絡(luò)的推廣能力即測距效果,采用非訓(xùn)練樣本集進(jìn)行測試,選取的測試樣本集如下圖3:

圖3 BP網(wǎng)絡(luò)訓(xùn)練誤差性能曲線

(1)過渡電阻值分別為25、75、125、175、225、275、325、375、425、475;

(2)故障點(diǎn)位置分別為0.015km、0.05km、0.1km、0.15km、0.2km、0.275km、0.35km、0.4km、0.45km、0.485km。

組合兩因素形成10×10=100個測試樣本集。

對于給定的測試樣本集,經(jīng)BP網(wǎng)絡(luò)前饋運(yùn)算得到的實(shí)際測距結(jié)果及相對誤差分別如表1、表2所示。

其中,L表示實(shí)際故障距離,l表示測量距離。

相對誤差e=(實(shí)際故障距離-測量距離)線路總長×100%。

由表2可知,對于測試樣本集,訓(xùn)練后的BP網(wǎng)絡(luò)測距相對誤差隨過渡電阻值的增加有增大的趨勢,最大誤差達(dá)到了-16.56%,且出現(xiàn)在過渡電阻為475時,同時注意到在故障點(diǎn)接近線路兩端時,由于適當(dāng)增加了訓(xùn)練樣本,測距相對誤差明顯減小,因此,通過增加訓(xùn)練樣本數(shù)量有望進(jìn)一步提高測距精度。

4 結(jié)論

通過研究得出以下結(jié)論:

1)采用小波包提取故障暫態(tài)零序電流的模極大值能有效表征故障時所蘊(yùn)含的物理現(xiàn)象,為準(zhǔn)確進(jìn)行故障測距提供了有效的數(shù)據(jù)。

2)BP神經(jīng)網(wǎng)絡(luò)具有良好的分類及擬合功能,能在獲得大量樣本數(shù)據(jù)的基礎(chǔ)上,訓(xùn)練出符合要求的前饋型網(wǎng)絡(luò),為煤礦井下電網(wǎng)故障測距提供強(qiáng)有力的手段。從測距相對誤差結(jié)果來看,基于小波分析與BP神經(jīng)網(wǎng)絡(luò)的故障測距方法能基本滿足測距要求。另外,本文下一步的工作將在樣本集數(shù)量、網(wǎng)絡(luò)結(jié)構(gòu)等方面進(jìn)行更為深入的研究。

【參考文獻(xiàn)】

[1]丁恩杰,王超楠,崔連成.礦井配電網(wǎng)輸電線路故障測距方法的研究[J].中國礦業(yè)大學(xué)學(xué)報(bào),2006,35(3):311-316.

[2]竇新宇,李春明.小電流接地系統(tǒng)行波測距方法研究[J].電力科學(xué)與工程,2010,26(2):51-53.

[3]季濤.基于暫態(tài)行波的配電線路故障測距研究[D].濟(jì)南:山東大學(xué),2006.

[4]姚李孝,趙化時,柯麗芳,等.基于小波相關(guān)性的配電網(wǎng)單相接地故障測距[J].電力自動化設(shè)備,2010,30(1):71-74.

第3篇:卷積神經(jīng)網(wǎng)絡(luò)的步驟范文

關(guān)鍵詞:堆疊去噪自編碼器;垃圾郵件;分類;支持向量機(jī);貝葉斯方法

中圖分類號: TP393.098

文獻(xiàn)標(biāo)志碼:A

0引言

電子郵件因?yàn)橐子谑褂?、速度快、溝通方便等原因,已?jīng)成為人們重要的聯(lián)系方式,但與此同時,垃圾郵件的數(shù)量卻急劇地增加:卡巴斯基實(shí)驗(yàn)室的研究發(fā)現(xiàn),2014年第1季度的垃圾郵件數(shù)目占總郵件的66.34%;McAfee實(shí)驗(yàn)室2015年2月的威脅報(bào)告表明,2014年,垃圾郵件數(shù)量大概為31.2萬億,占該年郵件總量的69.02%。其中大部分垃圾郵件帶有商業(yè)性質(zhì),但有些郵件可能會包含病毒和其他具有危害性質(zhì)的內(nèi)容,給用戶帶來精力的損耗和財(cái)力上的損失,文獻(xiàn)[1]表明,由于垃圾郵件的原因,美國接近360萬用戶的損失高達(dá)32億美元。大量的垃圾郵件同時造成帶寬浪費(fèi)和郵件系統(tǒng)超載。

垃圾郵件過濾方法用來解決上述問題。垃圾郵件過濾的目的是為了隔離垃圾郵件和合法郵件。一般的過濾方式包括:郵件客戶端擴(kuò)展和郵件服務(wù)終端過濾過程,簡單郵件傳送協(xié)議(Simple Mail Transfer Protocol,SMTP)和基于機(jī)器學(xué)習(xí)算法的方法是最常用的垃圾郵件過濾方法。一般來說,基于SMTP的過濾方法通常是指SMTP流量的檢測、電子郵件交換路由驗(yàn)證和經(jīng)過身份驗(yàn)證的SMTP會話?;趩l(fā)式規(guī)則的方法、黑名單/白名單的方法、協(xié)同垃圾郵件過濾也可以用來過濾垃圾郵件。機(jī)器學(xué)習(xí)方法包括郵件的分析和分類算法的部署。

文獻(xiàn)[2]表明在諸多過濾方法中,機(jī)器學(xué)習(xí)算法獲得更多的應(yīng)用和更好的性能。貝葉斯過濾器因?yàn)橛?jì)算效率高、過濾性能良好得到了廣泛的應(yīng)用,文獻(xiàn)[3]比較了7個版本的貝葉斯過濾器,得出布爾樸素貝葉斯(Boolean Naive Bayes)、多項(xiàng)式布爾樸素貝葉斯(Multinomial Boolean Naive Bayes)、基本樸素貝葉斯(Basic Naive Bayes)具有較好的性能;文獻(xiàn)[4]提出了一些方法用來改進(jìn)樸素貝葉斯過濾器,提高了過濾器的準(zhǔn)確率; 文獻(xiàn)[5]將不同種類核函數(shù)和數(shù)據(jù)表示的支持向量機(jī)應(yīng)用到垃圾郵件過濾中;文獻(xiàn)[6]提出了混合Taguchi方法、Staelin方法來優(yōu)化支持向量機(jī)參數(shù)的選擇過程,并且提高了準(zhǔn)確率。其他的諸如隨機(jī)隨林、人工神經(jīng)網(wǎng)絡(luò)、提升方法(boosting)和裝袋(bagging)等方法也被應(yīng)用到了垃圾郵件過濾。近年來隨著社交網(wǎng)絡(luò)、云計(jì)算、網(wǎng)格計(jì)算、語義網(wǎng)絡(luò)等技術(shù)的發(fā)展,出現(xiàn)了許多基于上述技術(shù)的垃圾郵件分類器;隨著垃圾郵件中圖像的增加,出現(xiàn)了基于圖像的垃圾郵件分類器,文獻(xiàn)[7]對新技術(shù)和圖像分類應(yīng)用進(jìn)行了介紹。文獻(xiàn)[8]比較了不同的特征選擇和降維技術(shù)對垃圾郵件過濾的影響。文獻(xiàn)[9]研究表明:相對支持向量機(jī)(Support Vector Machine, SVM)、提升方法(boosting)、最大熵方法等“淺層學(xué)習(xí)”方法而言,深度學(xué)習(xí)所學(xué)得的模型中,非線性操作的層級數(shù)更多。 淺層學(xué)習(xí)依靠人工經(jīng)驗(yàn)抽取樣本特征,網(wǎng)絡(luò)模型學(xué)習(xí)后獲得的是沒有層次結(jié)構(gòu)的單層特征;而深度學(xué)習(xí)通過對原始信號進(jìn)行逐層特征變換,將樣本在原空間的特征表示變換到新的特征空間,自動地學(xué)習(xí)得到層次化的特征表示。

去噪自編碼器(Denoising Autoencoder, DA)是深度學(xué)習(xí)中的變形結(jié)構(gòu),和受限玻爾茲曼機(jī)、自編碼器[9](Autoencoder)一樣作為深度學(xué)習(xí)架構(gòu)中的訓(xùn)練模塊,具有良好的學(xué)習(xí)數(shù)據(jù)集特征的能力。通過多個DA的堆疊可形成堆疊去噪自編碼器(Stacked Denoising Autoencoder,SDA) [10]。SDA訓(xùn)練過程中的無監(jiān)督學(xué)習(xí)過程和對數(shù)據(jù)的破壞過程,能進(jìn)一步學(xué)習(xí)到數(shù)據(jù)集中的特征和數(shù)據(jù)結(jié)構(gòu),同時學(xué)習(xí)得到的隱含表示更適用于有監(jiān)督分類。文獻(xiàn)[11]的研究表明,在大部分情況下,SDA要優(yōu)于深度置信網(wǎng)絡(luò)[9](Deep Belief Network, DBN),并且因?yàn)镾DA不需要吉布斯采樣,所以訓(xùn)練更加容易。

本文將一個5層神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)的堆疊去噪自編碼器應(yīng)用到垃圾郵件過濾,在6個公開數(shù)據(jù)集上進(jìn)行測試,使用準(zhǔn)確率、召回率和馬修斯相關(guān)系數(shù)作為測量標(biāo)準(zhǔn),與在垃圾郵件過濾中應(yīng)用最為廣泛的支持向量機(jī)算法、3種貝葉斯算法和DBN進(jìn)行比較。結(jié)果表明,相對于其他幾種算法:堆疊去噪自編碼具有最好的平均性能和較好的預(yù)測能力。

1堆疊去噪自編碼器

1.1去噪自編碼器

自編碼器 (Autoencoder) [9]的學(xué)習(xí)只是簡單地保留原始輸入數(shù)據(jù)的信息,并不能確保獲得一種有用的特征表示。因?yàn)樽跃幋a器可能僅僅簡單地拷貝原始輸入,或者簡單地選取能夠稍微改變重構(gòu)誤差,卻不包含特別有用信息的特征。為了避免上述情況,并且能夠?qū)W習(xí)更好的特征表示,需要給數(shù)據(jù)表示一定的約束。去噪自編碼器可以通過重構(gòu)含有噪聲的輸入數(shù)據(jù)來解決該問題。

去噪自編碼器所要實(shí)現(xiàn)的功能就是學(xué)習(xí)疊加噪聲的原始數(shù)據(jù),而它學(xué)習(xí)到的特征與從未疊加噪聲的數(shù)據(jù)學(xué)到的特征幾乎一樣, 但去噪自編碼器從疊加噪聲的輸入中學(xué)習(xí)得到的特征更具魯棒性,并且可以避免自編碼器遇到的上述問題,簡單地學(xué)習(xí)相同的特征值。

去噪自編碼器通過一個隨機(jī)的映射變換x~qD(x′|x),對原始輸入數(shù)據(jù)x進(jìn)行“破壞”,從而得到一個有部分損壞的數(shù)據(jù)x′, 其中D表示數(shù)據(jù)集。

去噪自編碼器由編碼器(encoder)、解碼器(decoder)和隱含層組成。編碼器是輸入x∈[0,1]d 的”破壞”版本x′到隱含表示 y∈[0,1]d′的映射,表示為:

y=fθ(x)=s(Wx′+b)(1

這個映射的參數(shù)集合是θ={W,b},s是一個非線性的函數(shù),例如sigmoid,W是一個的d×d′權(quán)值矩陣, b是一個偏置向量。

解碼器函數(shù)gθ′(y)將隱含表示映射回重構(gòu)表示z∈[0,1]d,表示為:

z=gθ′(y)=s(W′y+b′)(2

這個映射的參數(shù)集合是θ′={W′,b′},逆映射的權(quán)值矩陣W′可被約束為權(quán)值矩陣W的轉(zhuǎn)置:即W′=WT,被稱為去噪自編碼器捆綁權(quán)重。b′是一個偏置向量。

這樣每個訓(xùn)練樣例x(i)被映射成一個y(i)和一個重構(gòu)表示z(i),然后通過不斷地調(diào)準(zhǔn)優(yōu)化這個模型的所有參數(shù),從而獲得最小平均重構(gòu)誤差:

L(x,z)=x-z2(3)

使z盡可能地接近初始輸入x,并且z是x′的函數(shù)。 定義聯(lián)合分布函數(shù)為:

q0(X,X′,Y)=q0(X)qD(X′X)δfθ(X′)(Y)(4)

其中:X,X′,Y是隨機(jī)變量,Y是X′的映射函數(shù), q0(X,X′,Y)以θ為參數(shù)。這時就可以通過梯度下降算法最小化目標(biāo)函數(shù):

arg minθ,θ′ Eq0(X,X′)[L(X,gθ′(fθ(X′)))](5

去噪自編碼器的結(jié)構(gòu)圖如圖1所示。

圖片

圖1去噪自編碼器結(jié)構(gòu)

1.2堆疊去噪自編碼器

深度神經(jīng)網(wǎng)絡(luò)可以分為3類:1)生成性深度結(jié)構(gòu),描述數(shù)據(jù)和相應(yīng)類別的聯(lián)合概率分布,如DBN; 2)區(qū)分性深度結(jié)構(gòu),提供對模式分類的區(qū)分性能力,通常描述數(shù)據(jù)的后驗(yàn)分布,如卷積網(wǎng)絡(luò)和堆疊去噪自編碼器; 3)混合型結(jié)構(gòu),目標(biāo)是區(qū)分性的,但通常利用生成型結(jié)構(gòu)的輸出會更易優(yōu)化。

通常情況下,由于網(wǎng)絡(luò)權(quán)值的隨機(jī)初始化,基于梯度的優(yōu)化容易陷入局部最小值。文獻(xiàn)[12]提出了一種新的貪婪逐層非監(jiān)督算法來初始化深度學(xué)習(xí)網(wǎng)絡(luò),文獻(xiàn)[10]使用此算法來初始化基于降噪自編碼器的堆疊去噪自編碼器。訓(xùn)練整個網(wǎng)絡(luò)的參數(shù)后,在使用基于梯度的算法如梯度下降法來微調(diào)網(wǎng)絡(luò)參數(shù)。SDA初始化方法的有效性[13]在多個數(shù)據(jù)集中得到驗(yàn)證。正如受限玻爾茲曼機(jī)的堆疊形成深度置信網(wǎng)絡(luò),去噪自編碼器的堆疊可形成堆疊去噪自編碼器。用疊加噪聲輸入訓(xùn)練每層網(wǎng)絡(luò)的去噪能力,這樣訓(xùn)練出來的每層編碼器可作為一個具有容錯性能的特征提取器,同時學(xué)習(xí)得到的特征表示具有更好的健壯性。

SDA 的網(wǎng)絡(luò)結(jié)構(gòu)如圖2 所示。通過圖1中的步驟首先破壞原始數(shù)據(jù),然后最小化重構(gòu)誤差,訓(xùn)練第1層去噪自編碼器,從而學(xué)習(xí)得到了編碼器函數(shù)fθ。接下來使用此函數(shù)學(xué)習(xí)原始的數(shù)據(jù)(如圖2(a)所示),得到的結(jié)果作為第2層去噪自編碼器的輸入,用來訓(xùn)練第2層的去噪自編碼器(如圖2(b)所示),從而學(xué)習(xí)到第2層的編碼器函數(shù)f(2)θ。然后重復(fù)這一過程(如圖2(c)所示),直至所有的去噪編碼器層都已經(jīng)訓(xùn)練完成為止。

圖片

圖2堆疊去噪自編碼器的結(jié)構(gòu)

為了讓堆疊去噪編碼器具有分類識別的功能,需要在堆疊自編碼器神經(jīng)網(wǎng)絡(luò)的最后一個隱藏層之后加個sigmoid分類器,將整個神經(jīng)網(wǎng)絡(luò)訓(xùn)練成能完成分層特征提取和數(shù)據(jù)分類任務(wù)的多重感知器。然后利用有監(jiān)督學(xué)習(xí)規(guī)則,在監(jiān)督學(xué)習(xí)損失函數(shù)上使用梯度下降算法,實(shí)施微調(diào),最小化預(yù)測目標(biāo)的誤差,不斷調(diào)整整個網(wǎng)絡(luò)的參數(shù)。微調(diào)結(jié)構(gòu)如圖3所示。

圖片

圖3分類深度網(wǎng)絡(luò)的微調(diào)結(jié)構(gòu)

2堆疊去噪自編碼器實(shí)現(xiàn)

2.1堆疊去噪自編碼器的參數(shù)更新

去噪自編碼器的最終目的是找出模型最合適的參數(shù),可以按照如下步驟更新參數(shù)。

初始化模型參數(shù):輸入數(shù)據(jù)、可視節(jié)點(diǎn)個數(shù)、隱層節(jié)點(diǎn)個數(shù)、輸入數(shù)據(jù)破壞比例和更新的學(xué)習(xí)率(learning rate),權(quán)值矩陣和偏置向量;根據(jù)數(shù)據(jù)破壞比例,隨機(jī)選取原始數(shù)據(jù),將其值設(shè)置為0,達(dá)到破壞數(shù)據(jù)的目的;使用sigmoid函數(shù)計(jì)算輸入數(shù)據(jù)的隱藏表示和重構(gòu)表示;計(jì)算輸入數(shù)據(jù)的重構(gòu)誤差;對重構(gòu)誤差使用梯度下降算法,更新參數(shù)。具體過程如算法1。

算法1Denoising AutoEncoder。

程序前

輸入: X, n_vis, n_hid, c_r, l_r;

輸出: W, b, b′。

X′=get_corrupted_input(X, c_r)

1

for iter from 1 to iteration

2)

Y=get_hidden_units(X′, W, b)

3)

Z=get_reconstruction_units(Y, W, b′)

4)

cost=get_cost(X, Z)

5)

for param in parameters(W, b, b′)

6)

gparam=get_gradient(cost, param)

7)

param=param-l_r * gparam

8)

end for

9)

end for

程序后

2.2堆疊去噪自編碼器的預(yù)訓(xùn)練

在堆疊去噪自編碼器的預(yù)訓(xùn)練步驟中,首先應(yīng)該確定隱藏層的數(shù)目,一般情況下,使用3層的去噪自編碼器構(gòu)成深度學(xué)習(xí)網(wǎng)絡(luò)來訓(xùn)練堆疊去噪自編碼器;每一層都訓(xùn)練成去噪自編碼器,并且通過最小化重構(gòu)誤差,更新參數(shù)10次以上。第i-1層的輸出即為第i層的輸入,這樣通過自底向上的方式訓(xùn)練堆疊去噪自編碼器。每一層的數(shù)據(jù)破壞比例和隱藏節(jié)點(diǎn)個數(shù)可以互不相同;最后獲取整個網(wǎng)絡(luò)的參數(shù)。訓(xùn)練步驟如算法2。

算法2Pretrain Step。

程序前

輸入:X,n_layers, n_vis, n_hid[n_layers],c_r[n_layers], l_r[n_layers];

輸出:dA_layers[n_layers], Y_out=X。

1

for i from 1 to n_layers

2)

X′=get_corrupted_input(Y_out,c_r[i])

3)

for iter from 1 to iteration

4)

Y=get_hidden_units(X′,W[i],b[i])

5)

Z=get_reconstruction_units(Y,W[i], b′[i])

6)

cost=get_cost(Y_out, Z)

7)

for param in parameters(W[i], b[i], b′[i])

8)

gparam=get_gradient(cost,param)

9)

param=param-l_r[i] * gparam

10)

end for

11)

end for

12)

Y_out=Y

13)

end for

程序后

2.3堆疊去噪自編碼器的微調(diào)

在堆疊去噪自編碼器的微調(diào)過程中,使用有監(jiān)督學(xué)習(xí)方法優(yōu)化從預(yù)訓(xùn)練步驟中獲得的模型參數(shù)。由于最后一個隱含層只能輸出原始數(shù)據(jù)的重構(gòu),因而不具有分類識別功能。為了讓堆疊去噪編碼器具有分類識別的功能,需要在完成微調(diào)的神經(jīng)網(wǎng)絡(luò)的輸出層之后加入sigmoid分類器,將整個神經(jīng)網(wǎng)絡(luò)訓(xùn)練成能完成分層特征提取和數(shù)據(jù)分類任務(wù)的多重感知器。多重感知器的sigmoid層的參數(shù)和預(yù)訓(xùn)練步驟中去噪自編碼器的sigmoid函數(shù)具有相同的參數(shù),因此可以通過最小化多重感知器的預(yù)測錯誤來不斷微調(diào)模型的參數(shù)。微調(diào)步驟作用在整個堆疊去噪自編碼器過程。微調(diào)的過程如算法3。

算法3Fine Tuning Step。

程序前

input: train_batches, test_batches, iteration, l_r

1

while iter < iteration do

2)

for batch in train_batches

3)

cost=get_finetuning_cost(X)

4)

for i from 1 to n_layers

5)

for param in parameters(W[i], b[i], b′[i])

6)

gparam=get_gradient(cost, param)

7)

param=param-l_r[i]*gparam

8)

end for

9)

end for

10)

valid_error=get_valid_error(batch)

11)

if valid_error

12)

update best_valid_error

13)

test_error=get_test_error(test_batches)

14)

if test_error

15)

update best_test_error

16)

end if

17)

end if

18)

end for

19)

end while

程序后

3實(shí)驗(yàn)與分析

3.1數(shù)據(jù)集

3.1.1數(shù)據(jù)集描述

實(shí)驗(yàn)中使用了6個著名的、數(shù)據(jù)量比較大的、公開的數(shù)據(jù)集Enron[14]。其中Enron1、Enron2和Enron3的合法郵件占多數(shù),而Enron4、Enron5和Enron6的垃圾郵件占多數(shù)。Enron數(shù)據(jù)集中正常郵件是從Enron公司的前員工的郵箱中收集的,垃圾郵件則有不同的來源。6個數(shù)據(jù)集的具體組成如表1。

3.1.2數(shù)據(jù)集預(yù)處理

1)分別從垃圾郵件文件夾和合法郵件文件夾,按照30%的比例隨機(jī)選取文件,然后合起來作為測試集,剩余的70%合起來作為訓(xùn)練集。

2)分別對訓(xùn)練集和測試集進(jìn)行分詞處理,字母小寫化和去除停用詞。

3)將訓(xùn)練集和測試集表示為詞頻逆文檔(Term FrequencyInverse Document Frequency, TFIDF)的向量形式。

4)使用特征值提取技術(shù)對特征值進(jìn)行提取,選取3000個特征值作為實(shí)驗(yàn)特征。

3.2實(shí)驗(yàn)性能測量標(biāo)準(zhǔn)

比較出名的性能指標(biāo)有垃圾郵件準(zhǔn)確率(Spamming precision, Spr),垃圾郵件召回率(Spamming recall, Sre),合法郵件準(zhǔn)確率(Legitimate email precision, Lpr),合法郵件召回率(Legitimate email recall, Lre),準(zhǔn)確率(Accuracy, Acc)。在分類時,垃圾郵件的類標(biāo)設(shè)置為1(正例),合法郵件的類標(biāo)設(shè)置為0(負(fù)例)。其中分類的混淆矩陣(confusion matrix)如表2所示,真正例(True Positive, TP),假負(fù)例(False Negtive, FN),假正例(False Positive, FP),真負(fù)例(True Negtive, TN)。

表格(有表名)

文獻(xiàn)[15]的研究表明,在機(jī)器學(xué)習(xí)的分類問題中,馬修斯相關(guān)系數(shù)(Matthews Correlation Coefficient,MCC)是最好的性能測試指標(biāo)之一。相比其他的指標(biāo),MCC對于準(zhǔn)確率提供了更為平衡的測量。MCC值的返回值介于-1和+1之間:+1,表明是完美的預(yù)測;0,表明是隨機(jī)的預(yù)測;-1,則表明是一個相反的預(yù)測。MCC的計(jì)算式如下:

MCC=TP*TN-FP*FN(TP+FP)(TP+FN)(TN+FP)(TN+FN)(6

MCC同時提供了相對合理的評價(jià):現(xiàn)實(shí)情況下,垃圾郵件的數(shù)目要比合法郵件的數(shù)目更高,因此MCC可以自動調(diào)整一個假正例(即合法郵件分類為垃圾郵件)錯誤相對于一個假負(fù)例錯誤的嚴(yán)重程度,隨著垃圾郵件相對于合法郵件的比例的上升,一個假正例錯誤會比一個假負(fù)例錯誤更加嚴(yán)重,即MCC值會降低。

3.3實(shí)驗(yàn)結(jié)果與分析

3.3.1隱藏層節(jié)點(diǎn)數(shù)目選擇對實(shí)驗(yàn)的影響

由文獻(xiàn)[10-11]中一系列的參數(shù)實(shí)驗(yàn)可以總結(jié)出,在大部分?jǐn)?shù)據(jù)集上,SDA一般使用三層隱藏層就可以達(dá)到較優(yōu)的效果,因此本文中使用三層的隱藏層。

首先指出,圖4和圖5中的最低點(diǎn)Acc值是0.7101。這種情況是SDA把所有的郵件都分類為垃圾郵件。圖4中,350,650,950是第一層隱藏層的節(jié)點(diǎn)數(shù)目,30表示第三層隱藏層的節(jié)點(diǎn)數(shù)目;圖5中,350,650,950是第一層隱藏層的節(jié)點(diǎn)數(shù)目,500表示第二層隱藏層的節(jié)點(diǎn)數(shù)目。

圖4中,固定第一、三隱藏層的節(jié)點(diǎn)數(shù)目,SDA在數(shù)據(jù)集Enron 5上的Acc值隨著第二層隱藏層節(jié)點(diǎn)數(shù)目的改變而變化。從圖4中可看出,固定第一、三隱藏層節(jié)點(diǎn)數(shù)目時,當(dāng)?shù)诙庸?jié)點(diǎn)個數(shù)過小或者過大時,Acc值會達(dá)到最低點(diǎn)0.7101,而第二層節(jié)點(diǎn)個數(shù)處于兩者之間時,Acc值正常波動。第二、三隱藏層節(jié)點(diǎn)固定時,可以看出,當(dāng)?shù)谝粚拥墓?jié)點(diǎn)數(shù)目越大時,第二層隱藏層節(jié)點(diǎn)的數(shù)目受到的限制更大。

對于圖4中出現(xiàn)的隨著第二層隱藏層節(jié)點(diǎn)數(shù)目的增加,Acc值會降至最低,可以通過改變第三層隱藏層節(jié)點(diǎn)數(shù)目來改變。圖5中,固定第一、二隱藏層節(jié)點(diǎn)的數(shù)目,SDA在數(shù)據(jù)集Enron 5上的Acc值隨著第三層節(jié)點(diǎn)數(shù)目的改變而變化??梢钥闯?,為了取得較優(yōu)的結(jié)果,第一層隱藏層的節(jié)點(diǎn)數(shù)越多,第三隱藏層需要的節(jié)點(diǎn)數(shù)也越多。

3.3.2在6個數(shù)據(jù)集上的實(shí)驗(yàn)結(jié)果

為了書寫方便,下面描述中,Basic表示基本樸素貝葉斯方法、Bool表示布爾樸素貝葉斯方法、MN Bool表示多項(xiàng)式布爾樸素貝葉斯方法。

在6個Enron 數(shù)據(jù)集上的實(shí)驗(yàn)結(jié)果如表3~8所示,其中加下劃線的數(shù)據(jù)表示該實(shí)驗(yàn)中最大的MCC值。

表格(有表名)

表3Enron1上各個分類器的實(shí)驗(yàn)結(jié)果

分類器Sre/%Spr/%Lre/%Lpr/%Acc/%MCC

Basic91.3385.0993.4896.3692.860.831

Bool96.0051.6163.3297.4972.780.540

MN Bool82.6762.0079.3591.8280.310.578

SVM83.3387.4195.1193.7091.700.796

DBN91.5690.7596.1996.5494.850.875

SDA90.2292.9197.1896.0595.160.882

表格(有表名)

表4Enron2上各個分類器的實(shí)驗(yàn)結(jié)果

分類器Sre/%Spr/%Lre/%Lpr/%Acc/%MCC

Basic80.0097.5799.3193.5394.380.850

Bool95.3381.2592.4598.3093.190.836

MN Bool74.0098.2399.5491.7793.020.814

SVM90.6790.6796.8096.8095.230.875

DBN95.9891.6897.0298.6096.750.916

SDA95.9895.5698.4798.6297.830.943

表格(有表名)

表5Enron3上各個分類器的實(shí)驗(yàn)結(jié)果

分類器Sre/%Spr/%Lre/%Lpr/%Acc/%MCC

Basic57.33100.00100.0086.2788.410.703

Bool99.3399.3399.7599.7599.640.991

MN Bool62.00100.00100.0087.5889.670.737

SVM91.3396.4898.7696.8396.740.917

DBN96.4489.6795.8498.6396.000.903

SDA92.6799.2999.7597.3297.820.945

表格(有表名)

表6Enron4上各個分類器的實(shí)驗(yàn)結(jié)果

分類器Sre/%Spr/%Lre/%Lpr/%Acc/%MCC

Basic94.67100.00100.0086.2196.000.903

Bool98.00100.00100.0094.3498.500.962

MN Bool96.89100.00100.0091.4697.670.941

SVM98.89100.00100.0096.7799.170.978

DBN96.9697.9894.0091.1696.220.901

SDA99.9397.2691.5699.7697.840.942

表格(有表名)

表7Enron5上各個分類器的實(shí)驗(yàn)結(jié)果

分類器Sre/%Spr/%Lre/%Lpr/%Acc/%MCC

Basic89.6798.8097.3379.3591.890.825

Bool87.23100.00100.0076.1490.930.815

MN Bool94.29100.00100.0087.7295.950.909

SVM89.4099.7099.3379.2692.280.837

DBN96.3799.4498.6791.7497.040.931

SDA98.7399.4598.6796.9498.710.969

表格(有表名)

表8Enron6上各個分類器的實(shí)驗(yàn)結(jié)果

分類器Sre/%Spr/%Lre/%Lpr/%Acc/%MCC

Basic86.0098.9897.3369.8688.330.757

Bool66.8999.6799.3350.0075.000.574

MN Bool92.8997.2192.0081.1892.670.816

SVM89.7895.2886.6773.8690.050.727

DBN96.3798.5695.7589.7996.210.902

SDA99.0498.4595.3397.0698.110.949

通過觀察6個數(shù)據(jù)集6種分類器的實(shí)驗(yàn)數(shù)據(jù)可以分析:在實(shí)驗(yàn)的大部分?jǐn)?shù)據(jù)集上,SDA垃圾郵件過濾器的性能超過了其他幾種分類器。同時在有些情況下SDA的過濾效果遠(yuǎn)遠(yuǎn)地優(yōu)于SVM和NB分類器:比如在Enron6數(shù)據(jù)集上的結(jié)果表明,SDA的垃圾郵件召回率達(dá)到了99.04%,而SVM卻只達(dá)到了89.78%。這意味著在Enron6數(shù)據(jù)集上,SDA要比SVM多識別9.26%的垃圾郵件,同時因?yàn)榫哂斜萐VM更好的合法郵件召回率,所以相對于SVM,SDA垃圾郵件過濾的總體性能提升要大于9%。在實(shí)際的應(yīng)用中,這些差異將會非常重要。這種對比現(xiàn)象在數(shù)據(jù)集Enron1、Enron2、Enron3和Enron5也可以得到。在數(shù)據(jù)集Enron4上,SDA過濾效果稍遜于SVM,但是相差不大。

對于實(shí)驗(yàn)中所有樸素貝葉斯過濾器,實(shí)驗(yàn)數(shù)據(jù)表明它們之間達(dá)到了相似的結(jié)果,并且不具有太大的差異性。相對堆疊去噪自編碼器過濾器和支持向量機(jī)過濾器在所有的數(shù)據(jù)集上的準(zhǔn)確率(Acc)達(dá)到90%以上,而基于樸素貝葉斯方法的過濾效果要差些。

實(shí)驗(yàn)中的DBN的分類效果,總體上要優(yōu)于其他4幾種分類器,但是SDA的分類效果要稍微優(yōu)于DBN。

表中的實(shí)驗(yàn)數(shù)據(jù)表明堆疊去噪自編碼器在垃圾郵件過濾中具有更好的效果:在實(shí)驗(yàn)的所有數(shù)據(jù)集上,堆疊去噪自編碼器的準(zhǔn)確率(Acc)都高于95%;在實(shí)驗(yàn)的所有數(shù)據(jù)集上,堆疊去噪自編碼器的MCC值都高于0.88,這表明堆疊去噪自編碼器應(yīng)用于垃圾郵件過濾中取得相對完美的預(yù)測。上述結(jié)果表明將堆疊去噪自編碼器應(yīng)用到垃圾郵件過濾中是可行的。

4結(jié)語

本文提出了一種新的基于堆疊去噪自編碼器的垃圾郵件分類器。在6個著名的、數(shù)據(jù)量較大的、公開的數(shù)據(jù)集上進(jìn)行測試,將實(shí)驗(yàn)結(jié)果同基于支持向量機(jī)和貝葉斯方法的垃圾郵件過濾器的結(jié)果進(jìn)行比較。對比分析表明,本文所提出的垃圾郵件過濾器表現(xiàn)出更好的性能。特別是基于堆疊去噪自編碼器的垃圾郵件分類器在6個數(shù)據(jù)集上具有最好的平均性能并且準(zhǔn)確率(Acc)都高于95%。這些表明將堆疊去噪自編碼器應(yīng)用到垃圾郵件過濾中是可行的。

未來的工作將會集中在以下3個方面:1)如何更好地選擇深度置信網(wǎng)絡(luò)隱藏層數(shù)以及每層的單元個數(shù),如何選擇學(xué)習(xí)率等參數(shù)來提高算法的性能。2)在諸如TRE05、TRE06、TRE07等更大的數(shù)據(jù)集上進(jìn)行更多的實(shí)驗(yàn)來驗(yàn)證實(shí)驗(yàn)結(jié)果,同時也希望同一些諸如Bogo filter、Spam Assassin等開源和商業(yè)垃圾郵件過濾器進(jìn)行比較。3)應(yīng)把垃圾郵件過濾看作是共同進(jìn)化問題,因?yàn)槔]件過濾器努力提高預(yù)測能力的同時,垃圾郵件遞送者也不斷地改變垃圾郵件內(nèi)容的表現(xiàn)形式以達(dá)到欺騙過濾器的目的,因此一個有效的垃圾郵件過濾器應(yīng)該能夠有效地檢測垃圾郵件特征的變化,從而不斷地調(diào)整自身的規(guī)則。

參考文獻(xiàn):

[1]GARTNER. Gartner survey shows phishing attacks escalated in 2007; more than $3 billion lost to these attacks[EB/OL].[20150220].http:///it/page.jsp?id=565125.

第4篇:卷積神經(jīng)網(wǎng)絡(luò)的步驟范文

【關(guān)鍵詞】互聯(lián)網(wǎng)金融 人臉識別 信息安全 身份認(rèn)證

一、引言

國家建設(shè)部于“十二五”期間頒布了關(guān)于開展國家智慧城市試點(diǎn)工作的通知,意在通過綜合運(yùn)用現(xiàn)代科學(xué)技術(shù)來營造社會建設(shè)和管理的新模式。伴隨著智慧經(jīng)濟(jì)的建設(shè)和我國的傳統(tǒng)金融行業(yè)對于創(chuàng)新變革的訴求,國內(nèi)的互聯(lián)網(wǎng)金融行業(yè)開始快速發(fā)展。人臉識別在國內(nèi)互聯(lián)網(wǎng)金融領(lǐng)域的應(yīng)用也借助這一浪潮拉開帷幕。

二、人臉識別技術(shù)簡介

進(jìn)入21世紀(jì),隨著計(jì)算機(jī)技術(shù)、光學(xué)技術(shù)等技術(shù)的迅猛發(fā)展,人臉識別技術(shù)逐漸成熟,步入了應(yīng)用階段。人臉識別安防、考勤、支付等系統(tǒng)走進(jìn)了我們的生活。

人臉識別算法蓬勃發(fā)展,尤其是基于深度學(xué)習(xí)的識別方法。深度學(xué)習(xí)利用其對大型數(shù)據(jù)集的優(yōu)秀預(yù)測能力突破了之前在人臉識別過程中的精準(zhǔn)率瓶頸。深度學(xué)習(xí)算法種類繁多,目前被廣泛應(yīng)用于人臉識別領(lǐng)域的主要是卷積神經(jīng)網(wǎng)絡(luò)。其現(xiàn)主要分為四個步驟。

首先是局部感知。在處理在圖像處理中,把圖像表示為像素的向量。只對局部的聯(lián)系緊密的向量進(jìn)行感知,初步降低參數(shù);第二步是權(quán)值共享。挑選第一步中的某個局部參數(shù)提取特征,再將其作為探測器也就是卷積核,應(yīng)用到圖像的任意區(qū)域,對特征進(jìn)行匹配,得到不同的激活值。將符合條件的激活值篩選出來;第三步是多卷積核。挑選更多的卷積核,不斷重復(fù)第二步驟,學(xué)習(xí)更多特征;最后是池化。一個圖像區(qū)域有用的特征極有可能在另一個區(qū)域同樣適用,對不同位置的特征進(jìn)行聚合統(tǒng)計(jì)可以簡化對于大圖像的描述,進(jìn)一步降參。

三、互聯(lián)網(wǎng)金融的人臉識別運(yùn)用

互聯(lián)網(wǎng)金融是借助于互聯(lián)網(wǎng)技術(shù)、移動通信技術(shù)來實(shí)現(xiàn)資金融通、支付和信息中介等業(yè)務(wù)的一種新興金融模式。毫無疑問,互聯(lián)網(wǎng)金融正以其獨(dú)特的運(yùn)行方式和價(jià)值創(chuàng)造模式,影響著傳統(tǒng)金融業(yè)務(wù),逐步成為整個金融生態(tài)體系中不可忽視的一部分。

(一)互聯(lián)網(wǎng)金融面臨的風(fēng)險(xiǎn)

互聯(lián)網(wǎng)金融行業(yè)也同傳統(tǒng)金融行業(yè)一樣,它們的核心問題都是如何預(yù)防和處理風(fēng)險(xiǎn)。目前我國的互聯(lián)網(wǎng)金融行業(yè)面臨著政策法律風(fēng)險(xiǎn)、監(jiān)管風(fēng)險(xiǎn)、流動風(fēng)險(xiǎn)、市場風(fēng)險(xiǎn)、信用風(fēng)險(xiǎn)、技術(shù)風(fēng)險(xiǎn)這六大風(fēng)險(xiǎn)。

(1)信用風(fēng)險(xiǎn)?;ヂ?lián)網(wǎng)金融的信用風(fēng)險(xiǎn)主要來自于對客戶的真實(shí)身份的認(rèn)證帶來的信息不對稱問題。由于國內(nèi)的互聯(lián)網(wǎng)信用業(yè)務(wù)還沒有得到很完善的監(jiān)管,互聯(lián)網(wǎng)金融的虛擬性就會給對客戶身份的認(rèn)證帶來不確定性素。例如,一些用戶在P2P網(wǎng)貸平臺進(jìn)行身份信息造假騙取貸款。

(2)技術(shù)風(fēng)險(xiǎn)?;ヂ?lián)網(wǎng)金融是互聯(lián)網(wǎng)與金融的結(jié)合產(chǎn)物,自然避免不了對于網(wǎng)絡(luò)信息安全的要求。傳統(tǒng)的字符密碼具有可復(fù)制性,容易被網(wǎng)絡(luò)黑客、木馬病毒所竊取,造成不必要的損失。傳統(tǒng)的字符密碼認(rèn)證對互聯(lián)網(wǎng)金融企業(yè)的網(wǎng)絡(luò)技術(shù)安全提出了更高的要求,而我國的互聯(lián)網(wǎng)金融企業(yè)大多還在成長階段,無法維護(hù)龐大的信息數(shù)據(jù)庫,給行業(yè)帶來了很大的技術(shù)風(fēng)險(xiǎn)。

(二)人臉識別技術(shù)降低信用風(fēng)險(xiǎn)與技術(shù)風(fēng)險(xiǎn)

人臉識別技術(shù)依靠人臉獨(dú)特性、難以復(fù)制性等優(yōu)勢可以很大程度上降低互聯(lián)網(wǎng)金融的信用風(fēng)險(xiǎn)和技術(shù)風(fēng)險(xiǎn)。目前,國內(nèi)的云從科技、Linkface等科技公司都在LFW數(shù)據(jù)庫的實(shí)驗(yàn)環(huán)境下,取得了99.5%以上的人臉識別成功率,高于人眼識別97.52%的準(zhǔn)確率。

在人臉識別模式下的開戶過程需要用戶先需要出示自己的二代身份證,系統(tǒng)在客戶填寫開戶信息后繼續(xù)發(fā)出指令,讓客戶進(jìn)行基于視頻流的身份認(rèn)證,人臉識別系統(tǒng)會以此判別個人身份的真實(shí)性。同時,利用“活體檢測算法”、“圖像脫敏算法”以及“人臉比對算法”等算法對視頻流的背景和人像的對比分析,可以避免一些用戶利用錄制好的視頻來偽造身份信息。

識別開戶成功后,系統(tǒng)自動上傳用戶信息至后臺。當(dāng)遇到支付等操作指令時調(diào)出信息,再次對客戶進(jìn)行基于視頻流的身份認(rèn)證來確定指令的安全性。

(三)互聯(lián)網(wǎng)金融中的人臉識別運(yùn)用

(1)招商銀行“ATM刷臉取款”。我國的招商銀行一直以勇于創(chuàng)新的先行者姿態(tài)活躍于金融領(lǐng)域,在手機(jī)銀行和自助銀行等多種電子信息化自助服務(wù)渠道中保持著領(lǐng)先地位。繼在VTM渠道應(yīng)用人臉識別技術(shù)以輔助柜員核實(shí)客戶身份后,又率先推出“ATM刷臉取款”業(yè)務(wù)。首先收集客戶的可信照片,再主要利用人臉識別技術(shù)并輔之以手機(jī)號碼驗(yàn)證和密碼驗(yàn)證來確認(rèn)客戶信息,誤識率在萬分之一以下。

這是國內(nèi)銀行首次將人臉識別技術(shù)應(yīng)用到自助提款機(jī)上,也意味著招行“智能銀行”再一次取得進(jìn)展。

(2)螞蟻金服的人臉識別體系。螞蟻金服起步于阿里巴巴集團(tuán)的支付寶,致力于推進(jìn)互聯(lián)網(wǎng)支付、消費(fèi)、理財(cái)。螞蟻金服于2015年在支付寶上推出人臉識別的功能,已在用戶登錄、實(shí)名認(rèn)證、找回密碼、商家審核、支付風(fēng)險(xiǎn)校驗(yàn)等多個場景中投入使用,利用人臉識別代替?zhèn)鹘y(tǒng)的密碼輸入。同年,阿里巴巴董事局主席馬云在德國漢諾威消費(fèi)電子、信息及通信博覽會上展示了螞蟻金服的“smiletopay”技術(shù),用手機(jī)“刷臉支付”的方式在網(wǎng)上購買了一張1948年的漢諾威紀(jì)念郵票,完美展示了計(jì)算機(jī)人臉技術(shù)在支付中的應(yīng)用。此項(xiàng)技術(shù)還在不斷完善,螞蟻金服的刷臉支付功能正式投入商用指日可待。

(四)人臉識別目前存在的問題

(1)沒有統(tǒng)一的安全標(biāo)準(zhǔn)。人臉識別技術(shù)領(lǐng)域的實(shí)際應(yīng)用還在起步階段,目前還沒有統(tǒng)一的行業(yè)標(biāo)準(zhǔn)與國家標(biāo)準(zhǔn),主要都是技術(shù)廠家自己制定標(biāo)準(zhǔn)。然而廠家標(biāo)準(zhǔn)制定的不一致,會導(dǎo)致不同的安全狀況與安全水平。只有通過制定統(tǒng)一的國家安全標(biāo)準(zhǔn),才能解決人臉識別在技術(shù)推廣過程中的障礙。

(2)識別中的“矯枉過正”。當(dāng)人臉識別技術(shù)被作為加密技術(shù)投入實(shí)際應(yīng)用時,我們最看重的就是它的安全性。而人臉識別技術(shù)的安全性可以用誤接受率與誤拒絕率兩個指標(biāo)來衡量。為了嚴(yán)格保證安全,技術(shù)廠商往往會盡量降低誤接受率,但這同時會提高誤拒絕率,使一些真正的用戶也會被系統(tǒng)拒絕,“矯枉過正”,影響了用戶體驗(yàn)。

(3)可信照片的分辨率低。目前互聯(lián)網(wǎng)金融行業(yè)在使用人臉識別技術(shù)進(jìn)行開戶等操作時,用于確定客戶信息的可信照片往往是居民二代身份證。而二代身份證的照片不僅分辨率低而且信息量少,這會降低人臉注冊、識別的準(zhǔn)確率。

(4)人臉的變化。隨著時間的推移,用戶的年齡增長,會發(fā)生胖瘦、常規(guī)的化妝、自然老化等變化。通常情況下,這些變化是在計(jì)算機(jī)的識別范圍內(nèi)的,但是如果出現(xiàn)整容、過濃的妝容、或者是佩戴眼鏡與一些裝飾性的飾物可能就會影響人臉識別的識別率。同時,由于雙胞胎、多胞胎的人臉信息過于相像,雙胞胎、多胞胎人臉信息的分辨在人臉識別技術(shù)中也是一個待攻克的難題。

四、未來發(fā)展應(yīng)用趨勢

(一)發(fā)展展望

(1)制定統(tǒng)一的行業(yè)標(biāo)準(zhǔn)。為了保障人臉識別技術(shù)在應(yīng)用過程中的安全性、規(guī)范性,有關(guān)的人臉識別科技公司和互聯(lián)網(wǎng)金融企業(yè)等應(yīng)該聯(lián)合國家相關(guān)機(jī)構(gòu),加速人臉識別技術(shù)系列標(biāo)準(zhǔn)和規(guī)范的起草進(jìn)一步規(guī)范人臉識別的技術(shù)指標(biāo)和要求,為業(yè)務(wù)的深入和推廣提供基礎(chǔ)參考。

(2)突破對源圖信息提取瓶頸。計(jì)算機(jī)人臉識別技術(shù)中很關(guān)鍵的一環(huán)就是將可信的源圖信息與后期獲取圖像的信息進(jìn)行對比篩選,計(jì)算機(jī)才能做出精確的判斷。在獲取到的源圖數(shù)據(jù)不充分、不理想的時,如何對信息進(jìn)行有效的提取,到目前為止還沒有很好的解決辦法。但是,伴隨著科技的高速發(fā)展,人臉識別技術(shù)的這一瓶頸在將來必定會被突破。

(3)與其他生物識別技術(shù)相結(jié)合。各種生物特征識別技術(shù)都有各自的優(yōu)缺點(diǎn),在具體的應(yīng)用過程中,人臉識別技術(shù)可以和虹膜、靜脈等其他生物特征識別技術(shù)相結(jié)合使用,降低對用戶的誤接受率和誤拒絕率,進(jìn)一步提高身份識別的整體安全性。

(二)應(yīng)用展望

(1)全方位的身份查核。人臉識別身份驗(yàn)證技術(shù)的應(yīng)用是對互聯(lián)網(wǎng)金融業(yè)務(wù)的基礎(chǔ)性工作的一項(xiàng)重要技術(shù)保障。在將來,人臉識別身份驗(yàn)證技術(shù)的應(yīng)用應(yīng)該從單純的“登錄認(rèn)證”到擴(kuò)展到“支付認(rèn)證”,做到全方位的身份核查,提高群眾服務(wù)的便捷性,同時保證業(yè)務(wù)更加安全、可靠。除此之外,人臉識別身份驗(yàn)證技術(shù)還可以帶動其他行業(yè)的類似業(yè)務(wù)場景,從而在全社會范圍內(nèi)促成更廣泛的工作流程改進(jìn)和社會成本節(jié)約。

(2)全面的私人數(shù)據(jù)保護(hù)。在將來,用戶的一切經(jīng)濟(jì)活動信息都可以通過人臉識別技術(shù)進(jìn)行有效保護(hù),避免敏感數(shù)據(jù)泄露,消除欺詐者利用不正當(dāng)途徑來竊取用戶個人信息進(jìn)行非法交易的可能,提升互聯(lián)網(wǎng)金融行業(yè)客戶的體驗(yàn)友好程度。

五、結(jié)語

對于互網(wǎng)金融行業(yè)來說,改革與創(chuàng)新、提高金融服務(wù)質(zhì)量和安全防范是今后互聯(lián)網(wǎng)金融行業(yè)發(fā)展的主要趨勢,人臉識別等高科技技術(shù)投入互聯(lián)網(wǎng)金融行業(yè),會對整個行業(yè)的發(fā)展起到一種非常積極的作用。未來的人臉識別技術(shù)在互聯(lián)網(wǎng)金融行業(yè)中的應(yīng)用必會繼續(xù)朝著遠(yuǎn)程化發(fā)展,進(jìn)一步取代現(xiàn)在的柜臺開戶、字符密碼認(rèn)證等傳統(tǒng)的服務(wù)流程,做到“智慧金融,智慧生活,智慧城市”。

參考文獻(xiàn):

[1]李子青.人臉識別結(jié)合視頻監(jiān)控看公安與金融市場應(yīng)用[J].中國安防,2015,(8).

[2]呂曉強(qiáng). 生物識別技術(shù)再造銀行客戶身份認(rèn)證體系[J].金融電子化,2016,(4).

[3]廖敏飛,黃瑞吟,劉麗娟. 生物識別技術(shù)在金融行業(yè)的應(yīng)用現(xiàn)狀與前景分析[J].金融電子化,2016,(4).

第5篇:卷積神經(jīng)網(wǎng)絡(luò)的步驟范文

本文結(jié)合計(jì)算機(jī)行業(yè)的發(fā)展,對計(jì)算機(jī)網(wǎng)絡(luò)云計(jì)算技術(shù)進(jìn)行了分析研究,希望能為計(jì)算機(jī)技術(shù)的進(jìn)步提供一定的理論支持。

一、計(jì)算機(jī)網(wǎng)絡(luò)的云計(jì)算技術(shù)概念

美國的網(wǎng)絡(luò)公司最早提出計(jì)算機(jī)網(wǎng)絡(luò)云計(jì)算技術(shù)的概念,隨著科學(xué)的進(jìn)步與發(fā)展已經(jīng)逐漸成為了一門成熟的技術(shù),有著豐富的理論基礎(chǔ)與實(shí)踐經(jīng)驗(yàn)?,F(xiàn)在的“云計(jì)算”技術(shù)是指能將網(wǎng)絡(luò)、硬件、設(shè)備相融合,同時實(shí)現(xiàn)規(guī)模性、安全性、虛擬性的技術(shù)。目前來看,對計(jì)算機(jī)網(wǎng)絡(luò)云計(jì)算的定義還沒有統(tǒng)一的趨勢,每一名研究人員都有自己的研究與看法,通過研究與分析,本文對云計(jì)算的觀點(diǎn)是:首先,每一個“云”都是獨(dú)立的計(jì)算機(jī)分布體系,基于網(wǎng)絡(luò)化、虛擬化的計(jì)算機(jī)服務(wù)層,與計(jì)算機(jī)中的資源保持一定的節(jié)奏,實(shí)現(xiàn)計(jì)算機(jī)資源的同步。其次,計(jì)算機(jī)網(wǎng)絡(luò)云是一個綜合體,并非是獨(dú)立的,計(jì)算機(jī)軟件的開發(fā)中離不開云計(jì)算的環(huán)節(jié),其重點(diǎn)就是網(wǎng)絡(luò)云計(jì)算特征的研究。對于計(jì)算機(jī)網(wǎng)絡(luò)的使用者來說,計(jì)算機(jī)集成軟件層面,能被接受與理解的就是云計(jì)算,在本文重點(diǎn)突出的就是云計(jì)算的屬性。最后,計(jì)算機(jī)網(wǎng)絡(luò)的使用者沒有進(jìn)行長期的規(guī)劃后使用,很容易出現(xiàn)浪費(fèi)現(xiàn)象,目前的云計(jì)算技術(shù)可以實(shí)現(xiàn)分或秒內(nèi)的數(shù)據(jù)計(jì)算,可以很好地避免資源過載或資源浪費(fèi)現(xiàn)象。

通過研究可以看出,計(jì)算機(jī)網(wǎng)絡(luò)云計(jì)算技術(shù)可以定義成計(jì)算機(jī)網(wǎng)絡(luò)中進(jìn)行的某種服務(wù)形式,其中相關(guān)的硬件設(shè)施與軟件系統(tǒng)統(tǒng)稱為計(jì)算機(jī)網(wǎng)絡(luò)云計(jì)算。定義中包括網(wǎng)絡(luò)計(jì)算機(jī)、超級計(jì)算機(jī)、集成技術(shù)等,相關(guān)的技術(shù)既有區(qū)別又有聯(lián)系。計(jì)算機(jī)網(wǎng)絡(luò)云計(jì)算技術(shù)的原理是:大量的數(shù)據(jù)分布于分布式計(jì)算機(jī)中,同時保證用戶的數(shù)據(jù)系統(tǒng)與計(jì)算機(jī)同步運(yùn)行,進(jìn)而實(shí)現(xiàn)及時將需要的資源切換到相應(yīng)的應(yīng)用中,根據(jù)使用者的訪問需求進(jìn)行存儲系統(tǒng)與計(jì)算機(jī)系統(tǒng)的定位。計(jì)算機(jī)網(wǎng)絡(luò)云計(jì)算技術(shù)可以基于用戶服務(wù)需求及時提供所需的網(wǎng)絡(luò)信息資源。計(jì)算機(jī)網(wǎng)絡(luò)云計(jì)算技術(shù)適應(yīng)性強(qiáng),彈性好,專業(yè)技術(shù)性高,發(fā)展前景十分好,應(yīng)用越來越廣泛。

二、計(jì)算機(jī)網(wǎng)絡(luò)云計(jì)算技術(shù)的分類

基于多樣化的標(biāo)準(zhǔn),計(jì)算機(jī)云計(jì)算的分類也有多種方式。比較常見的是:根據(jù)服務(wù)方式的不同,云計(jì)算可以分為私有云和公有云。私有云是根據(jù)用戶的自身情況進(jìn)行獨(dú)立使用,同時建立平臺,操作性與實(shí)用性十分好。公有云是ζ淥用戶的資源進(jìn)行開發(fā)利用。在選擇私有云與公有云時,應(yīng)該考慮的主要因素是:

1.服務(wù)的延續(xù)性

大部分情況下,公有云提供的服務(wù)容易受外界影響,如網(wǎng)絡(luò)故障等情況,而私有云則不會出現(xiàn)這種問題。

2.數(shù)據(jù)安全性

如果對于穩(wěn)定性與安全性不存在過高要求,則比較適合使用公有云。

3.綜合使用成本

通常狀況下,如果對于計(jì)算資源要求不高可以選用公有云,如果對于計(jì)算資源要求較高則比較適合建立自己的私有云平臺。

4.監(jiān)控能力

公有云可以將使用用戶對系統(tǒng)的監(jiān)控能力屏蔽起來,這對于金融保險(xiǎn)投資行業(yè)是十分有必要的。

三、計(jì)算機(jī)網(wǎng)絡(luò)云計(jì)算技術(shù)的實(shí)現(xiàn)

為了將計(jì)算機(jī)系統(tǒng)的系統(tǒng)處理過程進(jìn)行簡化,通常將該過程劃分為預(yù)處理過程與功能實(shí)現(xiàn)過程兩大部分。對系統(tǒng)的各項(xiàng)功能進(jìn)行分解,得到一些不需要進(jìn)行功能實(shí)現(xiàn)過程與預(yù)處理過程的功能。對于可以進(jìn)行預(yù)先處理過程的功能通常是一次性處理,在執(zhí)行過程中,可以將預(yù)處理過程得到的結(jié)果直接使用,以此完成特點(diǎn)的系統(tǒng)功能。該方法與原則的采用,極大地簡化了系統(tǒng),大幅度提高了系統(tǒng)運(yùn)行效率。計(jì)算的云化中的系統(tǒng)就是計(jì)算云化系統(tǒng),它的計(jì)算量十分巨大,系統(tǒng)計(jì)算運(yùn)行效率極高。但因?yàn)橛?jì)算云化系統(tǒng)為一次處理系統(tǒng),只要計(jì)算云規(guī)則生成,計(jì)算云化系統(tǒng)的使命與任務(wù)也就完成,而不是在對計(jì)算機(jī)加以應(yīng)用時需要該系統(tǒng)。通常在計(jì)算機(jī)網(wǎng)絡(luò)云計(jì)算中形成的系統(tǒng)就是云計(jì)算系統(tǒng),是一個十分簡單的系統(tǒng),對計(jì)算機(jī)的處理能力沒有過高要求,同時應(yīng)用于各類計(jì)算機(jī)系統(tǒng)計(jì)算中。

四、計(jì)算機(jī)網(wǎng)絡(luò)云計(jì)算的計(jì)算與優(yōu)勢

建立計(jì)算機(jī)網(wǎng)絡(luò)云計(jì)算過程的第一步是服務(wù)器架構(gòu)的建立,其對計(jì)算機(jī)網(wǎng)絡(luò)云計(jì)算技術(shù)中的IAAS部分進(jìn)行充當(dāng)。目前來看,仍沒有關(guān)于網(wǎng)絡(luò)云計(jì)算服務(wù)器架構(gòu)的專門、統(tǒng)一的標(biāo)準(zhǔn)出現(xiàn),這需要一定的相關(guān)技術(shù)進(jìn)行支持,例如計(jì)算區(qū)域網(wǎng)SAN和附網(wǎng)NAS等,這都是應(yīng)用比較多的服務(wù)器架構(gòu)技術(shù)。NAS文件計(jì)算系統(tǒng)是松散結(jié)構(gòu)型的集群,它的架構(gòu)有很明顯的分布式特征。NAS文件系統(tǒng)集群中的各個節(jié)點(diǎn)具有互補(bǔ)與相互影響的特點(diǎn),文件是最小的單位,因?yàn)橹灰诩捍鎯ξ募涂梢杂?jì)算出文件的數(shù)據(jù)信息,直接減少了很多計(jì)算的冗余性。它的拓展性很高,同時成本較低,安全控制系統(tǒng)安全穩(wěn)定。如果客戶發(fā)出過多的請求,NAS系統(tǒng)的限制就表現(xiàn)出來,二級計(jì)算就可以通過NAS的云服務(wù)完成。

SAN是一種緊密結(jié)合類型的集群,在集群中存儲文件之后,可以分解成很多個數(shù)據(jù)塊。相比于集群之中的節(jié)點(diǎn),各數(shù)據(jù)塊之間能夠進(jìn)行相互訪問。節(jié)點(diǎn)可以借助于訪問文件間的數(shù)據(jù)塊針對客戶的請求進(jìn)行處理。SAN系統(tǒng)之中可以通過節(jié)點(diǎn)數(shù)量增減來響應(yīng)請求,同時提升界定本身的性能。為了能夠?qū)⒁許AN為基礎(chǔ)的OBS發(fā)展起來,就需要更好的性能與更低的成本。而SAN計(jì)算建構(gòu)的硬件價(jià)格十分高,同時依托于SAN的服務(wù)價(jià)格,因此可以適當(dāng)?shù)亟档鸵幌滦阅?,保證更好的性能與更低的成本。

五、實(shí)例――基于谷歌云計(jì)算技術(shù)的AlphaGo亮點(diǎn)分析

AlphaGo通過谷歌云計(jì)算技術(shù),擁有與人類棋手類似的“棋感”,其技術(shù)遠(yuǎn)勝于1997年IBM公司研制的超級電腦“深藍(lán)”。“深藍(lán)”面對的是相對圍棋簡單多的國際象棋,設(shè)計(jì)理念為根據(jù)棋局情況不斷演算各種可能的步驟,最終從各種步驟中選定走棋方案。AlphaGo背后的云計(jì)算技術(shù),可以讓AlphaGo無需“暴力”分析演算所有步驟,只需要把運(yùn)算能力都集中在“棋感策略”網(wǎng)絡(luò)中最有可能的情況上。其背后的深層算法,具備三大亮點(diǎn):(1)深度卷積神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)技術(shù):“棋感策略”網(wǎng)絡(luò)的本質(zhì)學(xué)習(xí)人類圍棋大師走法思維。AlphaGo藉此擁有強(qiáng)大的盤面評估能力。(2)增強(qiáng)學(xué)習(xí)算法技術(shù):此算法可通過自我對弈來持續(xù)提升AlhpaGo的棋感策略和盤面評估能力,并且給出落子選擇。(3)蒙特卡洛搜索技術(shù):“評價(jià)網(wǎng)絡(luò)”的核心,可以融合棋感策略和盤面評估能力,修正落子選擇而最終給出落子方案。

六、計(jì)算機(jī)網(wǎng)絡(luò)云計(jì)算技術(shù)發(fā)展遇到的問題

在目前計(jì)算機(jī)網(wǎng)絡(luò)云計(jì)算技術(shù)廣泛地運(yùn)用到各個領(lǐng)域的過程中,云計(jì)算技術(shù)也存在一些缺陷與不足還需要引起我們的重視,同時在云計(jì)算的應(yīng)用過程中應(yīng)采用足夠的措施來對數(shù)據(jù)信息的安全性進(jìn)行可靠的保障,這是計(jì)算機(jī)網(wǎng)絡(luò)云計(jì)算技術(shù)發(fā)展過程中十分重要的一項(xiàng)課題?,F(xiàn)在的大部分云端是通過瀏覽器進(jìn)行接入的,瀏覽器是計(jì)算機(jī)系統(tǒng)中非常薄弱的地方,存在著很多的缺陷與漏洞,因此用戶的云端接入瀏覽器時,用戶證書與認(rèn)證密鑰特別容易因?yàn)闉g覽器漏洞而產(chǎn)生泄密。同時由于不同的應(yīng)用都需要在云端中進(jìn)行認(rèn)證,這就需要保證認(rèn)證機(jī)制的高效性與安全性。在應(yīng)用服務(wù)層之中,應(yīng)該采取安全有效的措施來保護(hù)用書的隱私安全,在基礎(chǔ)設(shè)施層中要采取安全可靠的方法保C數(shù)據(jù)的安全性。

七、采取措施保障網(wǎng)民數(shù)據(jù)安全

如果數(shù)據(jù)的安全不能得到保障,就會對云計(jì)算的發(fā)展產(chǎn)生不利影響,所以為了能夠保障網(wǎng)民數(shù)據(jù)的安全。就需要采取切實(shí)可行的手段來保證數(shù)據(jù)的安全性。

1.隔離操作系統(tǒng)與數(shù)據(jù)

為了能夠切實(shí)有效地保障網(wǎng)民信息的安全,就需要充分使用Hypervisor,從而將網(wǎng)民的操作系統(tǒng)與數(shù)據(jù)資源隔離起來,從而有效地保證了計(jì)算資源的安全性,避免了網(wǎng)民操作系統(tǒng)所帶來的可能的不利影響。

2.重置API保護(hù)層

服務(wù)商提供給用戶API,用戶根據(jù)需要進(jìn)行應(yīng)用。但同時第三方也有可能對這些API進(jìn)行使用。為了保證數(shù)據(jù)的安全性,就需要你安裝API保護(hù)層,重疊保護(hù)API。

3.嚴(yán)格身份認(rèn)證

服務(wù)商應(yīng)嚴(yán)格的執(zhí)行身份認(rèn)證,防范冒充網(wǎng)民身份的行為,加強(qiáng)對賬號與密碼的管理控制,確保網(wǎng)民只訪問自己的程序與數(shù)據(jù),從而保證數(shù)據(jù)資源的安全性。

第6篇:卷積神經(jīng)網(wǎng)絡(luò)的步驟范文

關(guān)鍵詞: 極低信噪比環(huán)境; 基音頻率; 進(jìn)化算法; 遺傳算法; 粒子群算法

中圖分類號: TN912.3?34 文獻(xiàn)標(biāo)識碼: A 文章編號: 1004?373X(2017)11?0046?07

Evolutionary algorithm based fundamental tone frequency

detection in low SNR environment

ZHANG Xiaoheng1, 2, LI Yongming2, XIE Wenbin2

(1. Chongqing Radio & TV University, Chongqing 400052, China; 2. College of Communication Engineering, Chongqing University, Chongqing 400030, China)

Abstract: A frequency?domain detection model was constructed. The fundamental tone frequency is extracted as characteristic value. The model parameter (optimization factor) is introduced into the detection model, for which the global optimization is carried out with evolutionary algorithm (EA) to get the global optimum of the fundamental tone frequency, and obtain a better balance in optimization accuracy and time cost. Two representative EAs (genetic algorithm (GA) and particle swarm optimization (PSO) algorithm) are used to perform the algorithm design. The proposed algorithm is compared with the other representative algorithms. The comparison results show that the proposed algorithm can improve the detection recognition rate greatly in the noise environments of different types and different degrees, especially in the very?low SNR environment.

Keywords: very?low SNR environment; fundamental tone frequency; evolutionary algorithm; genetic algorithm; PSO

0 引 言

基音頻率是語音信號最為重要的參數(shù)之一。準(zhǔn)確有效地檢測基音頻率對很多語音技術(shù)起著極為關(guān)鍵的作用,如說話人檢測、跟蹤、語音分離及識別等。盡管基音頻率檢測已經(jīng)研究多年,并取得了一系列成果,但相關(guān)算法大都適用于高信噪比環(huán)境,而實(shí)際應(yīng)用中,大多數(shù)語音都處于復(fù)雜惡劣的噪聲環(huán)境中。因此,針對低信噪比環(huán)境,特別是-5 dB以下的基音頻率檢測算法的研究,對實(shí)現(xiàn)性能優(yōu)良、實(shí)用的語音處理技術(shù),取得實(shí)效應(yīng)用有著重要的現(xiàn)實(shí)意義[1?4]。

基音頻率檢測的有效性依賴于語音信號諧波結(jié)構(gòu)的完整性,噪聲疊加造成諧波結(jié)構(gòu)被破壞,而隨著信噪比的下降最終難以分辨一個完整的諧波周期。因此低信噪比下實(shí)現(xiàn)優(yōu)良的檢測性能具有較大難度[5?9]。

由于語音信號參數(shù)隨時間變化緩慢,相鄰多個語音幀信號參數(shù)會保持一定連續(xù)性,因此典型的基音頻率檢測算法可以分為兩個階段[10]:第一個階段找出基音頻率的多個可能候選值,或者計(jì)算基音頻率值落在不同頻率區(qū)間的概率。第二階段一般依賴DP[11]或HMM[12]算法,從多個候選值選出最終的基音頻率值。這些算法大都利用了相鄰語音幀數(shù)據(jù)之間的相關(guān)性找出最優(yōu)的基音頻率序列值,從而使得整體的后驗(yàn)誤差概率最低。但這類利用數(shù)據(jù)間強(qiáng)相關(guān)性的算法本身也會導(dǎo)致一定錯誤。此外,該類算法對相關(guān)性的過高要求在現(xiàn)實(shí)中常常難以得到較好滿足。

為了抑制噪聲,目前研究的方法一般分為參數(shù)化方法和非參數(shù)化方法兩類[13]:參數(shù)化算法采用統(tǒng)計(jì)方法對諧波結(jié)構(gòu)進(jìn)行建模,其典型的代表算法有GMM[14]算法;非參數(shù)化算法一般從頻域的諧波結(jié)構(gòu)或者時域的周期特性入手,通過對頻域或時域峰值的檢測得到基音頻率,其典型的代表算法有RAPT[15]算法和YIN[16]算法,但這類方法在信噪較高時比較有效,而當(dāng)信噪比較低時其峰值特性很容易湮沒在噪聲之中從而使得難以檢測出基音頻率。

近年在該領(lǐng)域有一些研究成果出現(xiàn),如HSAC?SAMSF[17]算法對諧波進(jìn)行自相關(guān)運(yùn)算,然后作對稱性相加求和來尋找基音周期,該算法充分利用語音的諧波特性,并通過DCT相關(guān)運(yùn)算及對稱累加運(yùn)算抑制噪聲;TAPS?CA[18]算法對頻域信號進(jìn)行相關(guān)運(yùn)算,并利用稀疏矩陣對其進(jìn)行重建,該算法利用短時譜的自相關(guān)運(yùn)算抑制噪聲,在高信噪比環(huán)境利用最小均方誤差法求取稀疏矩陣,在低信噪比環(huán)境下利用GMM法對誤差信號進(jìn)行建模,從而得到最優(yōu)稀疏矩陣。PEFAC[13]算法是最近提出的性能優(yōu)良的基音頻率檢測算法,其通過對信號的對數(shù)譜進(jìn)行壓縮以求取峰值信號,充分利用噪聲統(tǒng)計(jì)特性及幅度譜的壓縮抑制噪聲,具有極低信噪比環(huán)境下較好的抗噪聲干擾能力,且在-20~20 dB信噪比下均性能良好?;谌斯ど窠?jīng)網(wǎng)絡(luò)的基音頻率檢測算法[10]也利用了PEFAC算法的特征提取優(yōu)勢,并進(jìn)一步采用深度神經(jīng)網(wǎng)絡(luò)進(jìn)行建模,但相比PEFAC算法僅在-10 dB信噪比以上得出性能優(yōu)良的結(jié)論。

總的來說以上算法都是在經(jīng)典的參數(shù)化及非參數(shù)化方法上做了一定程度的改進(jìn),但仍然很難改變無法精確有效描述復(fù)雜噪聲環(huán)境中語音信號的缺陷。由于語音信號具有多次諧波特性,基音頻率這一重要參數(shù)可通過特征波形的峰值表達(dá)。因此,本文針對參數(shù)化方法與非參數(shù)化方法的各自不足,充分利用PEFAC對語音信號進(jìn)行基音頻率特征提取,構(gòu)造基音頻率特征波形,通過對特征波形的峰值求取實(shí)現(xiàn)基音頻率的提取。但是當(dāng)語音信號被噪聲污染時,信號的諧波特征被破壞,特征波形的峰值與基音頻率就存在一定的誤差。當(dāng)信噪比惡化時,該誤差就會明顯增大,嚴(yán)重影響了峰值對基音頻率的表達(dá)?;诖?,本文引入優(yōu)化因子對特征波形進(jìn)行校正以抵消噪聲帶來的畸變。該優(yōu)化因子的精確取值能最大程度地抑制噪聲帶來的畸變影響,從而消除特征波形峰值與基音頻率的誤差。

本文將優(yōu)化因子最佳取值問題轉(zhuǎn)換為最優(yōu)化問題,嘗試?yán)眠M(jìn)化算法來獲取其全局最優(yōu)解。進(jìn)化算法的優(yōu)勢在于其可解決復(fù)雜的非線性及多維空間尋優(yōu)問題,通過構(gòu)造含有優(yōu)化因子的適應(yīng)度函數(shù),從而能動態(tài)尋找出最佳基音頻率值所對應(yīng)的優(yōu)化因子的值。

1 基于進(jìn)化算法面向極低信噪比環(huán)境的基音頻

率檢測方法(LSNR_PFD_EA)

本文提出的基音頻率估計(jì)算法,即低信噪比下基于進(jìn)化算法的基音頻率估計(jì)(LSNR_PFD_EA)主要包括特征提取模塊、基于進(jìn)化算法的優(yōu)化因子搜索模塊及基音頻率提取模塊三部分。圖1為該算法主要流程。

如圖1所示,首先提取語音的頻域特征,此頻域特征稱為基音特征波形,其峰值用來表達(dá)基音頻率值,然后設(shè)計(jì)一個多維變量稱為優(yōu)化因子,對基音頻率特征波形的峰值進(jìn)行有效調(diào)整,使得調(diào)整后的峰值能夠表達(dá)的基音頻率是真實(shí)基音頻率值的最佳逼近。本文的特征提取方式基于PEFAC,包括短時傅里葉變換,頻域?qū)?shù)化,規(guī)整化,再進(jìn)行頻域卷積得到基音特征波形即圖中的特征值。接著,通過優(yōu)化因子搜索模塊,利用基音特征波形與優(yōu)化因子共同構(gòu)造適應(yīng)度函數(shù),利用進(jìn)化算法結(jié)合訓(xùn)練語音搜索到最佳優(yōu)化因子。最后,對測試集語音提取其特征值,基于搜索得到的最佳優(yōu)化因子對該特征值進(jìn)行優(yōu)化,優(yōu)化完成后再通過動態(tài)規(guī)劃(DP)得到語音的基音頻率。

1.1 特征提取模塊

特征提取模塊主要包括如下步驟:

(1) 語音幀信號首先通過短時傅里葉變換映射到頻域。代表第幀的功率譜密度,對數(shù)頻域的功率譜密度采用表示,其中規(guī)整化后的功率譜密度為:

(1)

式中:代表長程平均語音譜;而代表平滑后平均語音譜。

(2) 規(guī)整化的頻譜通過如下擴(kuò)展峰值的濾波器增強(qiáng)其諧波特性。其中濾波器定義如下:

(2)

其中的選取滿足而設(shè)置為1.8且設(shè)置為10。

(3) 通過對規(guī)整化的功率譜密度進(jìn)行卷積得基音特征波形接下來的基音檢測方法一般可先從中選取較大的幾個峰值對應(yīng)的頻率值作為候選基音頻率值。

(4) 然后通過DP等規(guī)劃算法得到基音頻率值的最佳估計(jì)值。

當(dāng)信噪比惡化時,特征波形的峰值被嚴(yán)重破壞,使得候選值均極大地偏離真實(shí)值,也就無法得到準(zhǔn)確的估計(jì)值。為減小候選值與真實(shí)值的誤差,本文提出了優(yōu)化因子策略,即使用優(yōu)化因子計(jì)算優(yōu)化后的基音特征波形從中選取新的峰值對應(yīng)的候選基音頻率值,使得最終的基音頻率估計(jì)值與真實(shí)值的誤差最小。

1.2 優(yōu)化因子搜索模塊

1.2.1 優(yōu)化函數(shù)分析

圖2表示了優(yōu)化因子在基音頻率檢測中的作用。其中圖2(a)為不含噪聲的語音幀經(jīng)過特征提取之后的輸出;圖2(b)為SNR=-10 dB下語音幀經(jīng)過特征提取之后的輸出;圖2(c)為圖2(b)經(jīng)過優(yōu)化因子處理后的波形,若選取幅值最大的3個峰值作為基音頻率候選值,通常最大峰值對應(yīng)的基音頻率值成為估計(jì)值的概率是最大的,如果后續(xù)不作DP規(guī)劃,則最大峰值對應(yīng)的基音頻率值就是基音頻率估計(jì)值,如果要作DP規(guī)劃,最終的估計(jì)值要在候選值,三個值之中選取。從圖中發(fā)現(xiàn),圖2(a)中基音頻率候選值與圖2(b)中基音頻率候選值的誤差很大,特別是最大峰值對應(yīng)的頻率值誤差極大,這是低信噪比環(huán)境下噪聲干擾的結(jié)果。

若要提升基音頻率估計(jì)精度,減小估計(jì)誤差,可通過優(yōu)化因子處理,如圖2(c)所示。通過將區(qū)間segment的幅度做一定程度的提升,則該區(qū)間峰值對應(yīng)的頻率就會成為候選基音頻率,而免遭錯誤遺漏。優(yōu)化因子取值的不同可以使波形在不同區(qū)間的幅度進(jìn)行放縮。通過進(jìn)化算法來搜索最優(yōu)因子,從而使圖2(a)與圖2(c)的基音頻率候選值誤差最小。圖2是某一類語音幀的情況,由于不同語音幀的基音頻率候選值有所不同,而受到噪聲污染后基音特征波形的畸變也明顯有所不同,因此每個語音幀的理想優(yōu)化因子也不盡相同,事實(shí)上針對每一幀語音數(shù)據(jù)找出其對應(yīng)的理想優(yōu)化因子是沒有意義的,因?yàn)閮?yōu)化因子數(shù)量十分龐大而無法使用,其次優(yōu)化因子與語音幀的關(guān)聯(lián)性也無法得到有效建立。但肯定能找出一個合理的優(yōu)化因子,相對于每一幀語音數(shù)據(jù)來說雖不一定最優(yōu),但相對于所有幀語音數(shù)據(jù)來說,總體誤差最小?;谝陨戏治觯瑑?yōu)化因子的取值就被轉(zhuǎn)化為一個求解最佳優(yōu)化因子的最優(yōu)化問題。由于優(yōu)化因子是高維向量,加上不同維的取值都有一定精度,優(yōu)化因子的可能取值是海量的,即候選解空間較大。此外,優(yōu)化因子和峰值與基音頻率間誤差的關(guān)系并非線性相關(guān),因此候選解空間將存在多個局部極值點(diǎn)。鑒于進(jìn)化算法全局尋優(yōu)的特性,本文基于GA[19]和PSO[20]算法分別求解該優(yōu)化問題。

GA和PSO算法都涉及確定適應(yīng)度函數(shù)的問題,用于基音頻率檢測的優(yōu)化因子的適應(yīng)度函數(shù)分為如下兩種情況:

(1) 不使用DP動態(tài)規(guī)劃

由于不使用DP動態(tài)規(guī)劃,優(yōu)化后的基音特征波形最大峰值對應(yīng)的頻率值為基音頻率估計(jì)值,其與真實(shí)基音頻率值的誤差。

因此適應(yīng)度函數(shù)即小于5%的概率。

(2) 使用DP動態(tài)規(guī)劃

表示時刻語音幀基音特征波形的峰值幅度,表示與之相關(guān)聯(lián)的頻率,則選擇較小峰值的代價(jià)其中為最大峰值幅度;基音頻率候選值的選擇率其中為相鄰語音幀的時間偏移量,則躍遷到的代價(jià)為其中為在訓(xùn)練語音庫中的均值;時刻語音幀基音頻率候選值與基音頻率中值的相對誤差為,其中可通過時刻最大峰值幅度對應(yīng)的基音頻率候選值及相鄰幀的值估計(jì)得到,若相鄰幀不是濁音幀則跳過。綜上,時刻語音幀的第個基音頻率候選值躍遷到時刻語音幀的第個基音頻率候選值的總代價(jià)為三者之和:其中為限制的最大值,而表示各參數(shù)相關(guān)權(quán)重。

將總代價(jià)最小時選擇的峰值頻率作為基音頻率估計(jì)值,因此適應(yīng)度函數(shù)為:

即小于5%的概率。

1.2.2 優(yōu)化算法?進(jìn)化算法

(1) GA算法

本文采用二進(jìn)制遺傳算法,其主要流程如下:

步驟1: 二進(jìn)制編碼;

步驟2: 隨機(jī)產(chǎn)生二進(jìn)制種群;

步驟3:計(jì)算其對應(yīng)的適應(yīng)度函數(shù)值

步驟4: 計(jì)算種群適應(yīng)度之和

步驟5: 計(jì)算每個的選擇概率

步驟6: 計(jì)算每個的累加概率

步驟7: 競爭法進(jìn)行選擇操作;

步驟8: 對新一代種群進(jìn)行單點(diǎn)隨機(jī)交叉運(yùn)算;

步驟9: 單點(diǎn)隨機(jī)變異操作;

步驟10: 第一代計(jì)算完畢,返回繼續(xù)計(jì)算步驟3,直到達(dá)到滿意的結(jié)果為止。

(2) PSO算法

本文采用粒子群算法的主要流程如下:

步E1:根據(jù)優(yōu)化因子的維度與取值范圍確定粒子群的參數(shù);

步驟2:初始化粒子群,其中粒子的信息可用兩個維向量表示,第個粒子的位置(即優(yōu)化因子)可表示為:

其中與為每一維的取值上下限,速度可表示為其中與均為取值范圍在0~1之間的隨機(jī)數(shù);

步驟3:計(jì)算每個粒子的適應(yīng)度;

步驟4:根據(jù)進(jìn)化方程更新及粒子位置速度:

步驟5:是否滿足終止條件,否則返回繼續(xù)計(jì)算步驟3,直到達(dá)到滿意的結(jié)果為止。

2 實(shí)驗(yàn)結(jié)果與分析

2.1 實(shí)驗(yàn)條件

2.1.1 數(shù)據(jù)說明

本文采用TIMIT標(biāo)準(zhǔn)數(shù)據(jù)庫測試算法性能。訓(xùn)練集包含20男20女,每人3句話。噪聲訓(xùn)練集為NOISE?92,包含white,babble,car三種噪聲。純凈語音與噪聲相混合,信噪比SNR分為9個不同的等級:-20 dB,-15 dB,

-10 dB,-5 dB,0 dB,5 dB,10 dB,15 dB,20 dB。測試集包含10男10女,每人3句話。標(biāo)準(zhǔn)基音頻率使用Praat工具從純凈語音中提取。

以兩種標(biāo)準(zhǔn)方式測試估計(jì)結(jié)果:基音頻率識別率(DR)。DR是針對濁音而言,計(jì)算誤差不超過5%的概率,為濁音幀數(shù),為其中計(jì)算誤差不超過5%的幀數(shù),計(jì)算式如下:

2.1.2 參數(shù)設(shè)置

優(yōu)化因子的維度為10,每一維的取值范圍均在0.5~1.5之間。當(dāng)使用GA算法時,基因總數(shù)為100,搜索下限為0.5,上限為1.5,交叉概率為0.8,變異概率為0.1,迭代次數(shù)為30;當(dāng)使用PSO算法時,種群大小為20,粒子初始速度為0.01,最大速度為1,粒子群維度為10,取值范圍在0.5~1.5,認(rèn)知加速度為2,社會加速度為2,慣性權(quán)重為1,退化因子為1,迭代次數(shù)為60。

2.2 兩種進(jìn)化算法的效果對比

圖3為不同迭代次數(shù)下,兩種進(jìn)化算法的檢測效果。兩種算法共同的規(guī)律是隨著信噪比的提高,收斂速度會加快。隨著迭代次數(shù)的增加,檢測率變化越來越緩慢或者根本不發(fā)生變化。這說明信噪比越低優(yōu)化的空間越大,因此信噪比越低,特征波形的結(jié)構(gòu)受噪聲影響越大。再對比GA與PSO算法,GA算法僅在信噪比為-20 dB下的識別率有較為明顯的變化,其他信噪比下幾乎沒有變化。從最終的識別率來看,相同信噪比下PSO的識別率要高于GA,因此說明PSO算法在搜索最佳優(yōu)化因子上更加有效。因此,后續(xù)實(shí)驗(yàn)中,主要采用基于PSO的基音檢測算法進(jìn)行效果對比。為了便于說明,基于GA的基音檢測算法記為LSNR_PFD_GA,基于PSO的基音檢測算法記為LSNR_PFD_PSO。

2.3 不同類型噪聲環(huán)境下的檢測效果對比

圖4為三種類型的噪聲環(huán)境下,本文LSNR_PFD_ PSO算法與三種主流算法J&W,YIN,RAPT的識別效果對比。

由圖4可見,對于不同類型的噪聲(白噪聲,babble噪聲,car噪聲),本文算法均優(yōu)于其他算法。此外,信噪比越低,本文算法的改進(jìn)效果越明顯。例如,-5 dB以下,本文算法的識別率提高了10%~20%,而在-20 dB時,其提升程度可以達(dá)到20%~50%。這說明本文算法非常適合低信噪比環(huán)境下的基音頻率檢測。

2.4 DP對基音頻率檢測的影響分析

圖5為本文算法與PEFAC算法針對采用DP與否進(jìn)行的效果對比。比較采用DP與不采用DP計(jì)算的三種噪聲(白噪聲,babble噪聲,car噪聲)在不同信噪比下的平均識別率,采用DP算法并用PSO優(yōu)化后的識別率是最好的,不采用DP而使用PSO優(yōu)化的識別率并不如使用了DP的PEFAC效果好,但比未采用DP和PSO優(yōu)化的效果好很多。這說明DP對基音頻率檢測算法具有明顯的正面作用,本文算法也不例外。為了最大限度地發(fā)揮本文算法效率,建議采用DP。

圖4 基音頻率識別率比較

2.5 進(jìn)化算法參數(shù)影響分析

圖6為基于不同參數(shù)設(shè)置,在不同信噪比下(白噪聲,babble噪聲,car噪聲) LSNR_PFD_PSO算法的平均識別率。圖6(a)為種群規(guī)模設(shè)置不同帶來的影響。圖6(b)為粒子飛行初始速度設(shè)置不同帶來的影響。

由圖6(a)可見,隨著種群規(guī)模的增大,識別率有所增加但不明顯,當(dāng)種群規(guī)模由20增加至200,-5 dB以下識別率平均提升了2%左右。鑒于種群規(guī)模與計(jì)算復(fù)雜度的關(guān)系,因此需要結(jié)合具體情況,通過統(tǒng)計(jì)實(shí)驗(yàn)設(shè)定合適的種群規(guī)模。此外,還發(fā)現(xiàn)種群規(guī)模對識別率的正面作用在低信噪比下更明顯。由圖6(a)可見,在信噪比為-20 dB,200的種群規(guī)模較20的種群規(guī)模提高效果為25%左右。由圖6(b)可見,粒子初始速度與識別率為負(fù)相關(guān)關(guān)系,當(dāng)其較大時,識別率會變差。具體來說,當(dāng)粒子速度由0.01增至0.05時,-5 dB以下識別率平均下降3%。這個結(jié)果的可能原因是初始速度太大將影響搜索的精細(xì)程度,較容易錯過最優(yōu)解。由于初始速度過小將增加計(jì)算代價(jià),因此也需要結(jié)合具體情況,通過統(tǒng)計(jì)實(shí)驗(yàn)來設(shè)定合適的初始速度。

2.6 相關(guān)算法的時間代價(jià)對比

表1為不同算法基于同一運(yùn)算平臺的平均時間代價(jià)。計(jì)算機(jī)平臺為Intel CPU 2.6 GHz,算法分別為PSO,GA,PEFAC,RAPT,YIN,“算法時間代價(jià)”是指當(dāng)前算法在裝有Matlab軟件的計(jì)算機(jī)平臺上處理1 s語音數(shù)據(jù)運(yùn)行的平均時間代價(jià)。

由表1可見,LSNR_PFD_PSO,LSNR_PFD_GA和PEFAC算法的時間代價(jià)一致,均為0.175 s。這個時間代價(jià)并不包含進(jìn)化算法的訓(xùn)練時間,這是由于一旦訓(xùn)練完成后,幾種算法的實(shí)時檢測過程所需時間代價(jià)幾乎無差別。本文算法與YIN算法的時間代價(jià)也相當(dāng),比PART算法明顯降低。根據(jù)多次實(shí)測表明,本文算法工作所需時間代價(jià)完全滿足實(shí)時性要求,現(xiàn)實(shí)可行。

3 結(jié) 論

極低噪聲環(huán)境下的基音頻率檢測是一個非常有用但具有較大難度的科研問題,迄今為止,一直沒有得到很好的解決。針對目前新提出的抗噪性能較好的基音檢測算法的不足,本文引入最佳優(yōu)化因子來消除噪聲帶來的畸變影響。通過把最佳優(yōu)化因子取值問題轉(zhuǎn)化為最優(yōu)化問題,引入進(jìn)化算法加以求解,顯著提升了低信噪比環(huán)境下基音頻率檢測性能。實(shí)驗(yàn)結(jié)果表明,面對不同類型不同信噪比的噪聲環(huán)境,本文算法均取得了較為顯著的改進(jìn)效果,且信噪比越低,改進(jìn)效果越明顯。針對下一步工作,本文擬考慮進(jìn)行更大噪聲環(huán)境的實(shí)驗(yàn)及對進(jìn)化算法的改進(jìn)以提高最佳優(yōu)化因子的搜索效率和基音頻率檢測的泛化性能。

參考文獻(xiàn)

[1] RAMAKRISHNAN A G, ABHIRAM B, PRASANNA S R M. Voice source characterization using pitch synchronous discrete cosine transform for speaker identification [J]. Journal of the acoustical society of America, 2015, 137(6): 469?475.

[2] WOHLMAYR M, PERNKOPF F. Model?based multiple pitch tracking using factorial HMMs: model adaptation and inference [J]. IEEE transactions on audio, speech and language processing, 2013, 21(8): 1742?1754.

[3] HAN K, WANG D L. A classification based approach to speech segregation [J]. Journal of the acoustical society America, 2012, 132(5): 3475?3483.

[4] RAO K S, MAITY S, REDDY V R. Pitch synchronous and glottal closure based speech analysis for language recognition [J]. International journal of speech technology, 2013, 16(4): 413?430.

[5] SHARMA D, NAYLOR P A. Evaluation of pitch estimation in noisy speech for application in non?intrusive speech quality assessment [C]// Proceedings of 2009 European Signal Processing Conference. Glasgow: IEEE, 2009: 2514?2518.

[6] SHIMAMURA T, KOBAYASHI H. Weighted autocorrelation for pitch extraction of noisy speech [J]. IEEE transactions on speech and audio processing, 2001, 9(7): 727?730.

[7] SHAHNAZ C, ZHU W P, AHMAD M O. Robust pitch estimation at very low SNR exploiting time and frequency domain cues [C]// Proceedings of 2005 IEEE International Conference on Acoustics, Speech, Signal Processing. Philadelphia: IEEE, 2005: 389?392.

[8] SHAHNAZ C, ZHU W P, AHMAD M O. A robust pitch estimation algorithm in noise [C]// Proceedings of 2007 IEEE International Conference on Acoustics, Speech, and Signal Proces?sing. Honolulu: IEEE, 2007: 1073?1076.

[9] WU M, WANG D L, BROWN G J. A multipitch tracking algorithm for noisy speech [J]. IEEE transactions on speech and audio processing, 2003, 11(3): 229?241.

[10] HAN Kun, WANG Deliang. Neural network based pitch tracking in very noisy speech [J]. IEEE transactions on audio, speech and language processing, 2014, 22(12): 2158?2168.

[11] GOSAIN A, SHARMA G. A survey of dynamic program analysis techniques and tools [J]. Advances in intelligent systems and computing, 2014, 327: 113?122.

[12] JIN Z, WANG D L. HMM?based multipitch tracing for noisy and reverberant speech [J]. IEEE/ACM transactions on audio, speech and language processing, 2011, 19(5): 1091?1102.

[13] GONZALEZ S, BROOKES M. PEFAC: a pitch estimation algorithm robust to high levels of noise [J]. IEEE/ACM transactions on audio, speech and language processing, 2014, 22(2): 518?530.

[14] MCLACHLAN G, PEEL D. Finite mixture models [M]. New York: Wiley?Blackwell, 2000.

[15] TALKIN D. A robust algorithm for pitch tracking (RAPT) [R]. Amsterdam: Elsevier, 1995: 495?518.

[16] DE CHEVEGNE A, KAWAHARA H. YIN, a fundamental frequency estimator for speech and music [J]. Journal of the acoustical society America, 2002, 111(4): 1917?1930.

[17] SHAHNAZ C, ZHU W P, AHMAD M O. Pitch estimation based on a harmonic sinusoidal autocorrelation model and a time?domain matching scheme [J]. IEEE transactions on audio, speech and language processing, 2012, 20(1): 322?335.

[18] FENG Huang, TAN Lee. Pitch estimation in noisy speech using accumulated peak spectrum and sparse estimation technique [J]. IEEE transactions on audio, speech and language processing, 2013, 21(1): 99?109.

第7篇:卷積神經(jīng)網(wǎng)絡(luò)的步驟范文

【關(guān)鍵詞】 遙感 城市擴(kuò)張 城市范圍 分類

1 引言

隨著我國經(jīng)濟(jì)持續(xù)快速的增長,我國進(jìn)入城市數(shù)量和體量快速增長的階段。城市的發(fā)展與擴(kuò)張,引起了諸多學(xué)者的關(guān)注,然而城市范圍的界定往往是研究城市擴(kuò)張的前提,而利用遙感進(jìn)行城市范圍提取正趨于成熟。

遙感是指不與探測目標(biāo)相接觸,從遠(yuǎn)處把目標(biāo)的電磁波特性記錄下來,通過分析揭示出物體的特征性質(zhì)及其變化的綜合性探測技術(shù)[1]。由于遙感具有大面積同步觀測、時效性、綜合性、經(jīng)濟(jì)性等特點(diǎn),因而在城市范圍提取中被廣泛使用,如阿里木江?卡斯木[2]等在研究塔什干市城市擴(kuò)張時同時使用了TM、ETM+、ALOS-AVNIR2三種影像數(shù)據(jù)。在眾多關(guān)于城市擴(kuò)張的研究中,對城市范圍的提取方法種類繁多,本文基于各方法特點(diǎn),將如今主要的基于遙感影像的城市范圍提取方法歸納總結(jié)為基于人工解譯方法,基于圖像分類方法,基于光譜指數(shù)和指數(shù)模型方法,基于相關(guān)因素提取方法這四種方法。

2 方法研究

2.1 基于人工解譯方法

人工解譯方法主要是指目視解譯,它憑借解譯人員的經(jīng)驗(yàn)知識,將遙感圖像轉(zhuǎn)換成可以被非專業(yè)人士理解的現(xiàn)實(shí)中的實(shí)物。作為傳統(tǒng)的判別方法,人工解譯的方法一般精度較高,但工作量大。王茜[3]等在對南京市城市擴(kuò)展的研究中將預(yù)處理和幾何糾正的圖形直接進(jìn)行人機(jī)交互目視解譯的方法,對南京市市區(qū)成片的區(qū)域在計(jì)算機(jī)中勾畫,由此獲得南京市城市范圍。

人工目視解譯作為遙感研究人員必備的一項(xiàng)技能,但在如今遙感技術(shù)智能化,高效化的發(fā)展過程中,其作為城市范圍提取方法的核心作用越來越小,更多的只能作為一種輔助判別方法或是對成果進(jìn)行檢驗(yàn)的手段。人工目視解譯本身也受到解譯標(biāo)志、圖像質(zhì)量、解譯人員的經(jīng)驗(yàn)等因素的影響[4],所以在解譯的過程中應(yīng)該在這些方面引起足夠重視以保證解譯的質(zhì)量。

2.2 基于圖像分類方法

遙感圖像分類分為非監(jiān)督分類與監(jiān)督分類,其為獲取遙感圖像信息最常見的處理方法。非監(jiān)督分類是指人們事先對分類過程不加入任何先驗(yàn)知識,而僅憑遙感圖像中地物光譜特征進(jìn)行分類,分類結(jié)果不能確定類別屬性,相對的監(jiān)督分類則是引入已知類別象元作為訓(xùn)練區(qū)再對圖像進(jìn)行分類[5]。

在遙感影像的城市范圍提取中首先會對圖像進(jìn)行預(yù)處理與增強(qiáng),增大城市與非城市像元DN值的差別,再對影像進(jìn)行分類,從而區(qū)分出城市與非城市區(qū)域。圖像處理方法的選擇對城市區(qū)域分類結(jié)果有很大的影響。如楊恒喜[6]等在提取昆明市圖像中,先對圖像做了直方圖均衡化處理,將DN值域增大使其呈正太分布,增強(qiáng)了圖像上地物與地物之間的反差,再利用非監(jiān)督分類的方法提取了城市建成區(qū)域,得到城市面積大小。余新朝[7]利用植被差值歸一化指數(shù)閾值的設(shè)定,經(jīng)過波段運(yùn)算處理后,單獨(dú)對圖像進(jìn)行監(jiān)督或非監(jiān)督分類都不能取得良好效果,而在結(jié)合了多次監(jiān)督與非監(jiān)督分類的方法后才較為準(zhǔn)確地生成了城市建成區(qū)范圍圖。

基于圖像分類的城市范圍提取方法在很大程度上減輕了研究人員解譯的工作強(qiáng)度,并能得到較為準(zhǔn)確的結(jié)果。分類前的圖像處理方法多樣,且多內(nèi)置于影像處理軟件中,操作簡單,效果顯著;另一方面,分類算法中如最大似然分類、馬氏距離分類等逐漸完善,人工神經(jīng)網(wǎng)絡(luò)等更智能的分類算法的出現(xiàn),使圖像分類結(jié)果更加準(zhǔn)確,也使該方法在提取城市范圍中得到更廣泛的認(rèn)可。

2.3 基于光譜指數(shù)和指數(shù)模型方法

由于地物對太陽光的反射和吸收存在差異,導(dǎo)致不同波段中的地物反射信息存在差異,研究人員利用這種差異將衛(wèi)星不同波段探測數(shù)據(jù)進(jìn)行組合運(yùn)算,得到反映研究所需特定信息的指數(shù),稱之為光譜指數(shù),而提取這種指數(shù)的特定方法則稱為指數(shù)模型。

基于此方法的城市范圍提取也隨著相關(guān)的光譜指數(shù)和指數(shù)模型如歸一化差異建筑指數(shù)(Normalized Difference Built-up Index, NDBI)[8]、圖像卷積運(yùn)算模型[9]等的發(fā)展而得到大量應(yīng)用。NDBI相對來說使用最廣泛,它是在對歸一化植被指數(shù)NDVI經(jīng)過深入研究后的拓展,最早由楊山[10]對提取無錫市城鄉(xiāng)聚落空間信息而提出,稱之為仿植被歸一化指數(shù)。Y.ZHA[8]等基于TM數(shù)據(jù)的TM4與TM5波段特性,得到表達(dá)式

NDBI=(band5-band4)/(band5+band4)

運(yùn)算后城鎮(zhèn)區(qū)域的亮度值增大,其他區(qū)域的亮度值都減小,其中NDBI>0的部分為城市,NDBI≤0的部分為非城市區(qū),從而提取出城市范圍。NDBI在分類中也存在不足,鄧文勝等[11]就曾證明其在大面積復(fù)雜區(qū)域的應(yīng)用效果不是很好?;诖斯庾V指數(shù)的城市范圍方法也在不斷的改進(jìn),徐涵秋[12]就放棄了單純使用NDBI,同時利用了NDBI、土壤調(diào)節(jié)指數(shù)SAVI、修正歸一化差異調(diào)節(jié)指數(shù)MNDWI將ETM+數(shù)據(jù)的六個波段壓縮為呈不相關(guān)的三個波段,并用譜間信息的相關(guān)性邏輯運(yùn)算,提取出城市建成區(qū)域,且抽樣驗(yàn)證精度達(dá)到 91.3%。

基于光譜指數(shù)和指數(shù)模型方法充分利用了圖像波段間的光譜信息差異,城市范圍確定精度通常高于基于圖像分類方法的結(jié)果。由于此方法充分挖掘了城市地物與非城市地物間光譜信息異同,所以光譜指數(shù)和指數(shù)模型方法的可重用性更加強(qiáng),適用范圍也更加廣泛。

2.4 基于相關(guān)因素提取方法

城市作為一個綜合體,其包容的元素多樣,所表現(xiàn)的性質(zhì)從不同的角度觀察也有不同的結(jié)果,因此,除了如上常用的一些方法外,還有一些利用相關(guān)因素間接提取出城市范圍的方法。

基于不透水面的確定來提取城市范圍的方法。廣義的不透水面(Impervious Surface Area,ISA)是指天然或人為建造,能夠隔離地表水滲透到土壤,進(jìn)而改變洪水徑流的流動、物質(zhì)沉淀和污染剖面的任何物質(zhì)[13]。目前研究的人工不透水面多指停車場,道路,屋頂,廣場等地物,然而這些地物也是城市的組成部分,再加上如今城市的建設(shè)都離不開人工修建的不透水面,所以對城市不透水面范圍的確定,在一定程度上可以看作是對城市范圍的確定。白楊[14]等人已經(jīng)完成了在不透水面的基礎(chǔ)上,用面向?qū)ο蟮姆椒?,對城市建成區(qū)域的提取,得到的城市范圍基本與實(shí)際吻合。

基于地表溫度的確定來提取城市范圍的方法。地表溫度主要受地表覆蓋物影響,由于城市建設(shè),城市地表主要被水泥等人工化合物取代,導(dǎo)致與農(nóng)田、林地、水體等自然覆蓋物的地表溫度有明顯差異。李昕瑜[15]等人就已經(jīng)通過反演地表亮溫發(fā)現(xiàn),地表溫度與歸一化不透水面指數(shù)NDISI、NDBI呈正相關(guān)。王躍[16]等更是利用Landsat的熱紅外波段,將反演的亮溫以296K為界,提取出了蘇州市城市范圍。

基于這些相關(guān)因素提取來提取城市范圍的方法突破了以往比較固定的思維,為城市區(qū)域研究提供了一種新的思路。但此方法的不足在于難以驗(yàn)證這些相關(guān)因素和城市范圍之間的聯(lián)系緊密度,因而有時會對準(zhǔn)確提取城市范圍造成較大影響。

3 結(jié)論與討論

城市范圍的提取在對城市擴(kuò)張、城市總體規(guī)劃、城市生態(tài)環(huán)境等研究中都具有基礎(chǔ)性的作用。隨著對城市的研究增多,出現(xiàn)了多種多樣的城市范圍提取方法,經(jīng)過對大量研究的對比總結(jié),基于對各種方法的主體思想或關(guān)鍵步驟的分析,本文將眾多城市范圍提取的方法歸納為人工解譯方法、圖像分類方法、光譜指數(shù)與光譜模型方法以及相關(guān)因素提取方法。

經(jīng)過分類后的對比還發(fā)現(xiàn),人工解譯方法提取的相對精度較高,但進(jìn)度慢,耗時多;圖像分類方法較人工解譯方法更加便捷,但結(jié)果相對較差,同時分類前的影像處理和分類方法的選擇對分類的結(jié)果有較大的影響;光譜指數(shù)與光譜模型方法在指數(shù)和模型建立之前需要進(jìn)行大量的分析,但其方法適應(yīng)范圍廣,同時對城市范圍的提取結(jié)果又有充分的物理依據(jù);相關(guān)因素提取方法通過對城市特有的相關(guān)信息的提取來確定城市范圍,此方法思路新穎,發(fā)展前景廣,但相關(guān)因素與城市相關(guān)性的確定將是其研究的重點(diǎn)與難點(diǎn)。各種方法雖有不同之處,但在研究中往往又相互聯(lián)系,相互補(bǔ)充,使城市范圍的提取朝著更加精確的方向發(fā)展。

隨著中國經(jīng)濟(jì)的發(fā)展,城市的擴(kuò)張還將持續(xù),由此給我們帶來的影響,將會引起越來越多學(xué)者的關(guān)注。筆者認(rèn)為,隨著遙感信息提取技術(shù)的發(fā)展,多源數(shù)據(jù)的應(yīng)用,以及土地信息數(shù)據(jù)庫的完善,基于遙感的城市范圍研究也必然會有新的突破。

參考文獻(xiàn):

[1]梅安新等編著.遙感導(dǎo)論.北京市:高等教育出版社,2001.

[2]阿里木江?卡斯木,阿斯耶姆?圖爾迪.基于遙感數(shù)據(jù)的塔什干市城市擴(kuò)展時空特征分析[J].新疆師范大學(xué)學(xué)報(bào)(自然科學(xué)版),2012,(第2期).

[3]王茜,張?jiān)鱿?,易玲,譚文彬,王長友.南京城市擴(kuò)展的遙感研究[J].長江流域資源與環(huán)境,2007,(第5期).

[4]姜放,張國勇.遙感圖像目視解譯值得注意的幾個問題[J].長春工程學(xué)院學(xué)報(bào)(自然科學(xué)版),2002,(第3期).

[5]湯國安等編著.遙感數(shù)字圖像處理.北京市:科學(xué)出版社,2004.

[6]楊恒喜,史正濤,陳可偉.基于遙感影像的1992-2002年昆明市城區(qū)擴(kuò)張及驅(qū)動力分析[J].環(huán)境科學(xué)與管理,2010,(第6期).

[7]余新朝.基于多時相遙感影像的城市演變分析[J].城市勘測,2013,(第6期).

[8]Zha, Y. Y., Gao, J. J., & Ni, S. S. (2003). Use of normalized difference built-up index in automatically mapping urban areas from TM imagery. International Journal Of Remote Sensing, 24(3), 583.

[9]MUXiaodong,LIUHuiping,WANGHongbin.Application of image convolution to extract the urban extent[J].遙感學(xué)報(bào),2011,(第6期).

[10]楊山.發(fā)達(dá)地區(qū)城鄉(xiāng)聚落形態(tài)的信息提取與分形研究:以無錫市為例[J].地理學(xué)報(bào),2000,(第6期).

[11]鄧文勝,關(guān)澤群,王昌佐.從TM影像中提取城鎮(zhèn)建筑覆蓋區(qū)專題信息的改進(jìn)方法[J].遙感信息,2004,(第4期).

[12]徐涵秋.基于譜間特征和歸一化指數(shù)分析的城市建筑用地信息提取[J].地理研究,2005,(第2期).

[13]SloneckerET,JenningsD,GarofaloD. RemoteSensingof ImperviousSurfaces: AReview[J]. Remote Sensing Reviews,2001,20(3):227-255.

[14]白楊,寧曉剛,張繼賢.基于不透水面和引力模型的城市建成區(qū)提取與分析[J].測繪科學(xué),2014,(第1期).