av色综合网,成年片色大黄全免费网站久久,免费大片黄在线观看,japanese乱熟另类,国产成人午夜高潮毛片

公務(wù)員期刊網(wǎng) 精選范文 如何學(xué)習(xí)計(jì)算機(jī)視覺(jué)范文

如何學(xué)習(xí)計(jì)算機(jī)視覺(jué)精選(九篇)

前言:一篇好文章的誕生,需要你不斷地搜集資料、整理思路,本站小編為你收集了豐富的如何學(xué)習(xí)計(jì)算機(jī)視覺(jué)主題范文,僅供參考,歡迎閱讀并收藏。

如何學(xué)習(xí)計(jì)算機(jī)視覺(jué)

第1篇:如何學(xué)習(xí)計(jì)算機(jī)視覺(jué)范文

關(guān)鍵詞:計(jì)算機(jī)視覺(jué);研討式教學(xué);小組探討;課前回顧

作者簡(jiǎn)介:陳芳林(1983-),男,湖南株洲人,國(guó)防科學(xué)技術(shù)大學(xué)機(jī)電工程與自動(dòng)化學(xué)院,講師;周宗潭(1969-),男,河南洛陽(yáng)人,國(guó)防科學(xué)技術(shù)大學(xué)機(jī)電工程與自動(dòng)化學(xué)院,教授。(湖南 長(zhǎng)沙 410073)

中圖分類號(hào):G643.2 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1007-0079(2013)26-0065-02

進(jìn)入21世紀(jì),創(chuàng)新型人才的培養(yǎng)成為各國(guó)政府和高等教育界關(guān)注的一個(gè)焦點(diǎn)。世界各國(guó)研究型大學(xué)的共同特點(diǎn)是在研究生教育階段致力于培養(yǎng)富有創(chuàng)新意識(shí)和創(chuàng)新能力的高級(jí)人才。[1]研討式教學(xué)是培養(yǎng)研究生創(chuàng)新精神、科研能力的有效途徑,教師講解與學(xué)生探討兩部分相結(jié)合是研討式教學(xué)采用的主要模式。[2]將課程分成兩部分之后,教師講解的時(shí)間就必須壓縮,教師一方面需要思考如何在較短的時(shí)間內(nèi)完成課程的講解,同時(shí)還需要考慮課程講解要與學(xué)生探討部分緊密結(jié)合。因此,如何上好研討式教學(xué)教師講解這部分課,越來(lái)越受高等院校的重視。本文針對(duì)筆者教授工科研究生課程“計(jì)算機(jī)視覺(jué)”的實(shí)踐與經(jīng)驗(yàn),闡述了筆者對(duì)于如何上好研討式教學(xué)教師講解這部分課的個(gè)人體會(huì)。總結(jié)為兩點(diǎn):第一,首先要充分做好課程準(zhǔn)備;第二,上課環(huán)節(jié)采取回顧—案例—小結(jié)的講解方式。下面從課程準(zhǔn)備、課前回顧、課程講解、課后小結(jié)四個(gè)方面分別闡述(如圖1所示)。

一、“計(jì)算機(jī)視覺(jué)”課程準(zhǔn)備

要上好一門研討式教學(xué)的課程,一定要結(jié)合該門課程的特點(diǎn),量身定制課程內(nèi)容,進(jìn)行精心準(zhǔn)備。本節(jié)先介紹“計(jì)算機(jī)視覺(jué)”課程的特點(diǎn),然后結(jié)合該門課程的特點(diǎn),介紹筆者對(duì)于“計(jì)算機(jī)視覺(jué)”的課程準(zhǔn)備。

1.“計(jì)算機(jī)視覺(jué)”課程特點(diǎn)

“計(jì)算機(jī)視覺(jué)”是“數(shù)字圖像處理”和“模式識(shí)別”等課程的后續(xù)課程。該課程重點(diǎn)在于圖像或者圖像序列的分析理解。課程知識(shí)在機(jī)器人導(dǎo)航、偵查、測(cè)繪、測(cè)量、精密加工和目標(biāo)跟蹤等多個(gè)領(lǐng)域都有廣泛的應(yīng)用。[3]近年來(lái)基于視覺(jué)信息的控制反饋也開(kāi)始受到廣泛關(guān)注。國(guó)內(nèi)高校一般都為研究生開(kāi)設(shè)了此門課程。

計(jì)算機(jī)視覺(jué)技術(shù)應(yīng)用廣泛、算法原理涉及面廣:涉及到概率與數(shù)理統(tǒng)計(jì)、信號(hào)與系統(tǒng)、圖像等基礎(chǔ)知識(shí)?!坝?jì)算機(jī)視覺(jué)”是一門重要的控制類、電子類及計(jì)算機(jī)類專業(yè)研究生的選修課程,它內(nèi)容廣泛、綜合性強(qiáng),研討能力的培養(yǎng)顯得非常關(guān)鍵。

2.課程準(zhǔn)備

首先,結(jié)合“計(jì)算機(jī)視覺(jué)”課程內(nèi)容廣泛、技術(shù)日益更新和豐富的特點(diǎn),將課程36學(xué)時(shí)分為12次課,每次課為3小時(shí),每堂課教師講解一個(gè)專題。這種設(shè)計(jì),一方面可以更廣地涉及計(jì)算機(jī)視覺(jué)的各個(gè)領(lǐng)域;另一方面以專題的形式來(lái)講解,可以將學(xué)生帶入到該專題,介紹基本背景、理論、知識(shí)和方法,讓學(xué)生有一個(gè)初步的了解,方便課后學(xué)生對(duì)感興趣的專題進(jìn)一步深入挖掘與研究。

其次,在課程開(kāi)始之前,教師仔細(xì)統(tǒng)籌,安排好每次課的專題,這樣既方便學(xué)生一開(kāi)始對(duì)整個(gè)課程有一個(gè)整體的了解,也方便學(xué)生選擇課堂研討的題目與內(nèi)容。根據(jù)12個(gè)專題,將各個(gè)專題講解的內(nèi)容與課件在開(kāi)課之前準(zhǔn)備好,這樣有利于把握各個(gè)專題之間的前后承接關(guān)系。例如,“區(qū)域”與“分割”是既有區(qū)分又有聯(lián)系的兩個(gè)專題,在課程開(kāi)始之前,將課件準(zhǔn)備好,就有利于宏觀把握,在“區(qū)域”專題提到的分割算法,就不需要在“分割”專題再次重復(fù),而在“分割”專題可以結(jié)合前面“區(qū)域”專題進(jìn)行互相補(bǔ)充,以幫助學(xué)生融會(huì)貫通。

最后,在每個(gè)專題上課之前,再對(duì)課件進(jìn)行精雕細(xì)琢,主要是對(duì)內(nèi)容分好層次,對(duì)方法進(jìn)行分類,力圖在較短的時(shí)間內(nèi),讓學(xué)生對(duì)該專題有較全面的認(rèn)識(shí)。例如,在講解圖像分割時(shí),由于圖像分割方法非常多,可以將分割方法分為若干個(gè)大類,每個(gè)大類只講1~2個(gè)方法。這樣既可以盡可能涉及更廣的領(lǐng)域,又可以提高講解的效率。

二、“計(jì)算機(jī)視覺(jué)”課前回顧

課前回顧是指每堂課的前面一小段時(shí)間用來(lái)回顧上一堂課的內(nèi)容。雖然課前回顧時(shí)間非常短,一般為3~8分鐘,但是課前回顧是課堂教學(xué)中的一個(gè)重要環(huán)節(jié)。課前回顧可以幫助學(xué)生加強(qiáng)將要學(xué)習(xí)的內(nèi)容與已學(xué)過(guò)內(nèi)容之間的聯(lián)系。通過(guò)課前回顧,學(xué)生可以回憶前續(xù)課程所講解的概念、理論、算法的步驟等內(nèi)容,有助于解決新問(wèn)題或者理解新知識(shí)。

課前回顧最重要的是既要復(fù)習(xí)前續(xù)課程的內(nèi)容,又要注意將前續(xù)內(nèi)容與當(dāng)前內(nèi)容聯(lián)系起來(lái)。由于講解時(shí)間有限,要使研討式教學(xué)的教師講解部分效率高,教師幫助學(xué)生回憶上堂課的概念、模型、算法等內(nèi)容,就變得非常重要。如果不做課前回顧,那么當(dāng)講到某處新知識(shí)時(shí),往往需要停下來(lái),將前續(xù)課程再講一遍,否則學(xué)生無(wú)法理解新的知識(shí),這樣就降低了教學(xué)的效率。

課前回顧的時(shí)間,一般以3~8分鐘為宜。課前回顧的形式可以多樣化,如講解課后作業(yè)、回顧概念、提問(wèn)等。筆者認(rèn)為應(yīng)根據(jù)當(dāng)天課程與前續(xù)課程的關(guān)系,采取合適的方式。各種方式結(jié)合使用,提高課前回顧的效率。

三、“計(jì)算機(jī)視覺(jué)”課程講解——案例教學(xué)

案例教學(xué)已經(jīng)成功地應(yīng)用于數(shù)學(xué)、計(jì)算機(jī)科學(xué)等領(lǐng)域的教學(xué)。通過(guò)案例,學(xué)生可以很快地掌握相應(yīng)的概念、算法的步驟等,從而提高教師講解部分的效率。[4]例如,在講解馬爾科夫隨機(jī)場(chǎng)時(shí),筆者通過(guò)案例式教學(xué),將馬爾科夫隨機(jī)場(chǎng)用一個(gè)生活中的例子來(lái)向?qū)W生解釋。首先,將馬爾科夫隨機(jī)場(chǎng)分解成兩個(gè)重要的概念,分別是隨機(jī)場(chǎng)與馬爾科夫性,然后將它們對(duì)應(yīng)到例子中,幫助學(xué)生理解。

隨機(jī)場(chǎng)包含兩個(gè)要素:位置(site)和相空間(phase space)。當(dāng)給每一個(gè)“位置”中按照某種分布隨機(jī)賦予“相空間”的一個(gè)值之后,其全體就叫做隨機(jī)場(chǎng)(如圖2(a))。[5]這個(gè)概念非常抽象,難以理解。筆者應(yīng)用案例式教學(xué),拿莊稼地來(lái)打比方?!拔恢谩焙帽仁且划€畝農(nóng)田,“相空間”好比是種的各種莊稼。給不同的地種上不同的莊稼,就好比給隨機(jī)場(chǎng)的每個(gè)“位置”,賦予“相空間”里不同的值。所以,可以形象地理解隨機(jī)場(chǎng)就是在哪塊地里種什么莊稼的布局(如圖2(b))。

馬爾科夫性指的是一個(gè)隨機(jī)變量序列按時(shí)間先后順序依次排開(kāi)時(shí),第N+1時(shí)刻的分布特性,與N時(shí)刻以前的隨機(jī)變量的取值無(wú)關(guān)。為了更直觀地理解馬爾科夫性,筆者仍然拿莊稼地打比方,如果任何一塊地里種的莊稼的種類僅僅與它鄰近的地里種的莊稼的種類有關(guān),與其他地方的莊稼的種類無(wú)關(guān),這種性質(zhì)就是馬爾科夫性。

符合上述兩個(gè)特征,那么這些地里種的莊稼的集合,就是一個(gè)馬爾科夫隨機(jī)場(chǎng)。通過(guò)案例式教學(xué),筆者發(fā)現(xiàn)可以加深加快學(xué)生對(duì)課程內(nèi)容的理解,提高教師講解環(huán)節(jié)的效率。

四、課后小結(jié)

課后小結(jié)指的是一堂課將要結(jié)束時(shí),教師對(duì)本堂課進(jìn)行一個(gè)簡(jiǎn)短的總結(jié)。許多成功的教師都會(huì)在其教學(xué)中堅(jiān)持課后小結(jié)這個(gè)環(huán)節(jié),給學(xué)生一個(gè)總體的印象,以幫助學(xué)生消化本次課程的內(nèi)容。

研討式教學(xué)教師講解部分的課后小結(jié)與普通教學(xué)方式應(yīng)有所區(qū)別。筆者認(rèn)為這主要是因?yàn)橥ㄟ^(guò)課后小結(jié)可以將本次課程所講內(nèi)容與學(xué)生的研討環(huán)節(jié)結(jié)合起來(lái),而不僅僅是對(duì)內(nèi)容進(jìn)行簡(jiǎn)單的總結(jié)。

為了達(dá)到課后小結(jié)使本次課程內(nèi)容與學(xué)生探討環(huán)節(jié)建立聯(lián)系的目的,筆者在教學(xué)中常采用如下方式:首先,像普通教學(xué)方式一樣,總結(jié)本次課程內(nèi)容;然后,在此基礎(chǔ)上,拋出若干問(wèn)題,這些問(wèn)題,不需要學(xué)生馬上解答,而是留給學(xué)生課后思考,提供他們選擇研討主題的素材;最后,介紹其他在本次課程中沒(méi)有涉及到的前沿知識(shí)、方法與理論,拓寬學(xué)生的視野,從而增加學(xué)生選擇探討主題的覆蓋面。

通過(guò)應(yīng)用這種方式,筆者發(fā)現(xiàn)學(xué)生的思維更開(kāi)闊,在探討環(huán)節(jié),學(xué)生往往可以選擇一些比較新穎的主題(例如視頻中不動(dòng)點(diǎn)的檢測(cè)等),而不僅僅局限于教師所講內(nèi)容,從而提高了研討式教學(xué)的效果。

五、結(jié)論

在“計(jì)算機(jī)視覺(jué)”課程中引入研討式教學(xué),通過(guò)總體設(shè)計(jì)規(guī)劃好整門課程內(nèi)容,課堂講解注意采用回顧—案例—小結(jié)的方式,筆者對(duì)如何上好研討式教學(xué)教師講解這部分課進(jìn)行了個(gè)人經(jīng)驗(yàn)的總結(jié)。通過(guò)本次教學(xué)改革,筆者體會(huì)到如果要提高教學(xué)效果,一定要注意教師講解與學(xué)生探討兩個(gè)環(huán)節(jié)的緊密結(jié)合。

參考文獻(xiàn):

[1]侯婉瑩.我國(guó)研究型大學(xué)本科生科研研究[D].濟(jì)南:山東大學(xué),

2009.

[2]張晴,李騰,韋艷,等.研討式教學(xué)模式的理論研究[J].中國(guó)科技縱橫,2011,(10).

[3]D.H .巴拉德.計(jì)算機(jī)視覺(jué)[M].北京:科學(xué)出版社,1987.

第2篇:如何學(xué)習(xí)計(jì)算機(jī)視覺(jué)范文

【關(guān)鍵詞】計(jì)算機(jī)視覺(jué);數(shù)字色彩;感性認(rèn)知

一、色彩的視覺(jué)生理機(jī)制與計(jì)算機(jī)色彩設(shè)置的關(guān)系

眼睛是人類的視覺(jué)器官,視覺(jué)系統(tǒng)就像一架攝相機(jī),具有較完善的光學(xué)系統(tǒng)及各種使眼球轉(zhuǎn)動(dòng)并調(diào)節(jié)光學(xué)裝置的肌肉組織。光線透過(guò)眼的折光系統(tǒng)到達(dá)視網(wǎng)膜,并在視網(wǎng)膜中形成物像,同時(shí)興奮視網(wǎng)膜的感光細(xì)胞,然后,信息沿視神經(jīng)傳導(dǎo)到大腦皮質(zhì)的視覺(jué)中樞產(chǎn)生視覺(jué)。實(shí)現(xiàn)閱讀的第一反應(yīng)區(qū)域處于大腦后方的枕葉皮層(視覺(jué)皮層),人類的視覺(jué)系統(tǒng)自動(dòng)對(duì)視覺(jué)輸入構(gòu)建結(jié)構(gòu),并在神經(jīng)系統(tǒng)層面上感知形狀、圖形、物體。

視覺(jué)能夠感受到物體細(xì)節(jié),通常稱為視覺(jué)視敏度,也就是對(duì)所觀察的實(shí)物細(xì)節(jié)或圖像細(xì)節(jié)的辨別能力,具體量化起來(lái)就是能分辨出平面上的兩個(gè)點(diǎn)的能力。人眼的分辨能力是有限的,在一定距離、一定對(duì)比度和一定亮度的條件下,人眼只能區(qū)分出小到一定程度的點(diǎn),如果點(diǎn)更小,就無(wú)法看清。以光學(xué)色彩為基礎(chǔ)的計(jì)算機(jī)顯示器,熒屏上的數(shù)字色彩是由許多紅、綠、藍(lán)紫三原光小色點(diǎn)構(gòu)成,以不同比例的混合得出自然界的各種顏色。在各種顏色的反射光快速地先后刺激或同時(shí)刺激人眼過(guò)程中,顯示器色光點(diǎn)過(guò)于細(xì)小,超出人眼能夠分辨的視敏度,待傳到人眼中識(shí)別時(shí),視覺(jué)不能識(shí)別全部微妙變化的色彩波段,視覺(jué)對(duì)相似的色彩歸納在一起,光在人眼中留下的印象在視覺(jué)中混合,將信息傳入大腦皮層,印象由人的視覺(jué)器官完成視覺(jué)混合。色彩混合后明度是被混合色的平均明度,混合效果近看色彩豐富,遠(yuǎn)看色調(diào)統(tǒng)一。

電腦顯示器工作時(shí)的正常顯示狀態(tài)是根據(jù)人的視覺(jué)明視而設(shè)計(jì)的,開(kāi)機(jī)工作狀態(tài)下,感知顯示圖像的始終是視錐細(xì)胞。視覺(jué)明視中感受相當(dāng)光照水平和顏色刺激的視錐細(xì)胞中含有感紅色素、感綠色素和感藍(lán)色素,三類視椎細(xì)胞分別對(duì)紅綠藍(lán)色(RGB)光敏感。這意味著,人類的色覺(jué)與計(jì)算機(jī)顯示器類似,人們感知世界的視覺(jué)狀態(tài)基本處于視覺(jué)明視,通過(guò)紅綠藍(lán)色像素探測(cè)形成多種顏色,使人在視覺(jué)明視中感知到真實(shí)的色彩。

二、計(jì)算機(jī)視覺(jué)色彩感知中的敏感源

在適當(dāng)?shù)臈l件下,視覺(jué)對(duì)光的強(qiáng)度具有敏感性。眼睛對(duì)暗適應(yīng)越久,對(duì)光的反應(yīng)越敏感。視覺(jué)對(duì)光強(qiáng)度(明度)感受存在一段適合閾值。強(qiáng)度閾值內(nèi)可以讀取色彩,而在強(qiáng)度的閾值以外,人眼只能看出光亮卻看不出顏色,明度過(guò)高分辨不出顏色。計(jì)算機(jī)顯示亮度的設(shè)置是參考視覺(jué)感受亮度的共性閾值而設(shè)計(jì)的,適合閾值范圍內(nèi),視覺(jué)可以讀取計(jì)算機(jī)顯示器中色彩。

視覺(jué)對(duì)光波長(zhǎng)的敏感性不同于對(duì)光強(qiáng)度的敏感性。視網(wǎng)膜的不同部位對(duì)色調(diào)的敏感性是不同的。視網(wǎng)膜中央凹能分辨各種顏色,從中央凹到邊緣部分,對(duì)顏色的辨別能力逐漸減弱,先喪失紅、綠色的感受性,最后黃、藍(lán)色的感受性也喪失,成了全色盲。在整個(gè)光譜上,人眼能分辨出大約150種不同的顏色(光波),但人對(duì)光波(顏色)的辨別感受能力因不同波長(zhǎng)而不一樣。

在視覺(jué)感知計(jì)算機(jī)色彩過(guò)程中色彩認(rèn)知心理的共性經(jīng)驗(yàn)可以產(chǎn)生敏感源。色彩認(rèn)知心理來(lái)源于生活共性經(jīng)驗(yàn)的理性“歸納”。視覺(jué)生理機(jī)制的共同特征使色彩視覺(jué)感知存在基本相同的生理基礎(chǔ)。色彩的直接心理效應(yīng)來(lái)自色彩的物理光刺激對(duì)人的生理發(fā)生的直接影響,視覺(jué)生理及視覺(jué)心理等方面的共性特征使人們?cè)谏室曈X(jué)意象存在相似的感受。視覺(jué)感知過(guò)程中,以往的認(rèn)知結(jié)構(gòu)對(duì)現(xiàn)有的認(rèn)知過(guò)程的影響,生活經(jīng)驗(yàn)影響人的認(rèn)知心理變化過(guò)程,心理之間的相互聯(lián)系、相互制約,使人類認(rèn)知過(guò)程相近的模式。著名的認(rèn)知心理學(xué)家布魯納認(rèn)為,在人們認(rèn)知的過(guò)程中,必須考慮到通過(guò)視覺(jué)感官對(duì)客觀聯(lián)系的色彩信息進(jìn)行組織,結(jié)合視覺(jué)經(jīng)驗(yàn)感知新的客觀事物,用歸納方法能找出事物的共性,“感知”出相互聯(lián)系的客觀事物中相近的東西。

色彩心理共性源于“經(jīng)驗(yàn)色”。人類可以通過(guò)本能的眼睛或是肢體觸探物質(zhì)本身的微妙變化感知生活,不斷產(chǎn)生認(rèn)知“經(jīng)驗(yàn)”。在歷史和風(fēng)俗的影響下,色彩所蘊(yùn)藏的深層意義來(lái)至生活經(jīng)歷的聯(lián)想,視覺(jué)色彩通過(guò)聯(lián)想鏈來(lái)理解傳播信息。在生活實(shí)踐中,不同的色彩刺激結(jié)合識(shí)別色彩的習(xí)慣與經(jīng)驗(yàn),形成明顯的情緒感,產(chǎn)生不同的情緒反射,使人既能感覺(jué)積極興奮,也能使人消沉或感傷,其影響最明顯的是色相。純度的關(guān)系也很大,高純度色有興奮感,低純度色有沉靜感。明度也可以表現(xiàn)情緒,暖色系中高明度、高純度的色彩呈興奮感,低明度、低純度的色彩呈沉靜感。利用色彩視覺(jué)心理經(jīng)驗(yàn)有利于完成認(rèn)知任務(wù),對(duì)于實(shí)際生活具有很強(qiáng)的指導(dǎo)性,這些“經(jīng)驗(yàn)”向我們明確地肯定了色彩對(duì)人心理的影響具有共性。

色彩心理共性源于人們學(xué)習(xí)和推理。在認(rèn)知過(guò)程中人類情感普遍交流的同時(shí)產(chǎn)生相互認(rèn)同,不斷找到與周圍的環(huán)境現(xiàn)象結(jié)合的個(gè)人經(jīng)驗(yàn)。知識(shí)學(xué)習(xí)積累物質(zhì)的色彩、材料、形狀、物理的空間、運(yùn)動(dòng)與時(shí)間等認(rèn)知共性,這些共通的經(jīng)驗(yàn),可以在大量事實(shí)研究中歸納出一些自然規(guī)律,詮釋事物,形成可以指導(dǎo)和影響社會(huì)發(fā)展的觀點(diǎn)。

三、計(jì)算機(jī)數(shù)字色彩設(shè)計(jì)

人們?cè)诟髯苑指舻氖澜缋锕餐?,色彩視覺(jué)感知受人的經(jīng)歷、記憶力、看法和視覺(jué)靈敏度等各種因素的影響,但相近的生活習(xí)性,相似的生活經(jīng)驗(yàn),使人們會(huì)采用相近的方式理解色彩。感性色彩的科學(xué)設(shè)計(jì)可以滿足計(jì)算機(jī)視覺(jué)的準(zhǔn)確性,提高網(wǎng)絡(luò)平臺(tái)交互速度,促進(jìn)經(jīng)濟(jì),滿足視覺(jué)風(fēng)尚,幫助高效實(shí)現(xiàn)計(jì)算機(jī)交互。人類共通的視覺(jué)經(jīng)驗(yàn),產(chǎn)生感知色彩的一般規(guī)律,可以歸納出以下計(jì)算機(jī)數(shù)字色彩設(shè)計(jì)法則。

(1)經(jīng)驗(yàn)影響感知,應(yīng)用色彩隱藏的寓意引導(dǎo),盡可能與圖像結(jié)合表達(dá)。例如,每人看云和水滴會(huì)聯(lián)想熟知的圖形,看火會(huì)聯(lián)想到紅橙色的激動(dòng)與熱辣。人們能快速識(shí)別圖像,而且觸發(fā)相關(guān)信息回憶。使用經(jīng)驗(yàn)圖標(biāo),一般人們不需要學(xué)習(xí),就能識(shí)別所提示的意思。

(2)看到和選擇比回憶和輸入要容易。為用戶提供色彩鮮明的選項(xiàng),在顏色之外使用其它提示,讓它們從中選擇,而不是強(qiáng)迫用戶回憶選項(xiàng)再告訴電腦。

(3)使用縮略圖緊湊地描繪全尺寸的圖像??s略圖能讓人一次性看很多選項(xiàng),熟悉的圖形內(nèi)容會(huì)引起注意,方便選擇。使用獨(dú)特的色彩,用飽和度、亮度及色相區(qū)分內(nèi)容。

(4)避免使用色盲人無(wú)法區(qū)分的顏色(例如,色盲人可以識(shí)別白色和不同深淺的綠色地圖)。

(5)將強(qiáng)烈的對(duì)抗色分開(kāi)(強(qiáng)烈的對(duì)抗色使人產(chǎn)生難受的閃爍感)。

(6)利用色彩引導(dǎo)邊界視力,提供低分辨的線索,引導(dǎo)眼球運(yùn)動(dòng)。對(duì)視覺(jué)選擇性感知,邊界視野中的暗色和靜止物體經(jīng)常不被注意到,邊界視線中物體的運(yùn)動(dòng)通常會(huì)被察覺(jué)。例如,出錯(cuò)提示在點(diǎn)擊電腦按鍵位置1-2厘米邊界視力以外,出錯(cuò)提示將不被看到。

(7)物體之間的相對(duì)距離會(huì)影響人們感知它們是否及如何組織在一起。(互相靠近物體看起來(lái)為一組)。例如,計(jì)算機(jī)圖形設(shè)計(jì),拉近距離或分組框和分割線隔開(kāi),減少用戶視覺(jué)凌亂。相似物體視覺(jué)歸屬于一組,色彩中的類似色可以歸屬成一組。

(8)視覺(jué)傾向于感知連續(xù)的形式而不是離散的碎片。例如,形間斷,但色彩相同,視覺(jué)自動(dòng)連續(xù)成完整圖形。例如,計(jì)算機(jī)音量滑動(dòng)條范圍的色彩連續(xù),滑動(dòng)條手柄連續(xù)整體感知(灰色地、紅色條)。

(9)人們傾向于分解復(fù)雜的場(chǎng)景來(lái)降低復(fù)雜度,視覺(jué)自動(dòng)組織并解析數(shù)據(jù),簡(jiǎn)化數(shù)據(jù)。例如,圖計(jì)算機(jī)圖形中應(yīng)用此原理,平面色彩顯示三維物體和復(fù)雜的二維圖形解析為三維場(chǎng)景(假空間錯(cuò)視)。

第3篇:如何學(xué)習(xí)計(jì)算機(jī)視覺(jué)范文

近年來(lái),計(jì)算機(jī)視覺(jué)在安防領(lǐng)域的應(yīng)用正備受關(guān)注,身份識(shí)別是核心問(wèn)題。人臉識(shí)別是一種基于臉部特征信息進(jìn)行身份識(shí)別的技術(shù),人臉檢測(cè)是其中的基礎(chǔ)和關(guān)鍵部分。介紹了四種不同的人臉檢測(cè)技術(shù),分析了相關(guān)的算法和理論,概述了各自的優(yōu)缺點(diǎn)。最后,討論了人臉檢測(cè)技術(shù)今后的研究方向及發(fā)展趨勢(shì)。

【關(guān)鍵詞】計(jì)算機(jī)視覺(jué) 身份識(shí)別 人臉檢測(cè)

1 人臉檢測(cè)問(wèn)題綜述

在國(guó)土安全和社會(huì)安全問(wèn)題日益突顯的背景下,世界各國(guó)家都對(duì)安防領(lǐng)域進(jìn)行不遺余力地投入。隨著計(jì)算機(jī)視覺(jué)技術(shù)的不斷發(fā)展,基于生物特征識(shí)別的身份識(shí)別技術(shù)受到人們的廣泛關(guān)注,在未來(lái)一段時(shí)間內(nèi)生物識(shí)別技術(shù)將成為信息產(chǎn)業(yè)的一次革命。其中人臉識(shí)別技術(shù)作為一種極具潛力的生物識(shí)別方式,以其識(shí)別速度快,主動(dòng)性強(qiáng),性價(jià)比高等顯著的技術(shù)優(yōu)勢(shì),在各個(gè)領(lǐng)域都體現(xiàn)出了巨大的商業(yè)價(jià)值和社會(huì)價(jià)值。

人臉檢測(cè)是人臉識(shí)別的前提和關(guān)鍵,一般采用相機(jī)實(shí)時(shí)采集含有人臉的圖像或視頻流,并自動(dòng)在圖像中對(duì)人臉進(jìn)行檢測(cè)和跟蹤。人臉的自動(dòng)檢測(cè)是一項(xiàng)頗有難度的工作,主要體現(xiàn)在:(1)不同族群年齡等問(wèn)題導(dǎo)致人臉的差異性。(2)人臉上的胡須等附屬物對(duì)檢測(cè)造成的干擾。(3)人體姿態(tài)變化和遮擋物存在對(duì)檢測(cè)的影響。(4)環(huán)境和硬件條件對(duì)圖像采集效果的影響。針對(duì)這些問(wèn)題,國(guó)內(nèi)外著名高校和科研機(jī)構(gòu)進(jìn)行了很多相關(guān)的研究,致力于解決在復(fù)雜背景下如何準(zhǔn)確高效地進(jìn)行人臉檢測(cè)的問(wèn)題。

2 實(shí)現(xiàn)人臉檢測(cè)的相關(guān)技術(shù)

根據(jù)近年來(lái)計(jì)算機(jī)視覺(jué)領(lǐng)域人臉檢測(cè)問(wèn)題的研究進(jìn)展,本文在這里進(jìn)行總結(jié)性綜述,目前人臉檢測(cè)的方法可以分為基于知識(shí)和統(tǒng)計(jì)兩類,有以下四種常用的檢測(cè)算法。

2.1 模板匹配

模板匹配可以分成固定模板和變形模板。固定模板指的是根據(jù)先驗(yàn)數(shù)據(jù)歸納出一個(gè)統(tǒng)一的模板,然后根據(jù)一個(gè)能量函數(shù)確定被檢測(cè)區(qū)域中和模板相關(guān)程度較高的位置,即人臉位置。由于不同人物之間臉部的差異性很大,加上環(huán)境等因素的影響,此方法并不具有很強(qiáng)的實(shí)用性。變形模板原理上和固定模板的操作方式相同,不過(guò)變形模板自身的參數(shù)模型在一定范圍內(nèi)具有可變性,因此檢測(cè)的動(dòng)態(tài)范圍更大,檢測(cè)效果相對(duì)較好一些。

2.2 樣本學(xué)習(xí)

由于人臉的復(fù)雜性,顯式描述十分困難,因此基于統(tǒng)計(jì)模式的檢測(cè)方法受到了人們的廣泛關(guān)注。此方法將人臉看做一種模式,通過(guò)對(duì)大量樣本圖像的機(jī)器學(xué)習(xí)完成分類器的構(gòu)造,利用分類器實(shí)現(xiàn)對(duì)人臉的檢測(cè)判別,在這里問(wèn)題被轉(zhuǎn)化為模式識(shí)別中的二分類的形式。

首先,需要建立一個(gè)樣本空間,其中包括“人臉”和“非人臉”的正負(fù)兩種樣本,對(duì)樣本圖片歸一化處理后,順序展開(kāi)后進(jìn)行主分量分解,在大量樣本形成的高維矩陣中計(jì)算其特征值和特征向量,然后采用一定的學(xué)習(xí)機(jī)制在特征空間中建立分類,以此可得到用來(lái)檢測(cè)樣本圖片是否為人臉的正負(fù)判別規(guī)則式,二者為互斥關(guān)系。此檢測(cè)方法具有較高的準(zhǔn)確度,但是需要大量的正負(fù)樣本圖片,MIT等一些高校和研究機(jī)構(gòu)建立了開(kāi)放的人臉庫(kù)。

2.3 人工神經(jīng)網(wǎng)絡(luò)

人工神經(jīng)網(wǎng)絡(luò)(ANN )是將模式的統(tǒng)計(jì)特性包含在ANN的結(jié)構(gòu)和參數(shù)中,對(duì)于人臉這類復(fù)雜的、難以顯式描述的抽象型模式,這一檢測(cè)方法具有其自身特別的優(yōu)勢(shì)。

神經(jīng)網(wǎng)絡(luò)方法本質(zhì)上也是基于樣本學(xué)習(xí),首先使用經(jīng)過(guò)預(yù)處理的“人臉”樣本以及采用“自舉”方法收集分類器錯(cuò)分的樣本作為正負(fù)樣本訓(xùn)練各個(gè)ANN,然后根據(jù)結(jié)果進(jìn)一步對(duì)分類器進(jìn)行修正,構(gòu)造多層感知器(MLP)網(wǎng)絡(luò)作為分類器對(duì)人臉進(jìn)行檢測(cè)。人工神經(jīng)網(wǎng)絡(luò)是并行分布式系統(tǒng),采用了與傳統(tǒng)人工智能和信息處理技術(shù)不同的原理,模擬大腦神經(jīng)網(wǎng)絡(luò)處理、記憶信息的方式進(jìn)行目標(biāo)檢測(cè)。神經(jīng)網(wǎng)絡(luò)模型克服了傳統(tǒng)的基于算數(shù)邏輯符號(hào)的人工智能在處理直覺(jué)、非結(jié)構(gòu)化信息方面的缺陷,具有自適應(yīng)、自組織和實(shí)時(shí)學(xué)習(xí)的特點(diǎn),應(yīng)用在人臉檢測(cè)問(wèn)題中性能表現(xiàn)突出。

2.4 基于隱馬爾可夫模型

隱馬爾可夫模型(HMM)是一種雙重隨機(jī)過(guò)程,一種是有限狀態(tài)的馬爾可夫鏈,另一種是序列的觀察值。由于只能通過(guò)觀察值得到馬爾可夫鏈的狀態(tài),因此稱之為隱馬爾可夫模型。對(duì)于人臉而言,可以把它分為前額、眼睛、鼻子、嘴巴、下巴五個(gè)部分來(lái)檢測(cè)。根據(jù)這五個(gè)區(qū)域位置順序不變性,可以分別用相應(yīng)的觀察向量序列檢測(cè)每一個(gè)部分,使用一個(gè)包含五個(gè)狀態(tài)的一維連續(xù)HMM來(lái)表示人臉。接著對(duì)各塊進(jìn)行KL變換,提取每塊一些最大的特征向量作為觀察值對(duì)HMM進(jìn)行訓(xùn)練。此后,還提出了一種嵌入式隱馬爾可夫模型,該方法除了將人臉劃分為五塊外,還在每塊中從左至右嵌入了一個(gè)HMM。接著進(jìn)行二維DCT變換,把變換后得到的系數(shù)作為訓(xùn)練值。

3 結(jié)束語(yǔ)

人臉檢測(cè)是個(gè)發(fā)展很快的研究方向,人臉檢測(cè)技術(shù)的發(fā)展趨勢(shì)是利用多特征,多種分類方式進(jìn)行啟發(fā)式知識(shí)與統(tǒng)計(jì)學(xué)習(xí)方法的結(jié)合,未來(lái)對(duì)人臉檢測(cè)的研究將會(huì)更注重其實(shí)時(shí)的應(yīng)用,這就對(duì)檢測(cè)算法的效率提出了更高的要求。另外,可以消除光照對(duì)人臉成像影響的紅外人臉識(shí)別技術(shù),加入相互對(duì)比機(jī)制的包含正臉、側(cè)臉三維信息的人臉三維模型重建檢測(cè)技術(shù)也正在研究當(dāng)中。隨著技術(shù)的不斷進(jìn)步和市場(chǎng)逐漸的規(guī)范化,人臉檢測(cè)識(shí)別技術(shù)會(huì)越來(lái)越多地應(yīng)用于社會(huì)的各個(gè)領(lǐng)域,在促進(jìn)社會(huì)發(fā)展的同時(shí)方便人們的生活。

參考文獻(xiàn)

[1]許燕,王維蘭.基于視覺(jué)運(yùn)動(dòng)人臉檢測(cè)技術(shù)的研究[J].計(jì)算機(jī)仿真, 2014(1):434-437.

[2]孫寧,鄒采榮,趙力.人臉檢測(cè)綜述[J].電路與系統(tǒng)學(xué)報(bào),2006,11(6):101-108.

作者簡(jiǎn)介

姚坤(1990-),男,現(xiàn)為聊城大學(xué)物理科學(xué)與信息工程學(xué)院碩士研究生,主要研究方向?yàn)闄C(jī)器視覺(jué)。

第4篇:如何學(xué)習(xí)計(jì)算機(jī)視覺(jué)范文

(大連東軟信息學(xué)院電子工程系,遼寧大連116023)

摘要:智能科學(xué)與技術(shù)概論課程是智能科學(xué)與技術(shù)專業(yè)重要的必修基礎(chǔ)課,對(duì)整個(gè)專業(yè)課程體系有概括性的引導(dǎo)作用,對(duì)學(xué)生深入學(xué)習(xí)后續(xù)課程有很大幫助。文章從智能科學(xué)與技術(shù)概論課程的教學(xué)實(shí)際出發(fā),提出該課程的整體課程規(guī)劃,并根據(jù)學(xué)生的學(xué)習(xí)情況驗(yàn)證其適用性。

關(guān)鍵詞 :智能科學(xué);專業(yè)基礎(chǔ)必修課;課程規(guī)劃

基金項(xiàng)目:2012年遼寧省普通高等學(xué)校本科工程人才培養(yǎng)模式改革試點(diǎn)項(xiàng)目(G2201249)。

第一作者簡(jiǎn)介:林寶尉,男,講師,研究方向?yàn)橛?jì)算機(jī)視覺(jué)、模式識(shí)別,linbaowei@neusoft.edu.cn。

0 引言

智能科學(xué)與技術(shù)概論課程是智能科學(xué)與技術(shù)專業(yè)的必修基礎(chǔ)課。學(xué)生通過(guò)學(xué)習(xí)基礎(chǔ)課,能夠了解整個(gè)專業(yè)的知識(shí)構(gòu)成、體系結(jié)構(gòu)以及發(fā)展方向,便于將來(lái)學(xué)習(xí)必修專業(yè)課,包括模式識(shí)別、人工智能、智能機(jī)器人等課程。在這個(gè)過(guò)程中,如何讓學(xué)生順利地過(guò)渡到更高層次的專業(yè)課學(xué)習(xí)中,如何提高其學(xué)習(xí)興趣,如何幫助學(xué)生深入了解各門專業(yè)課之間的層次關(guān)系,都是該專業(yè)設(shè)置過(guò)程中需要考慮的問(wèn)題。智能科學(xué)與技術(shù)概論的規(guī)劃起到了承上啟下的作用。雖然專業(yè)導(dǎo)引課也從全局對(duì)該專業(yè)的情況進(jìn)行了介紹,但其內(nèi)容以學(xué)生職業(yè)引導(dǎo)、興趣培養(yǎng)為主,對(duì)專業(yè)課程的設(shè)置并無(wú)過(guò)多展開(kāi)。因此,智能科學(xué)與技術(shù)概論課程的設(shè)置十分必要。

1 課程規(guī)劃設(shè)置

1.1 能力指標(biāo)

課程將學(xué)生的能力體系分為5個(gè)部分:技術(shù)知識(shí)與推理能力、開(kāi)發(fā)式思維與創(chuàng)新、個(gè)人職業(yè)能力、態(tài)度與習(xí)慣、時(shí)間構(gòu)思設(shè)計(jì)實(shí)現(xiàn)和社會(huì)貢獻(xiàn),與其對(duì)應(yīng)的二級(jí)、三級(jí)及詳細(xì)指標(biāo)見(jiàn)表1。每個(gè)能力指標(biāo)平均對(duì)應(yīng)4個(gè)學(xué)時(shí),共32個(gè)學(xué)時(shí)。

1.2 講授方式

(1)精講多練。通過(guò)講解智能科學(xué)的相關(guān)內(nèi)容并結(jié)合相關(guān)實(shí)驗(yàn),讓學(xué)生掌握智能科學(xué)的基礎(chǔ)知識(shí),提高其學(xué)習(xí)興趣,為后續(xù)課程的學(xué)習(xí)打下良好基礎(chǔ)。

(2)以項(xiàng)目為導(dǎo)向組織教學(xué),通過(guò)案例教學(xué),將構(gòu)思、設(shè)計(jì)、實(shí)施和運(yùn)行引入教學(xué)過(guò)程中。

(3)鼓勵(lì)學(xué)生自主學(xué)習(xí),加強(qiáng)基本職業(yè)能力的訓(xùn)練。教學(xué)過(guò)程中注意互動(dòng)和引導(dǎo),運(yùn)用講授教學(xué)、練習(xí)教學(xué)、實(shí)驗(yàn)教學(xué)、案例教學(xué)等多種教學(xué)方法完成教學(xué)任務(wù)。

(4)教學(xué)實(shí)施過(guò)程中,提供豐富的教學(xué)資源,如多媒體課件、案例、網(wǎng)絡(luò)資源、優(yōu)秀學(xué)生作品和外文技術(shù)資料等。

(5)對(duì)學(xué)生進(jìn)行多方面考核與評(píng)價(jià)。結(jié)合課程實(shí)施過(guò)程,從知識(shí)掌握、能力水平、態(tài)度表現(xiàn)等方面,對(duì)學(xué)生進(jìn)行全方位的考核。

1.3 講授內(nèi)容

該課程講授內(nèi)容分為3個(gè)單元,具體內(nèi)容如下。

單元一:智能科學(xué)導(dǎo)論,主要涉及智能科學(xué)與技術(shù)的目標(biāo)界定、學(xué)科分類、涉及范圍、學(xué)科定位、人類認(rèn)知以及學(xué)科簡(jiǎn)史等知識(shí)點(diǎn)。該單元將在2個(gè)學(xué)時(shí)中完成,并要求學(xué)生課外學(xué)習(xí)2個(gè)學(xué)時(shí)。

單元二:學(xué)科基礎(chǔ)理論知識(shí),主要涉及機(jī)器系統(tǒng)、視覺(jué)感知、高級(jí)語(yǔ)言編程等知識(shí)點(diǎn)。該單元主要介紹支撐學(xué)科的相關(guān)課程,并在實(shí)踐課中使用高級(jí)語(yǔ)言編寫(xiě)簡(jiǎn)單系統(tǒng)。該單元共10個(gè)課時(shí),其中包括4個(gè)實(shí)踐課時(shí)。

單元三:專業(yè)課介紹,主要涉及數(shù)字圖像處理介紹、模式識(shí)別介紹、計(jì)算機(jī)視覺(jué)介紹、智能機(jī)器人介紹等相關(guān)必修專業(yè)課的入門介紹,并在每次課程結(jié)束后配合實(shí)踐編程、工具使用、機(jī)器人搭建等實(shí)踐環(huán)節(jié)提高學(xué)生的學(xué)習(xí)興趣,使其全面認(rèn)識(shí)后續(xù)專業(yè)學(xué)習(xí)。該單元共20個(gè)學(xué)時(shí),其中包括12個(gè)實(shí)踐課時(shí)。

1.4 實(shí)驗(yàn)設(shè)置

實(shí)驗(yàn)課程共16個(gè)學(xué)時(shí),包括4次實(shí)驗(yàn),詳細(xì)內(nèi)容如下。

實(shí)驗(yàn)一:數(shù)字圖像處理實(shí)驗(yàn)。使用課程中講授的Matlab語(yǔ)言,實(shí)現(xiàn)數(shù)字圖像的傅里葉變換、邊緣檢測(cè)功能。該實(shí)驗(yàn)共4個(gè)課時(shí),配合單元一以及單元二的部分知識(shí)點(diǎn),使學(xué)生基本掌握Matlab編程語(yǔ)言,并理解數(shù)字圖像處理的基本知識(shí)。

實(shí)驗(yàn)二:模式識(shí)別機(jī)器學(xué)習(xí)實(shí)驗(yàn)。該實(shí)驗(yàn)利用高級(jí)程序語(yǔ)言,實(shí)現(xiàn)數(shù)據(jù)的SVM算法以及KMeans算法,讓學(xué)生理解模式識(shí)別以及機(jī)器學(xué)習(xí)等知識(shí)。該實(shí)驗(yàn)共4個(gè)學(xué)時(shí)。

實(shí)驗(yàn)三:計(jì)算機(jī)視覺(jué)實(shí)驗(yàn)。使用圖像拼接、3D場(chǎng)景重建等相關(guān)專業(yè)工具,實(shí)現(xiàn)二維圖片的3D重現(xiàn)。該實(shí)驗(yàn)共4個(gè)學(xué)時(shí)。

實(shí)驗(yàn)四:機(jī)器人實(shí)驗(yàn)。學(xué)生在機(jī)器人實(shí)驗(yàn)室,實(shí)際動(dòng)手組裝博創(chuàng)模塊化機(jī)器人,并編程實(shí)現(xiàn)機(jī)器人運(yùn)動(dòng)調(diào)試。該實(shí)驗(yàn)共4個(gè)學(xué)時(shí),實(shí)驗(yàn)地點(diǎn)為模塊化機(jī)器人實(shí)驗(yàn)室。

1.5 結(jié)課考試

在教學(xué)的各個(gè)環(huán)節(jié),教師從出勤情況、日常表現(xiàn)、作業(yè)、實(shí)驗(yàn)、結(jié)課項(xiàng)目及結(jié)課報(bào)告的完成情況對(duì)學(xué)生進(jìn)行全方位的考核,其中結(jié)課項(xiàng)目、調(diào)查報(bào)告及實(shí)驗(yàn)作業(yè)占最終成績(jī)的90%。結(jié)課項(xiàng)目為小組項(xiàng)目,4個(gè)學(xué)生為一個(gè)小組完成系統(tǒng)的設(shè)計(jì)、編寫(xiě)、調(diào)試等步驟,并組織5名教師對(duì)每個(gè)小組進(jìn)行答辯考核。

2 問(wèn)題及改進(jìn)

學(xué)校于2012年申請(qǐng)創(chuàng)辦智能科學(xué)與技術(shù)專業(yè)。該專業(yè)培養(yǎng)學(xué)生掌握計(jì)算機(jī)基礎(chǔ)、電子電路、控制方法、智能信息處理與識(shí)別等基本知識(shí),使其具備信息處理、自動(dòng)控制、人工智能系統(tǒng)開(kāi)發(fā)等基本能力。智能科學(xué)與技術(shù)概論課程在大二下學(xué)期開(kāi)設(shè),共32學(xué)時(shí),其中理論教學(xué)16學(xué)時(shí),實(shí)踐教學(xué)16學(xué)時(shí)。通過(guò)理論教學(xué)和實(shí)踐教學(xué),學(xué)生了解了智能科學(xué)的基礎(chǔ)理論知識(shí),掌握該專業(yè)核心專業(yè)課的關(guān)系,認(rèn)識(shí)相關(guān)后續(xù)課程,并能夠使用簡(jiǎn)單的算法和工具,為日后深入學(xué)習(xí)專業(yè)課打下良好基礎(chǔ)。

2.1 教材選擇

由于本專業(yè)辦學(xué)時(shí)間較短,沒(méi)有足夠的針對(duì)智能科學(xué)與技術(shù)概論的教材可供選擇。現(xiàn)階段使用較多的教材為《智能科學(xué)與技術(shù)導(dǎo)論》以及《智能科學(xué)》?!吨悄芸茖W(xué)與技術(shù)導(dǎo)論》是鐘義信主編、北京郵電大學(xué)出版社出版的、適合智能專業(yè)大一新生使用的專業(yè)教材,對(duì)整個(gè)專業(yè)有詳細(xì)的介紹,適合作為新生的專業(yè)導(dǎo)引課程,安排16個(gè)學(xué)時(shí)較為合適,并不適于我校智能科學(xué)與技術(shù)概論課程的要求?!吨悄芸茖W(xué)》是史忠植主編、清華大學(xué)出版社出版的專業(yè)教材,該教材對(duì)整個(gè)智能專業(yè)的重要內(nèi)容都有涉及,系統(tǒng)地介紹了智能科學(xué)的概念和方法,吸收了腦科學(xué)、認(rèn)知科學(xué)、人工智能、數(shù)理邏輯、社會(huì)思維學(xué)、系統(tǒng)理論、科學(xué)方法論和哲學(xué)等方面的研究成果,適合高年級(jí)學(xué)生使用,安排64個(gè)學(xué)時(shí)較為合適,也不適于我校情況。

鑒于上述原因,我們?cè)O(shè)計(jì)該課程時(shí),前半部分理論知識(shí)介紹使用了《智能科學(xué)與技術(shù)導(dǎo)論》,后半部分專業(yè)課程介紹使用自制課件。經(jīng)過(guò)2輪的教學(xué)實(shí)踐以后,我們將根據(jù)教材使用情況編寫(xiě)自用的講義教材。

2.2 內(nèi)容設(shè)計(jì)

該課程內(nèi)容會(huì)介紹智能專業(yè)的重要專業(yè)課,但要在32學(xué)時(shí)內(nèi)完成所有專業(yè)課程的介紹,并保證該課程內(nèi)容不與專業(yè)導(dǎo)引課以及智能信息處理導(dǎo)引課沖突,難度很大,因此選擇最合適的講授內(nèi)容,對(duì)于該課程的授課效果非常重要。

在授課過(guò)程中我們發(fā)現(xiàn),學(xué)生對(duì)簡(jiǎn)單的數(shù)字圖像處理、計(jì)算機(jī)視覺(jué)的流行應(yīng)用以及動(dòng)手要求強(qiáng)的機(jī)器人課程興趣較大,但對(duì)數(shù)學(xué)推導(dǎo)要求較高的模式識(shí)別、機(jī)器學(xué)習(xí)等課程接受程度較低。該課程的教學(xué)目的是讓學(xué)生了解相關(guān)課程的意義、歷史、發(fā)展等知識(shí),所以,建議加大實(shí)驗(yàn)動(dòng)手課程的課時(shí)比例,讓學(xué)生多使用相關(guān)知識(shí)、算法和應(yīng)用,盡量避開(kāi)復(fù)雜的數(shù)學(xué)推導(dǎo)。

2.3 資源配置

學(xué)校的智能科學(xué)與技術(shù)專業(yè)創(chuàng)建于電子工程系,依托電子系的軟硬件實(shí)驗(yàn)室,培養(yǎng)學(xué)生的軟硬件知識(shí)儲(chǔ)備,提高學(xué)生的實(shí)際動(dòng)手能力。其中,軟件算法將配合嵌入式設(shè)備進(jìn)行硬件集成,并指導(dǎo)學(xué)生設(shè)計(jì)具有智能算法應(yīng)用的硬件設(shè)備。教學(xué)過(guò)程中將使用校實(shí)驗(yàn)室中的模式識(shí)別嵌入式開(kāi)發(fā)板、博創(chuàng)模塊化機(jī)器人平臺(tái)以及Turtlebot智能機(jī)器人平臺(tái)。該課程在實(shí)際講授時(shí),理論課以及算法相關(guān)實(shí)驗(yàn)在大班進(jìn)行,硬件實(shí)踐課程在小班進(jìn)行,能取得較好的授課效果。

3 實(shí)施效果

在該課程設(shè)計(jì)內(nèi)容的指導(dǎo)下,智能科學(xué)與技術(shù)概論已經(jīng)完成了2輪的課程教學(xué),并在課程結(jié)束后組織學(xué)生填寫(xiě)調(diào)查問(wèn)卷。題目分兩類,第一類包括課程目標(biāo)是否清晰、該課程能否提起學(xué)生對(duì)該專業(yè)課的學(xué)習(xí)興趣、該課程的實(shí)驗(yàn)設(shè)計(jì)能否有效提高學(xué)生的動(dòng)手能力,以及該課程的內(nèi)容相關(guān)設(shè)計(jì)是否優(yōu)秀。統(tǒng)計(jì)結(jié)果如圖1所示。除極個(gè)別學(xué)生外,大多數(shù)學(xué)生都選擇了符合以及完全符合,說(shuō)明該課程設(shè)計(jì)可以滿足教學(xué)要求。第二類問(wèn)題總結(jié)學(xué)生在課程中獲取的知識(shí)能力,包括編程調(diào)試、理論知識(shí)應(yīng)用、信息獲取、技術(shù)文檔寫(xiě)作、自主學(xué)習(xí)、分析問(wèn)題、解決問(wèn)題等,為多選題。從圖2可以看出,學(xué)生對(duì)各項(xiàng)能力的認(rèn)可率均超過(guò)50%,其中信息獲取、分析問(wèn)題等能力的認(rèn)可率接近80%,說(shuō)明該課程設(shè)計(jì)基本滿足教學(xué)目標(biāo)。

4 結(jié)語(yǔ)

智能科學(xué)與技術(shù)概論對(duì)智能專業(yè)學(xué)生的深入學(xué)習(xí)起到了重要的引導(dǎo)作用。我們根據(jù)自身的實(shí)際情況出發(fā),設(shè)計(jì)出適合該專業(yè)學(xué)生的課程設(shè)計(jì)安排。經(jīng)過(guò)兩輪的實(shí)施效果證明,該課程的設(shè)計(jì)方式比較適合學(xué)生。隨著課程的持續(xù),我們將不斷解決存在的問(wèn)題,并編寫(xiě)適合我校學(xué)生使用的教材。

參考文獻(xiàn):

[1]鐘義信,智能科學(xué)技術(shù)導(dǎo)論[M].北京:北京郵電大學(xué)出版社,2007.

[2] Edward FC,Johan M,Soren O.重新認(rèn)識(shí)工程教育:國(guó)際CDIO培養(yǎng)模式與方法[M].顧佩華,沈民奮,陸小華,譯.北京:高等教育出版社,2009.

第5篇:如何學(xué)習(xí)計(jì)算機(jī)視覺(jué)范文

微軟的游戲操控設(shè)備 Kinect 有一句廣告語(yǔ):You are the controller(你就是遙控器)。通過(guò) Kinect,普通人不需要使用任何手柄、搖桿、鼠標(biāo)或者其他遙控器就能操控游戲,這讓 Kinect 遠(yuǎn)遠(yuǎn)超越了普通家用游戲機(jī)的段位。事實(shí)是,人們也沒(méi)有把它僅僅當(dāng)成游戲機(jī),無(wú)數(shù)黑客對(duì)其進(jìn)行破解,開(kāi)發(fā)出一系列創(chuàng)新發(fā)明,有模擬光劍道具,也有自動(dòng)跟著垃圾跑的垃圾桶,甚至英國(guó)一所大學(xué)正在基于它研發(fā)一種技術(shù)幫助中風(fēng)患者恢復(fù)健康。

新的人機(jī)交互方式讓計(jì)算機(jī)能讀懂人所傳遞的命令?,F(xiàn)在,眼睛是人們開(kāi)發(fā)的下一個(gè)目標(biāo)。去年底丹麥公司 Senseye 了一個(gè)視頻,視頻里,一個(gè)人捧著平板電腦在玩“切水果”的游戲——不過(guò),他沒(méi)有動(dòng)一根手指,而是完全用眼神控制。后來(lái),這家由四個(gè)丹麥博士生創(chuàng)立的公司改名為“The Eye Tribe”,他們開(kāi)發(fā)的眼控技術(shù)能通過(guò)智能手機(jī)或者平板電腦的前置攝像頭獲取圖像,利用計(jì)算機(jī)視覺(jué)算法進(jìn)行分析。軟件能定位眼睛的位置,估計(jì)你正在看屏幕的什么地方,甚至精確到非常小的圖標(biāo)。這項(xiàng)眼控技術(shù)能夠取代手指,控制平板電腦或手機(jī)。據(jù)國(guó)外媒體報(bào)道,他們已經(jīng)開(kāi)始與手機(jī)制造商和運(yùn)營(yíng)商進(jìn)行合作,希望明年能將正式產(chǎn)品推向市場(chǎng)。

除了用眼神控制手機(jī),用眼睛操控的概念筆記本、眼控相機(jī)等產(chǎn)品也已面世。以眼神的移動(dòng)軌跡為基礎(chǔ)進(jìn)行的人機(jī)交互方式,是繼 Kinect 之后人機(jī)交互界面的又一次革命。

眼睛上的實(shí)驗(yàn)

17 世紀(jì)初,人們就開(kāi)始研究眼睛的運(yùn)動(dòng)。1879 年,法國(guó)人路易斯·艾米·賈維爾觀察到,人們的眼睛在閱讀文字時(shí),并非像之前猜想的是平滑地一行行掃射,而是每隔幾個(gè)字就會(huì)有短暫的視覺(jué)停留。

于是人們很好奇:閱讀時(shí),眼睛會(huì)停留在哪些字上?停留多長(zhǎng)時(shí)間?

為了研究這個(gè)問(wèn)題,埃德蒙·休伊做出世界上第一個(gè)眼睛追蹤器:一個(gè)有洞的隱形眼鏡,和一個(gè)會(huì)根據(jù)眼睛活動(dòng)擺動(dòng)指針的鋁制指示器相連。但這個(gè)追蹤器因?yàn)橐脱矍蚪佑|,對(duì)眼睛的干擾比較大。另一個(gè)芝加哥的家伙托馬斯·巴斯維爾轉(zhuǎn)換了思路,做出了一個(gè)非接觸式的追蹤器,他利用光束照射眼睛,通過(guò)在電影膠片上記錄眼睛反射的光記錄眼睛的活動(dòng)軌跡。他用這個(gè)裝置研究人們閱讀和觀看圖片的行為習(xí)慣。

到了 1980 年,眼睛追蹤器被用來(lái)研究和人機(jī)交互有關(guān)的問(wèn)題;比如,研究人員很好奇用戶如何在電腦菜單中搜索命令。最近幾年,人們?cè)絹?lái)越多運(yùn)用眼部追蹤器研究用戶如何和不同的計(jì)算機(jī)界面互動(dòng),結(jié)果往往能改變界面的設(shè)計(jì)。其他的研究包括用戶如何對(duì)待下拉菜單,他們通常將注意力集中在網(wǎng)站的什么位置,開(kāi)發(fā)人員就會(huì)知道該在哪里設(shè)計(jì)廣告位。

隨著眼控技術(shù)的發(fā)展,和人類對(duì)視覺(jué)生理及心理的了解,基于人類視覺(jué)系統(tǒng)(Human Vision System, 簡(jiǎn)稱“HVS”)的凝視繪制技術(shù)也逐漸成為圖形學(xué)的研究熱點(diǎn)。這種技術(shù)通過(guò)略去不為用戶感知的畫(huà)面區(qū)域的圖像細(xì)節(jié)來(lái)提高圖像的繪制和顯示效率。

在研究中,人們普遍達(dá)成的共識(shí)是,“注意力”和眼睛看在哪并不統(tǒng)一,前者總是比眼睛要領(lǐng)先大約 100-250 微秒;也就是說(shuō),人的注意力轉(zhuǎn)移到新的位置 100-250 微秒后,眼睛才會(huì)跟隨其后。

在技術(shù)上,眼控技術(shù)已經(jīng)相當(dāng)成熟,在工業(yè)控制、機(jī)器人學(xué)和臨床醫(yī)學(xué)領(lǐng)域都有應(yīng)用,只是還沒(méi)有應(yīng)用到消費(fèi)領(lǐng)域。它是基于角膜反射原理,通過(guò)光在用戶眼睛角膜上形成高亮度反射點(diǎn)作為參考點(diǎn),當(dāng)眼球轉(zhuǎn)動(dòng)注視屏幕上不同位置時(shí),由于眼球近似為球體,光斑不動(dòng),瞳孔相對(duì)光斑發(fā)生偏移,利用瞳孔中心和光斑的位置關(guān)系就能確定視線方向。目前運(yùn)用最廣泛的設(shè)計(jì)是以視頻為基礎(chǔ)的眼睛追蹤器。一個(gè)設(shè)想鏡頭聚焦在一只或一雙眼睛上,在觀眾受到某種刺激時(shí)記錄它們的變動(dòng)。眼控技術(shù)的核心是算法,如何讓系統(tǒng)迅速準(zhǔn)確地“學(xué)習(xí)”人眼睛的各種行為,這是個(gè)挑戰(zhàn)。

EyePhone 應(yīng)該翻譯成“眼機(jī)”或者“目機(jī)”?似乎都不太好聽(tīng)。在大觸屏手機(jī)廣泛流行之前,有人就開(kāi)始研究如何用眼睛控制手機(jī)了。

美國(guó)達(dá)特茅斯學(xué)院(Dartmouth College)就有一支眼控手機(jī)的研發(fā)團(tuán)隊(duì),他們?cè)噲D創(chuàng)造一套眼睛追蹤系統(tǒng),開(kāi)發(fā)以眼睛來(lái)控制手機(jī)的操作方法。

讓眼睛追蹤系統(tǒng)運(yùn)用到操作系統(tǒng)里,重要的是設(shè)計(jì)一套能夠?qū)崿F(xiàn)的軟件。首先,你需要校準(zhǔn)這個(gè)系統(tǒng),在室內(nèi)室外不同光線下盯著同一張圖片看,讓軟件學(xué)習(xí)、識(shí)別你的眼睛在不同光照條件下的運(yùn)動(dòng)。他們?cè)谥Z基亞 N810 上做了試驗(yàn),設(shè)計(jì)出一個(gè)初始“眼菜單”,屏幕被分為9格,分別對(duì)應(yīng)郵件、接電話、拍照片、日歷、短信等不同功能。當(dāng)一個(gè)人盯著某一塊區(qū)域看時(shí),某一個(gè)功能區(qū)域就被激活高亮顯示,一眨眼,這個(gè)功能就被激活。

根據(jù)《麻省理工科技評(píng)論》雜志 2010 年的報(bào)道,眼控式手機(jī)的技術(shù)研發(fā)已經(jīng)數(shù)年。進(jìn)行這項(xiàng)技術(shù)開(kāi)發(fā)的主要目的,是希望能讓手部殘疾的人克服無(wú)法使用電話的障礙。

在這項(xiàng)研究中,整個(gè)系統(tǒng)技術(shù)含量最高的部分就是自動(dòng)校正系統(tǒng),它需要算法優(yōu)化,提高光學(xué)采集精度,實(shí)現(xiàn)視線跟蹤,適應(yīng)外部環(huán)境光強(qiáng)度變化,判別眼睛睜、閉狀態(tài)等。帶領(lǐng)“EyePhone”研發(fā)團(tuán)隊(duì)的安德魯·坎貝爾(Andrew Campbel)教授認(rèn)為,眼控式手機(jī)解放了雙手,不僅僅是殘疾人,每個(gè)人都能享受到它帶來(lái)的極大便利。但靠眼神操作手機(jī),比在桌上的電腦執(zhí)行眼控指令更困難,因?yàn)槭褂谜吆褪謾C(jī)都是行動(dòng)中的物體,而周圍環(huán)境也是變幻莫測(cè),如何演算和辨識(shí)使用者在不同的狀態(tài)下所傳達(dá)的眼神收發(fā)訊號(hào),是最難解決的問(wèn)題。

在 2011 年的 Cebit 展上,聯(lián)想和瑞典眼控技術(shù)公司 Tobbi 聯(lián)合了一款概念筆記本,特制的長(zhǎng)方形感應(yīng)器能夠追逐眼球的移動(dòng)軌跡,記錄數(shù)據(jù),電腦處理器把這些數(shù)據(jù)轉(zhuǎn)化為鼠標(biāo)控制,整個(gè)系統(tǒng)并不會(huì)讓眼控的過(guò)程感覺(jué)十分刻意,也不會(huì)像傳統(tǒng)的眼控系統(tǒng)一樣過(guò)于敏感或是過(guò)于駑鈍。

Tobii 公司成立于 2001 年,是一家專門研發(fā)眼動(dòng)追蹤和眼動(dòng)控制技術(shù)的公司。除了桌面眼動(dòng)電腦,他們也在研發(fā)一款具備眼控界面的 windows 平板電腦 C12,用戶可以轉(zhuǎn)動(dòng)眼珠來(lái)移動(dòng) C12 上的鼠標(biāo)指針,而眨眼則代表點(diǎn)擊。機(jī)器里設(shè)置了一個(gè)校準(zhǔn)界面,允許多個(gè)用戶定義眼控指令。

第6篇:如何學(xué)習(xí)計(jì)算機(jī)視覺(jué)范文

1研究方向

到2007年底,每秒鐘能進(jìn)行1000萬(wàn)億次浮點(diǎn)運(yùn)算的超級(jí)計(jì)算機(jī)將要問(wèn)世,這是計(jì)算機(jī)科學(xué)家的最新杰作!但是,即便是如此強(qiáng)大的超級(jí)計(jì)算機(jī),目前還無(wú)法實(shí)現(xiàn)人腦能夠輕而易舉完成的許多感知信息處理任務(wù)。例如,在混雜的車站里辨認(rèn)熟人面孔、在熱鬧的晚宴里同朋友自由交談、在國(guó)際會(huì)議上嫻熟地用外語(yǔ)與各國(guó)同行討論研究成果,等。因此,為了建立計(jì)算機(jī)與人更加友好、自然的用戶界面,我們必須創(chuàng)建新的智能計(jì)算理論與方法。我們認(rèn)為將計(jì)算機(jī)科學(xué)與腦科學(xué)相結(jié)合,研究仿腦計(jì)算理論與模型將是通向這一終極目標(biāo)的一條理想之路?!吧虾=煌ù髮W(xué)-微軟智能計(jì)算及智能系統(tǒng)實(shí)驗(yàn)室”的主要研究目標(biāo)就是為了突破傳統(tǒng)數(shù)字計(jì)算機(jī)在智能信息處理的瓶頸,聯(lián)合實(shí)驗(yàn)室匯集了上海交通大學(xué)計(jì)算機(jī)科學(xué)與工程系、自動(dòng)化系和電子工程系的相關(guān)領(lǐng)域的10余名教授、副教授,擬在下列方向開(kāi)展合作研究:

仿腦計(jì)算理論與模型

超并列機(jī)器學(xué)習(xí)理論與算法

基于人類視覺(jué)信息處理的計(jì)算機(jī)視覺(jué)理論與方法

腦-計(jì)算機(jī)接口技術(shù)

機(jī)器人技術(shù)

多媒體信息獲取技術(shù)

無(wú)縫媒體通訊技術(shù)

這里需要強(qiáng)調(diào)的是,微軟亞洲研究院湯曉鷗博士為聯(lián)合實(shí)驗(yàn)室研究方向的確定和研究課題的篩選作出了重要貢獻(xiàn)。湯曉鷗博士在聯(lián)合實(shí)驗(yàn)室成立之初,就來(lái)上海交通大學(xué)為我們作了一場(chǎng)精彩的學(xué)術(shù)報(bào)告,不僅介紹了微軟亞洲研究院在計(jì)算機(jī)視覺(jué)領(lǐng)域最新的研究成果,而且為我們的學(xué)生詳細(xì)介紹了如何腳踏實(shí)地、一步一步地開(kāi)展高水平的科學(xué)研究,使同學(xué)們受益匪淺。自聯(lián)合實(shí)驗(yàn)室成立以來(lái),微軟亞洲研究院的多名國(guó)際知名專家來(lái)上海交通大學(xué)講學(xué),他們是“深藍(lán)項(xiàng)目”之父許峰雄博士、系統(tǒng)結(jié)構(gòu)專家張崢博士和自然語(yǔ)言處理專家周明博士。

2006年度微軟亞洲研究院資助了聯(lián)合實(shí)驗(yàn)室在機(jī)器學(xué)習(xí)、機(jī)器人和多媒體通信三個(gè)方向的研究課題,具體內(nèi)容如表1所示。

2研究成果

聯(lián)合實(shí)驗(yàn)室成立一年多來(lái),取得了多項(xiàng)創(chuàng)新性的研究成果,已在國(guó)內(nèi)外學(xué)術(shù)刊物和會(huì)議上30余篇。由于篇幅限制,下面僅對(duì)部分成果作簡(jiǎn)要介紹。

(1) 超并列機(jī)器學(xué)習(xí)理論與算法

上海交通大學(xué)計(jì)算機(jī)科學(xué)與工程系呂寶糧教授在仿腦計(jì)算、機(jī)器學(xué)習(xí)和腦-計(jì)算機(jī)接口等方向與微軟亞洲研究院系統(tǒng)結(jié)構(gòu)組、文本組和圖像組有著密切的合作與交流,他們共同致力于研究大規(guī)模分布式超并列機(jī)器學(xué)習(xí)理論與算法,并將其研究成果應(yīng)用于人臉識(shí)別、自然語(yǔ)言處理、生物信息學(xué)和腦-計(jì)算機(jī)接口等領(lǐng)域。在此期間共同進(jìn)行博士和碩士研究生以及本科生的培養(yǎng),聯(lián)合發(fā)表學(xué)術(shù)論文。與微軟研究院的文本組、圖像組和機(jī)器學(xué)習(xí)組定期交流和選派學(xué)生實(shí)習(xí)。通過(guò)雙方真誠(chéng)的合作,智能信息處理方向已有2名博士生和5名碩士順利通過(guò)答辯。目前上海交通大學(xué)有1名博士后、3名博士生、5名碩士生和4名ACM班的本科三年級(jí)學(xué)生投入到合作研究課題中,來(lái)自微軟亞洲研究院的1名優(yōu)秀青年員工在機(jī)器學(xué)習(xí)方向作為博士生進(jìn)行聯(lián)合培養(yǎng)。

(2) 無(wú)縫媒體通訊技術(shù)

上海交通大學(xué)電子工程系熊紅凱副教授在無(wú)縫媒體通信方向,與微軟亞洲研究院網(wǎng)絡(luò)多媒體IM組已經(jīng)進(jìn)行了多年的合作研究,他們共同致力于無(wú)縫媒體通信的良好遠(yuǎn)景,主要研究視頻信號(hào)多元化智能處理與傳輸,工作包括可伸縮視頻編碼、分布式視頻編碼、網(wǎng)絡(luò)編碼,等。微軟研究院IM組吳楓等研究人員與他們?cè)诖似陂g共同進(jìn)行博士和碩士研究生的培養(yǎng),支持他們參與國(guó)際技術(shù)標(biāo)準(zhǔn)MPEG-21和JVT的制訂,聯(lián)合提交技術(shù)提案和發(fā)表學(xué)術(shù)論文。

通過(guò)合作研究,媒體通信方向已有2名博士生、3名碩士生順利畢業(yè);目前上海交通大學(xué)在此方向有2名博士生、4名碩士生投入到合作課題中;微軟亞洲研究院有2名優(yōu)秀員工在媒體通信方向作為博士生進(jìn)行聯(lián)合培養(yǎng),實(shí)現(xiàn)一體化技術(shù)合作。合作研究的積累,使得該團(tuán)隊(duì)獲得了2005年和2006年度國(guó)家自然科學(xué)基金面上和重點(diǎn)項(xiàng)目的相關(guān)課題資助。另外,2007年獲得了國(guó)家“十一五”863計(jì)劃專題。

(3) 移動(dòng)機(jī)器人的視覺(jué)定位技術(shù)

服務(wù)機(jī)器人是一個(gè)新興的快速發(fā)展的研究領(lǐng)域。服務(wù)機(jī)器人的首要問(wèn)題是其必須在執(zhí)行任務(wù)中應(yīng)付復(fù)雜的環(huán)境。復(fù)雜環(huán)境中的目標(biāo)定位技術(shù)成為其中一項(xiàng)挑戰(zhàn)性課題。

項(xiàng)目組提出了一種新的單目攝像頭實(shí)時(shí)定位算法,可以實(shí)時(shí)計(jì)算攝像頭的三維運(yùn)動(dòng)軌跡。該算法基于視覺(jué)路標(biāo),集成了目標(biāo)識(shí)別、特征跟蹤和3D定位算法。其核心思想是:識(shí)別場(chǎng)景中的視覺(jué)路標(biāo),并主動(dòng)跟蹤匹配特征點(diǎn),計(jì)算攝像機(jī)的3D運(yùn)動(dòng)軌跡。為了提高算法實(shí)時(shí)性,相對(duì)耗時(shí)的目標(biāo)識(shí)別模塊只在初始化時(shí)尋找和識(shí)別路標(biāo),接著跟蹤算子跟蹤匹配特征點(diǎn),轉(zhuǎn)入實(shí)時(shí)跟蹤過(guò)程,同時(shí)輸出3D軌跡。

實(shí)驗(yàn)表明,結(jié)合目標(biāo)識(shí)別、跟蹤和3D定位,本文算法可以主動(dòng)發(fā)現(xiàn)和實(shí)時(shí)跟蹤感興趣目標(biāo),對(duì)于普通PC和USB攝像頭,能以30幀/s跟蹤運(yùn)動(dòng)目標(biāo)。3D定位也有較好的精度,準(zhǔn)確跟蹤時(shí),定位誤差一般在5cm之內(nèi)。此外由于每幀都單獨(dú)計(jì)算位姿,因此不存在累積誤差,目標(biāo)丟失后也能快速被識(shí)別和跟蹤。

3人才培養(yǎng)

聯(lián)合實(shí)驗(yàn)室成立伊始,雙方就將人才培養(yǎng)作為合作的重中之重,經(jīng)過(guò)雙方的共同努力和友好合作,在一年多的時(shí)間里,已經(jīng)實(shí)施了下列三個(gè)具有特色人才培養(yǎng)項(xiàng)目。

(1) 博士生聯(lián)合培養(yǎng)項(xiàng)目

上海交通大學(xué)與微軟亞洲研究院的博士生聯(lián)合培養(yǎng)項(xiàng)目是實(shí)驗(yàn)室在人才培養(yǎng)方面的合作亮點(diǎn)。該項(xiàng)目主要包含兩方面的內(nèi)容,一方面上海交通大學(xué)聘用微軟亞洲研究院的資深研究員為上海交通大學(xué)博士生導(dǎo)師并與上海交通大學(xué)的教授一起聯(lián)合指導(dǎo)博士研究生;另一方面微軟亞洲研究院選派具有碩士學(xué)位的優(yōu)秀員工到上海交通大學(xué)攻讀博士學(xué)位。目前有六位微軟研究員被聘為上海交通大學(xué)客座教授,其中沈向洋博士、洪小文博士、張崢博士、宋歌平博士和湯曉鷗博士為博士生導(dǎo)師。2006年4月微軟亞洲研究院選送了六位優(yōu)秀青年員工來(lái)上海交通大學(xué)攻讀博士學(xué)位,這些博士生首先在上海交通大學(xué)完成學(xué)位課程的學(xué)習(xí),之后他們將在上海交通大學(xué)導(dǎo)師的指導(dǎo)下在微軟亞洲研究院進(jìn)行博士學(xué)位論文的研究工作。這六名博士生的導(dǎo)師分別是上海交通大學(xué)計(jì)算機(jī)科學(xué)與工程系的張申生教授、俞勇教授和呂寶糧教授;電子工程系的張文軍教授和孫軍教授。博士生聯(lián)合培養(yǎng)項(xiàng)目的實(shí)施,既是微軟亞洲研究院對(duì)優(yōu)秀青年員工繼續(xù)發(fā)展的支持和鼓勵(lì),同時(shí)通過(guò)雙方深入的交流,將微軟亞洲研究院的研究理念和企業(yè)需求帶到上海交通大學(xué),為雙方的共同發(fā)展作出了貢獻(xiàn)。

(2) 卡內(nèi)基?梅隆大學(xué)聯(lián)合人才培養(yǎng)項(xiàng)目

微軟亞洲研究院聯(lián)手上海交通大學(xué)和美國(guó)卡內(nèi)基?梅隆大學(xué)聯(lián)合培養(yǎng)高素質(zhì)人才。根據(jù)“卡內(nèi)基?梅隆大學(xué)-上海交通大學(xué)-微軟亞洲研究院”三方達(dá)成的協(xié)議,上海交通大學(xué)、卡內(nèi)基?梅隆大學(xué)每年將互換5名優(yōu)秀本科學(xué)生進(jìn)行為期一學(xué)期的學(xué)習(xí),在兩校學(xué)習(xí)之后,這些學(xué)生將到微軟亞洲研究院進(jìn)行為期三個(gè)月的實(shí)習(xí),其間他們將參與實(shí)際項(xiàng)目的研發(fā)工作。這一“產(chǎn)學(xué)研”跨國(guó)合作的模式,將為中國(guó)培養(yǎng)高素質(zhì)的“IT國(guó)際人”提供一種有效的便捷渠道。到目前為止,上海交通大學(xué)電子信息與電氣工程學(xué)院經(jīng)過(guò)嚴(yán)格挑選,已選派了十多位優(yōu)秀的本科生去卡內(nèi)基?梅隆大學(xué)電子與計(jì)算機(jī)工程系學(xué)習(xí),這些學(xué)生分別來(lái)自計(jì)算機(jī)科學(xué)與工程系、自動(dòng)化系和電子工程系??▋?nèi)基?梅隆大學(xué)也已選派了多名交換生來(lái)上海交通大學(xué)和微軟亞洲研究院學(xué)習(xí)和實(shí)習(xí)。經(jīng)過(guò)三方的聯(lián)合培養(yǎng),不僅拓寬了學(xué)生的視野,而且進(jìn)一步提升了學(xué)生的綜合素質(zhì)。在參加該項(xiàng)目的學(xué)生中,有的同學(xué)已在本領(lǐng)域高水平的國(guó)際雜志和會(huì)議上發(fā)表了多篇學(xué)術(shù)論文。此外隨著三方合作的進(jìn)一步深入和上海交通大學(xué)國(guó)際化辦學(xué)的進(jìn)一步深化,將會(huì)使上海交通大學(xué)更多的本科生同學(xué)有機(jī)會(huì)親密接觸世界知名學(xué)府和研究院。

第7篇:如何學(xué)習(xí)計(jì)算機(jī)視覺(jué)范文

隨著移動(dòng)終端的興起,數(shù)據(jù)的產(chǎn)生已經(jīng)成了一種非常廉價(jià)并且隨時(shí)隨地都可完成的技術(shù)。而移動(dòng)互聯(lián)網(wǎng)的發(fā)展又促進(jìn)了數(shù)據(jù)的產(chǎn)生、流動(dòng)和集中?,F(xiàn)實(shí)生活中我們可以非常輕松地刷新微博感受周圍世界的變化,也可以通過(guò)手機(jī)的拍照功能在網(wǎng)上分享我們生活中的精彩時(shí)刻。我們發(fā)現(xiàn),與我們現(xiàn)實(shí)世界相對(duì)應(yīng)的數(shù)字化世界正在急劇地膨脹,新的信息隨時(shí)隨地都在產(chǎn)生,在這種背景下很多科學(xué)家們認(rèn)為我們正在迎來(lái)一個(gè)新的時(shí)代,“大數(shù)據(jù)”時(shí)代。在“大數(shù)據(jù)”時(shí)代,如何為每個(gè)人快速找到他們需要的信息是計(jì)算機(jī)科學(xué)家們所面臨的嚴(yán)峻挑戰(zhàn)。他們必須利用機(jī)器學(xué)習(xí)技術(shù),讓計(jì)算機(jī)程序自動(dòng)為人們搜尋具備潛在價(jià)值的信息。然而在過(guò)去幾十年里,龐大的數(shù)據(jù)量成了機(jī)器學(xué)習(xí)技術(shù)面臨的又一重大問(wèn)題。目前這一領(lǐng)域面臨著一個(gè)巨大的挑戰(zhàn),那就是機(jī)器學(xué)習(xí)的可擴(kuò)展性問(wèn)題,即如何面對(duì)海量的數(shù)據(jù)提出高效的學(xué)習(xí)算法。本書(shū)是關(guān)于這一主題的第一本專著。

本書(shū)圍繞并行計(jì)算和分布式計(jì)算介紹了機(jī)器學(xué)習(xí)算法的擴(kuò)展問(wèn)題。全書(shū)共21章。在第1章引言介紹之后,又分4個(gè)部分,其中第1部分討論了擴(kuò)展機(jī)器學(xué)習(xí)的相關(guān)架構(gòu),含第2-5章:2.MapReduce及其在組合決策樹(shù)學(xué)習(xí)中大規(guī)模并行的應(yīng)用;3.介紹了利用DryadLINQ進(jìn)行大規(guī)模機(jī)器學(xué)習(xí);4.介紹了IBM并行學(xué)習(xí)工具庫(kù);5.介紹了機(jī)器學(xué)習(xí)算法中的均勻細(xì)粒度數(shù)據(jù)并行計(jì)算。第2部分介紹了監(jiān)督和非監(jiān)督學(xué)習(xí),含第6-13章:6.基于不完全Cholesky分解的并行支持向量機(jī)PSVM;7.利用硬件加速的大規(guī)模并行支持向量機(jī);8.利用自舉決策樹(shù)進(jìn)行大規(guī)模排序?qū)W習(xí);9.變換回歸算法;10.因子圖中的并行信任擴(kuò)散方法;11.在潛在變量模型中的并行吉布斯采樣;12.使用MapReduce和MPI進(jìn)行大規(guī)模譜聚類;13.基于信息論的并行聚類方法。第3部分其他的學(xué)習(xí)模式,含第14-17章:14.并行在線學(xué)習(xí);15.介紹了基于圖的并行半監(jiān)督學(xué)習(xí);16.介紹了基于關(guān)聯(lián)矩陣分解的分布式轉(zhuǎn)移學(xué)習(xí);17.大規(guī)模并行特征選擇。第4部分相關(guān)應(yīng)用,含第18-21章:18.利用GPU在計(jì)算機(jī)視覺(jué)中進(jìn)行大規(guī)模學(xué)習(xí);19.基于大規(guī)模FPGA的卷積網(wǎng)絡(luò)學(xué)習(xí);20.在多核系統(tǒng)上對(duì)樹(shù)結(jié)構(gòu)數(shù)據(jù)進(jìn)行挖掘;21.自動(dòng)語(yǔ)音識(shí)別的可擴(kuò)展并行化方法。

本書(shū)是可擴(kuò)展機(jī)器學(xué)習(xí)領(lǐng)域難得的專著,本書(shū)第一編著者Ron Bekkerman目前是LinkedIn的高級(jí)研究人員,第二編著者M(jìn)ikhail Bileno目前是微軟機(jī)器學(xué)習(xí)研究組的成員,而第三編著者John Lanford則是雅虎公司的科學(xué)家。另外值得注意的是本書(shū)每一章的作者既有來(lái)自斯坦福、耶魯、卡內(nèi)基梅隆等著名高校的教授,也有來(lái)自雅虎、谷歌、 IBM 、惠普、微軟等工業(yè)界研究院的資深研究人員。對(duì)于目前國(guó)內(nèi)如火如荼的“大數(shù)據(jù)”研究來(lái)說(shuō),相信本書(shū)會(huì)為廣大研究生和科研人員提供不可替代的第一線經(jīng)驗(yàn)。

第8篇:如何學(xué)習(xí)計(jì)算機(jī)視覺(jué)范文

【關(guān)鍵詞】視覺(jué)測(cè)量 數(shù)字圖像處理 開(kāi)放性實(shí)驗(yàn)

【中圖分類號(hào)】G642 【文獻(xiàn)標(biāo)識(shí)碼】A 【文章編號(hào)】1006-9682(2012)10-0001-03

一、引 言

數(shù)字圖像處理作為一門學(xué)科大約形成于20世紀(jì)60年代初期,并首次在航空航天領(lǐng)域取得了成功應(yīng)用。數(shù)字圖像處理技術(shù)的發(fā)展除了與計(jì)算機(jī)技術(shù)、信息技術(shù)的快速發(fā)展密切相關(guān)以外,還得益于其在航空航天、工業(yè)、生物醫(yī)學(xué)、軍事、通信工程、商務(wù)、環(huán)境、林業(yè)等諸多領(lǐng)域的廣泛應(yīng)用,正是這些應(yīng)用需求,促進(jìn)了數(shù)字圖像處理技術(shù)的深入研究和快速發(fā)展?!皵?shù)字圖像處理”課程是隨著計(jì)算機(jī)和信息技術(shù)發(fā)展應(yīng)運(yùn)而生的一門新興課程,已成為信息類專業(yè)本科生的重要專業(yè)課。通過(guò)該課程的學(xué)習(xí),要求學(xué)生掌握數(shù)字圖像處理的基本概念和原理,能夠?qū)D像進(jìn)行各種處理,如圖像增強(qiáng)、圖像運(yùn)算、圖像編碼、邊緣檢測(cè)等,為圖像通信、模式識(shí)別、計(jì)算機(jī)視覺(jué)以及其他交叉學(xué)科等工程領(lǐng)域的應(yīng)用奠定基礎(chǔ)。

“數(shù)字圖像處理”課程的理論教學(xué)很抽象,僅僅通過(guò)理論教學(xué)學(xué)生很難掌握數(shù)字圖像處理的基本原理。如果把數(shù)字圖像處理的廣泛應(yīng)用引入課堂理論教學(xué),將具體知識(shí)點(diǎn)與其在實(shí)踐中的使用相結(jié)合,同時(shí)為學(xué)生提供邊學(xué)邊實(shí)踐的機(jī)會(huì),不僅可以提高學(xué)生的學(xué)習(xí)興趣,加深對(duì)抽象理論知識(shí)的理解,增強(qiáng)其動(dòng)手實(shí)踐的能力,還可以拓展學(xué)生的視野,與目前學(xué)科前沿技術(shù)相銜接。

二、視覺(jué)測(cè)量技術(shù)

在現(xiàn)代三維測(cè)量新技術(shù)中,視覺(jué)測(cè)量是由計(jì)算機(jī)視覺(jué)、圖像處理、模式識(shí)別等多學(xué)科交叉結(jié)合而形成的科學(xué)。圖1所示,視覺(jué)測(cè)量是一種非接觸性測(cè)量手段,以數(shù)字圖像作為信息載體,對(duì)被測(cè)目標(biāo)進(jìn)行成像,通過(guò)提取多個(gè)像面的二維像點(diǎn)信息,標(biāo)定相機(jī)內(nèi)、外參數(shù),并重建、優(yōu)化被測(cè)目標(biāo)的三維信息,實(shí)現(xiàn)測(cè)量。視覺(jué)測(cè)量基于嚴(yán)謹(jǐn)?shù)睦碚摵同F(xiàn)代的硬軟件設(shè)施,可以達(dá)到相當(dāng)高的精度和可靠性,便于對(duì)大型工件、設(shè)備的尺寸、位置、三維輪廓等進(jìn)行高精度測(cè)量,而且移動(dòng)方便,可快速靈活地構(gòu)建適于不同測(cè)量對(duì)象的系統(tǒng),進(jìn)行現(xiàn)場(chǎng)測(cè)量。目前,視覺(jué)測(cè)量技術(shù)已經(jīng)廣泛應(yīng)用于建筑工程、航空航天、汽車制造、生物醫(yī)學(xué)、考古等各個(gè)領(lǐng)域。[1~5]因此,視覺(jué)測(cè)量技術(shù)正在深入工業(yè)生產(chǎn)和社會(huì)生活的各個(gè)領(lǐng)域,研究和應(yīng)用新的基于光學(xué)、數(shù)字圖像和視覺(jué)信息融合的三維測(cè)量方法,既具有重要的理論意義,又具有重大的實(shí)用價(jià)值,應(yīng)用前景非常廣闊。

根據(jù)視覺(jué)測(cè)量的基本原理,利用數(shù)字圖像處理技術(shù)獲取的二維信息是視覺(jué)測(cè)量中相機(jī)標(biāo)定、三維重建等環(huán)節(jié)的基礎(chǔ),對(duì)于系統(tǒng)的測(cè)量精度、穩(wěn)定性等方面具有決定性的影響,是視覺(jué)測(cè)量領(lǐng)域的關(guān)鍵技術(shù)。在長(zhǎng)期的數(shù)字圖像處理課程教學(xué)以及視覺(jué)測(cè)量研究工作中發(fā)現(xiàn),可以將視覺(jué)測(cè)量中關(guān)于數(shù)字圖像處理的應(yīng)用內(nèi)容引入課堂教學(xué)中,與具體理論知識(shí)相結(jié)合,加深學(xué)生對(duì)于課程理論的理解,使其接觸到科學(xué)研究的前沿內(nèi)容。此外,通過(guò)設(shè)置開(kāi)放性實(shí)驗(yàn)等環(huán)節(jié),引導(dǎo)有興趣和能力的學(xué)生進(jìn)行實(shí)踐能力的培養(yǎng),使學(xué)到的知識(shí)“活”起來(lái)。

三、視覺(jué)測(cè)量與數(shù)字圖像處理課程的融合

為了改善數(shù)字圖像處理課程的教學(xué)效果,提高教學(xué)效率,將視覺(jué)測(cè)量技術(shù)與數(shù)字圖像處理課程相融合,本文主要在教學(xué)方法和教學(xué)手段改革、視覺(jué)測(cè)量需求與理論知識(shí)點(diǎn)結(jié)合、實(shí)踐動(dòng)手能力提高等方面進(jìn)行了研究。

1.教學(xué)方法和教學(xué)手段改革

為了貫徹學(xué)生是教育主體的教育思路,使學(xué)生學(xué)會(huì)學(xué)習(xí),并充分激發(fā)學(xué)生的創(chuàng)新能力和素質(zhì)培養(yǎng),促進(jìn)學(xué)生個(gè)性的發(fā)展,同時(shí)有利于師生彼此促進(jìn)共同進(jìn)步的原則,針對(duì)數(shù)字圖像處理課程的特點(diǎn),采取了以下措施:

(1)重視數(shù)字圖像處理課程的基礎(chǔ)理論教學(xué)。數(shù)字圖像處理內(nèi)容豐富,應(yīng)用靈活廣泛,但學(xué)生在掌握某些具體應(yīng)用技術(shù)時(shí)感到理解困難。因此,在實(shí)際教學(xué)上,首先需要注重相關(guān)的基礎(chǔ)理論教學(xué)。[6]例如,數(shù)字圖像的本質(zhì)是數(shù)字信號(hào),所以在課程前期階段,專門有針對(duì)性地復(fù)習(xí)和講解了信號(hào)分析與處理方面的基本理論,包括數(shù)字信號(hào)處理的常用方法、離散傅里葉變換和快速傅里葉變換、離散余弦變換等,這些理論在數(shù)字圖像處理課程中有具體應(yīng)用。這不僅有利于對(duì)數(shù)字圖像處理內(nèi)容的掌握,也可以反過(guò)來(lái)加深對(duì)相關(guān)理論的理解。另一方面注意授課內(nèi)容的精選,內(nèi)容不在于多,而在于少而精,突出重點(diǎn),使學(xué)生在有限學(xué)時(shí)內(nèi)有最大的收獲。例如,在頻域空間進(jìn)行圖像增強(qiáng)時(shí),不能將頻域空間的所有方法都對(duì)學(xué)生講授,而是突出講解了關(guān)于頻域空間與時(shí)域空間處理之間的關(guān)系,針對(duì)頻域圖像平滑介紹一種低頻濾波器,分析其原理和特點(diǎn)。這樣不僅節(jié)省了教學(xué)時(shí)間,而且重點(diǎn)突出,同時(shí)也引導(dǎo)學(xué)生查閱其他相關(guān)方法,讓他們自己去動(dòng)腦思考,提高其思維能力。

(2)完善和改革課堂教學(xué)方法。在課堂教學(xué)過(guò)程中,我們始終重視啟發(fā)式教學(xué),遵循“提出問(wèn)題”、“啟發(fā)式思考”、“解決問(wèn)題”的教學(xué)過(guò)程,使用“問(wèn)題教學(xué)法”引導(dǎo)學(xué)生去思考、分析問(wèn)題,激發(fā)學(xué)生學(xué)習(xí)的積極性,提高教學(xué)效果。課堂開(kāi)始時(shí),根據(jù)授課內(nèi)容,提前向?qū)W生拋出相關(guān)問(wèn)題,在講課過(guò)程中則圍繞該問(wèn)題講解課程內(nèi)容,最后提出問(wèn)題的解決方法。例如,在講解“直方圖均衡化圖像增強(qiáng)技術(shù)”一節(jié)內(nèi)容時(shí),首先向?qū)W生展示了兩幅曝光不足和曝光過(guò)量的圖片,并且為了提高學(xué)生的學(xué)習(xí)興趣,認(rèn)識(shí)數(shù)字圖像處理的實(shí)際應(yīng)用,圖片取自于視覺(jué)測(cè)量、航空交會(huì)對(duì)接定位等領(lǐng)域的實(shí)際圖片,向?qū)W生提問(wèn),“如果實(shí)際應(yīng)用中,由于環(huán)境光的影響,拍攝到了這樣的圖片,應(yīng)該怎么辦?”課堂講解過(guò)程中,隨著直方圖、直方圖增強(qiáng)技術(shù)的理論、直方圖均衡化方法等內(nèi)容的展開(kāi),使學(xué)生逐漸理解并掌握直方圖均衡化方法,最后,給學(xué)生演示了直方圖均衡化方法的實(shí)現(xiàn),并看到了利用該方法對(duì)圖片增強(qiáng)前后的圖片效果。這種啟發(fā)引導(dǎo)式的課堂教學(xué)方法,取得了良好的效果。

(3)傳統(tǒng)和現(xiàn)代化教學(xué)手段相結(jié)合。隨著計(jì)算機(jī)、通信技術(shù)應(yīng)用的迅速普及,國(guó)內(nèi)高校的課堂教學(xué)已普遍采用了多媒體技術(shù),利用計(jì)算機(jī)、投影儀、幻燈機(jī)等現(xiàn)代化教學(xué)設(shè)備,結(jié)合計(jì)算機(jī)輔助教學(xué)(CAI)展示教學(xué)內(nèi)容。這些現(xiàn)代化技術(shù)的確為課堂帶來(lái)了很多豐富多彩的教學(xué)手段。數(shù)字圖像處理是以圖像為處理對(duì)象,其輸出的形式主要以圖像和圖形為主,該課程也十分適宜將教學(xué)內(nèi)容制成課件,采用多媒體計(jì)算機(jī)開(kāi)展現(xiàn)代化教學(xué)。借助多媒體,使學(xué)生較直觀地看到各種圖像的處理需求、處理過(guò)程、處理效果等,這是普通教材和參考資料所無(wú)法比擬的。因此,我們針對(duì)課堂教學(xué)需求,進(jìn)行了多媒體課程教學(xué)資源建設(shè),如教學(xué)大綱、教學(xué)日歷、授課教案和課件等通過(guò)多媒體平成,便于講課,同時(shí)也便于學(xué)生課后的復(fù)習(xí)。例如,將視覺(jué)測(cè)量原理、過(guò)程等,通過(guò)多媒體課件的形式演示出來(lái),相比較口頭介紹等方法具有更加直觀的效果。除了多媒體教學(xué)手段,傳統(tǒng)的板書(shū)式教學(xué)作為補(bǔ)充手段也在數(shù)字圖像處理課程中得到應(yīng)用,主要用在課堂教學(xué)內(nèi)容框架展示、理論推導(dǎo)等方面。

2.視覺(jué)測(cè)量與理論知識(shí)點(diǎn)結(jié)合

為了提高算法對(duì)于目標(biāo)特征的識(shí)別效果,視覺(jué)測(cè)量通常采用圓形或方形特征點(diǎn)(圖2),在獲取的圖像中對(duì)特征的成像位置進(jìn)行識(shí)別和精確定位。視覺(jué)測(cè)量對(duì)于圖像處理的要求主要包括圖像預(yù)處理、特征粗定位、特征精定位等內(nèi)容,對(duì)應(yīng)數(shù)字圖像處理課程中的圖像增強(qiáng)、邊緣檢測(cè)、特征識(shí)別、幾何運(yùn)算等知識(shí)點(diǎn)。[7]

圖2 視覺(jué)測(cè)量常用特征點(diǎn)

(1)圖像預(yù)處理。圖像預(yù)處理的主要方法包括彩色圖像灰度化、圖像增強(qiáng)等,為此,在講解彩色圖像內(nèi)容時(shí),介紹了RGB、HSI等彩色模型以及不同彩色模型之間的轉(zhuǎn)換,并引出如何將彩色信息轉(zhuǎn)換成灰度信息。通過(guò)分析彩色表示模型,建立了彩色到灰度圖像的轉(zhuǎn)換。

向?qū)W生展示常用視覺(jué)測(cè)量圖像效果的基礎(chǔ)上,為了減少圖像噪聲的影響、提高圖像識(shí)別效果,提出改善圖像質(zhì)量的目標(biāo),需要進(jìn)行圖像增強(qiáng)。結(jié)合圖像增強(qiáng)中常用的直方圖增強(qiáng)技術(shù)、空域和頻域圖像增強(qiáng)方法在視覺(jué)測(cè)量圖像處理中的實(shí)際應(yīng)用,給學(xué)生展示直觀的處理效果,加深對(duì)圖像增強(qiáng)方法的理解。

(2)特征點(diǎn)粗定位。數(shù)字圖像處理的邊緣檢測(cè)是該課程比較重要的一部分內(nèi)容,邊緣檢測(cè)中包含了多種方法,便于學(xué)生對(duì)不同邊緣檢測(cè)算法的作用效果有直觀印象,將各種算法應(yīng)用于視覺(jué)測(cè)量圖像征點(diǎn)的邊緣檢測(cè),并有針對(duì)性地選擇相應(yīng)參數(shù),使學(xué)生不僅學(xué)習(xí)了各種邊緣檢測(cè)算法的使用,也看到了算法的特點(diǎn)。

根據(jù)視覺(jué)成像的特點(diǎn),圓形特征點(diǎn)成像后一般為橢圓,所以,利用邊緣檢測(cè)得到的邊緣像點(diǎn)數(shù)據(jù),講解用邊緣點(diǎn)進(jìn)行指定特征識(shí)別的方法,如基于Hough變換的特征檢測(cè)方法。為了引導(dǎo)學(xué)生思考,采用啟發(fā)式講課方法,講解了Hough變換檢測(cè)直線的方法,引出如何用Hough變換檢測(cè)像面上的圓或橢圓,并鼓勵(lì)有能力的學(xué)生實(shí)現(xiàn)相應(yīng)算法。

(3)特征點(diǎn)精定位。特征點(diǎn)精定位的目的是在實(shí)現(xiàn)特征點(diǎn)粗定位的基礎(chǔ)上,對(duì)圓形特征點(diǎn)中心在像面上的精確坐標(biāo)進(jìn)行定位。精確定位主要設(shè)計(jì)到數(shù)字圖像處理中的點(diǎn)運(yùn)算,但需要考慮采用的具體定位算法,如灰度重心法、加權(quán)灰度重心法、橢圓擬合法等。引導(dǎo)學(xué)生通過(guò)文獻(xiàn)資料查找和實(shí)現(xiàn)相關(guān)定位算法,并且與國(guó)際領(lǐng)先的專業(yè)軟件進(jìn)行定位精度對(duì)比。通過(guò)比較,可以使學(xué)生發(fā)現(xiàn)不同算法之間的區(qū)別,并分析不同的原因。進(jìn)一步,引導(dǎo)學(xué)生嘗試對(duì)定位算法做一定的改進(jìn),這種改進(jìn),不需要從算法根本上做出很大的創(chuàng)新,只是從某一方面進(jìn)行微小的變化,使其能夠適合特定的應(yīng)用需求。例如,如果對(duì)視覺(jué)測(cè)量像面上特征點(diǎn)定位采用加權(quán)灰度重心法時(shí),通過(guò)調(diào)整加權(quán)系數(shù),得到不用的效果,從而分析加權(quán)系數(shù)對(duì)于定位精度的影響,并據(jù)此得出適用于該需求的結(jié)論。

四、開(kāi)放性實(shí)驗(yàn)

長(zhǎng)期以來(lái),“數(shù)字圖像處理”課程教學(xué)主要采用課堂理論教學(xué),教學(xué)內(nèi)容也多為經(jīng)典的內(nèi)容,很難反映課程內(nèi)容的時(shí)代特征。實(shí)驗(yàn)教學(xué)是高等教育的重要組成部分,是抽象思維與形象思維、傳授知識(shí)與訓(xùn)練技能相結(jié)合的過(guò)程,在人才培養(yǎng)中具有課堂理論教學(xué)環(huán)節(jié)不可替代的作用,對(duì)培養(yǎng)理工科大學(xué)生的創(chuàng)造性是不可缺少的。雖然目前大多數(shù)課程都設(shè)置了實(shí)踐環(huán)節(jié),但也普遍存在著很多問(wèn)題,[8]例如,實(shí)驗(yàn)課成績(jī)占課程成績(jī)比例小,學(xué)生對(duì)實(shí)驗(yàn)的重視度不夠,存在著抄襲他人實(shí)驗(yàn)結(jié)果和報(bào)告的現(xiàn)象;實(shí)驗(yàn)?zāi)J絾我唬瑢?shí)驗(yàn)內(nèi)容陳舊、呆板,多為驗(yàn)證性實(shí)驗(yàn),缺乏創(chuàng)新性和挑戰(zhàn)性,學(xué)生完全處于被動(dòng)狀態(tài),最終導(dǎo)致實(shí)驗(yàn)不認(rèn)真,敷衍了事,所學(xué)的知識(shí)和操作技術(shù)遺忘快;不能保證每個(gè)學(xué)生都有充分的時(shí)間和機(jī)會(huì)做實(shí)驗(yàn),個(gè)別學(xué)生逐漸養(yǎng)成依賴心理,最終只有一部分學(xué)生得到了鍛煉;理論課與實(shí)驗(yàn)課教學(xué)老師分離,造成理論和實(shí)踐環(huán)節(jié)脫節(jié)等。

針對(duì)目前“數(shù)字圖像處理”課程實(shí)驗(yàn)的現(xiàn)狀,根據(jù)視覺(jué)測(cè)量像面特征點(diǎn)定位需求,開(kāi)設(shè)相關(guān)開(kāi)放性實(shí)驗(yàn)項(xiàng)目“視覺(jué)測(cè)量特征點(diǎn)提取定位實(shí)驗(yàn)”,實(shí)驗(yàn)要求學(xué)生結(jié)合數(shù)字圖像處理課程知識(shí)理論,對(duì)視覺(jué)測(cè)量采集的數(shù)字圖像進(jìn)行處理,提取相關(guān)特征點(diǎn)。針對(duì)視覺(jué)測(cè)量中常用的特征點(diǎn)(圓形、方形)進(jìn)行自動(dòng)檢測(cè),并實(shí)現(xiàn)高精度定位,主要實(shí)驗(yàn)內(nèi)容包括:圖像預(yù)處理、特征點(diǎn)粗定位、特征點(diǎn)精定位、算法設(shè)計(jì)與實(shí)現(xiàn)、實(shí)驗(yàn)結(jié)果分析等。

教師在開(kāi)放性實(shí)驗(yàn)項(xiàng)目中承擔(dān)的角色主要是方案設(shè)計(jì)和實(shí)施過(guò)程中的指導(dǎo)、監(jiān)督,對(duì)方案的具體實(shí)現(xiàn)方法不做限制性要求,主要由學(xué)生結(jié)合課堂教學(xué)內(nèi)容以及查閱文獻(xiàn)資料來(lái)設(shè)計(jì)并完成。為了提高項(xiàng)目完成的效率,教師可以通過(guò)適當(dāng)?shù)囊龑?dǎo)為學(xué)生指出主要方向。

對(duì)于單個(gè)學(xué)生來(lái)說(shuō),這樣的實(shí)驗(yàn)項(xiàng)目有些困難,“團(tuán)隊(duì)合作”也是新時(shí)期對(duì)科技人才素質(zhì)的要求,所以可以通過(guò)建立項(xiàng)目小組的方式開(kāi)展實(shí)驗(yàn)。小組成員將實(shí)驗(yàn)內(nèi)容進(jìn)行分工,每人負(fù)責(zé)不同的部分,通過(guò)相互合作、幫助,完成整個(gè)實(shí)驗(yàn)項(xiàng)目。通過(guò)這種形式,也在某種程度上鍛煉了學(xué)生的團(tuán)隊(duì)合作意識(shí)和合作方法。

五、結(jié)束語(yǔ)

通過(guò)將視覺(jué)測(cè)量領(lǐng)域研究成果引入“數(shù)字圖像處理”課程,并在教學(xué)方法、教學(xué)手段、教學(xué)內(nèi)容、開(kāi)放性實(shí)踐等方面的改革和嘗試,逐步做到科學(xué)研究成果與課堂理論教學(xué)的有機(jī)結(jié)合,不僅豐富了課程的教學(xué)內(nèi)容,提高了學(xué)生的學(xué)習(xí)興趣,加深了對(duì)理論知識(shí)的理解,而且使學(xué)生接觸到科學(xué)研究的前沿領(lǐng)域,開(kāi)拓了視野,對(duì)創(chuàng)新能力的培養(yǎng)鍛煉等方面也具有重要意義。

參考文獻(xiàn)

1 E.M. Mikhail, J.S. Bethel. Introduction to Modern Photogramme

-try[M]. New York: John Wiley & Sons,2001

2 胡安文、季錚、盛慶紅.基于近景數(shù)字視覺(jué)測(cè)量的飛機(jī)表面模型重建[J].地理空間信息,2004(6):23~25

3 Nicola D’Apuzzo. Overview of 3D surface digitization technologi-es in Europe[C]. Three-Dimensional Image Capture and Applications VI, Proc. of SPIE-IS&T Electronic Imaging, San Jose (CA),2006

4 劉常杰、邾繼貴、葉聲華.汽車白車身機(jī)器視覺(jué)檢測(cè)系統(tǒng)[J].汽車工程,2000(6):373~376

5 彭三城、孫星明、劉國(guó)華.三維人體自動(dòng)測(cè)量技術(shù)綜述[J].計(jì)算機(jī)應(yīng)用研究,2005(4):1~5

6 Wang Jun, Dong Mingli, Liang Bo. A fast target location method for the photogrammetry system[C].Proc. of SPIE-ISMCM, Beijing,2011

第9篇:如何學(xué)習(xí)計(jì)算機(jī)視覺(jué)范文

CBIR圖像特征相似性度量相關(guān)反饋

1基于內(nèi)容的圖像檢索的算法設(shè)計(jì)

1.1圖像的預(yù)處理

圖像預(yù)處理的目的是為了便于圖像特征的提取及相似性度量的計(jì)算以便提高圖像的檢索效率。預(yù)處理是對(duì)原始圖像集進(jìn)行一系列處理以產(chǎn)生圖像描述特征庫(kù)的過(guò)程,主要包括:尺度統(tǒng)一、格式轉(zhuǎn)換、灰度處理等。

1.2圖像特征的提取

特征提取是庫(kù)生成的核心,負(fù)責(zé)提取圖像的視覺(jué)特征包括顏色、形狀、紋理、空間位置關(guān)系等特征,圖像特征的提取應(yīng)準(zhǔn)確而且快速,提取的特征能有效的表征該圖像或者說(shuō)有區(qū)分圖像的能力。

1.2.1顏色特征提取

顏色特征是圖像的基本特征之一,顏色特征也是圖像檢索中應(yīng)用最廣泛的視覺(jué)特征,顏色特征的提取也相對(duì)容易,通過(guò)計(jì)算每中顏色的像素的個(gè)數(shù)并建立顏色直方圖來(lái)實(shí)現(xiàn)。顏色直方圖反映圖像顏色分布的統(tǒng)計(jì)特征,是研究圖像顏色的常用手段。直方圖是顯示圖像中每一灰度級(jí)像素個(gè)數(shù)的函數(shù)。

1.2.2紋理特征提取

根據(jù)二維傅立葉變換的分離特性:,根據(jù)上面的分離形式,可通過(guò)兩次運(yùn)用一維傅立葉變換來(lái)實(shí)現(xiàn)二維傅立葉變換。

頻譜:

頻譜是圖像的重要特征,反映圖像的灰度分布,如果圖像中目標(biāo)形狀或排列呈現(xiàn)某種方向性,那么具有較高值的頻譜也呈現(xiàn)出與圖像目標(biāo)方向正交的方向性分布。

1.2.3形狀特征提取

通過(guò)對(duì)邊界特征的描述來(lái)獲取圖像的形狀參數(shù),圖像的邊界一般是指周圍圖像灰度強(qiáng)度有反差變化的那些像素的集合。

1.2.4相似性度量

采用歐幾里得距離作為圖像特征向量之間的相似性度量方法,進(jìn)行相似度匹配。

1.2.5相關(guān)反饋

由于計(jì)算機(jī)視覺(jué)對(duì)色彩特征的表示、相似度定義和人對(duì)色彩的感知存在著一定差距以及高層語(yǔ)義概念同低層特征之間的差距,基于圖像內(nèi)容檢索的結(jié)果總不是很理想,為了把用戶模型嵌入到圖像檢索系統(tǒng),最近幾年在基于內(nèi)容的圖像檢索領(lǐng)域引入了相關(guān)反饋機(jī)制。

相關(guān)反饋的目的是從用戶與查詢系統(tǒng)的實(shí)際交互過(guò)程中進(jìn)行學(xué)習(xí),發(fā)現(xiàn)并捕捉用戶的實(shí)際查詢意圖,并以此修正系統(tǒng)的查詢策略,從而得到與用戶實(shí)際需求盡可能相吻合的查詢結(jié)果。

基于內(nèi)容檢索中的相關(guān)反饋技術(shù)大致分為參數(shù)調(diào)整方法、聚類分析方法、概率學(xué)習(xí)方法和神經(jīng)網(wǎng)絡(luò)方法。

2實(shí)驗(yàn)結(jié)果

作者用delphi實(shí)現(xiàn)了上面算法的特征分解、特征提取、相似形度量和相關(guān)反饋算法。從150幅圖像中進(jìn)行搜索,返回了20幅圖象。圖象數(shù)據(jù)庫(kù)中包含了花、樹(shù)、蝴蝶和貓。

查詢對(duì)象是包含一只貓,返回實(shí)驗(yàn)結(jié)果如圖1:

返回的20圖像中有7幅含有貓。

用戶從圖像檢索的界面選“是”和“否”對(duì)圖像的結(jié)果進(jìn)行反饋,系統(tǒng)根據(jù)用戶的選擇會(huì)自動(dòng)調(diào)整檢索的特征表示權(quán)重值,從而進(jìn)行第二次的檢索。第二次的檢索返回的20圖像中含有貓的圖像增加到12幅,大大提高了檢索效率。

3結(jié)束語(yǔ)

隨著圖像數(shù)據(jù)庫(kù)的增加,基于內(nèi)容的圖像檢索顯的尤為重要,提取哪圖像些特征,如何提取特征以進(jìn)行高效、準(zhǔn)確的檢索是基于內(nèi)容的圖像檢索技術(shù)中的核心問(wèn)題。采用傅立葉變換提取圖像的紋理特征、邊界矩來(lái)檢測(cè)圖像邊界,再而引入相關(guān)反饋算法,原型系統(tǒng)基本實(shí)現(xiàn)了高速、有效的圖像檢索,在以后的研究中還會(huì)嘗試選擇不同的相關(guān)反饋檢索算法,更進(jìn)一步提高系統(tǒng)的檢索效率。

參考文獻(xiàn):

[1]董衛(wèi)軍,周明全,耿國(guó)華,黎曉.基于內(nèi)容的圖像檢索技術(shù)研究[J].計(jì)算機(jī)工程,2005,(10).