av色综合网,成年片色大黄全免费网站久久,免费大片黄在线观看,japanese乱熟另类,国产成人午夜高潮毛片

公務(wù)員期刊網(wǎng) 精選范文 數(shù)據(jù)分析論文范文

數(shù)據(jù)分析論文精選(九篇)

前言:一篇好文章的誕生,需要你不斷地搜集資料、整理思路,本站小編為你收集了豐富的數(shù)據(jù)分析論文主題范文,僅供參考,歡迎閱讀并收藏。

數(shù)據(jù)分析論文

第1篇:數(shù)據(jù)分析論文范文

1.1數(shù)據(jù)采集

數(shù)據(jù)的采集是指利用傳感器、社交網(wǎng)絡(luò)以及移動互聯(lián)網(wǎng)等方式獲得的各種類型的結(jié)構(gòu)化、半結(jié)構(gòu)化以及非結(jié)構(gòu)化的海量數(shù)據(jù),這是一切數(shù)據(jù)分析的基礎(chǔ)。數(shù)據(jù)的采集需要解決分布式高速高可靠數(shù)據(jù)的采集、高速數(shù)據(jù)全映像等數(shù)據(jù)收集技術(shù)。還要設(shè)計質(zhì)量評估模型,開發(fā)數(shù)據(jù)質(zhì)量技術(shù)。而數(shù)據(jù)采集一般分為大數(shù)據(jù)智能感知層:主要包括數(shù)據(jù)傳感體系、網(wǎng)絡(luò)通信體系、傳感適配體系、智能識別體系及軟硬件資源接入系統(tǒng),實(shí)現(xiàn)對海量數(shù)據(jù)的智能化識別、定位、跟蹤、接入、傳輸、信號轉(zhuǎn)換、監(jiān)控、初步處理和管理等。

1.2數(shù)據(jù)預(yù)處理

數(shù)據(jù)采集的過程本身就有會有很多數(shù)據(jù)庫,但如果想達(dá)到有效分析海量數(shù)據(jù)的目的,就必將這些來自前端的數(shù)據(jù)導(dǎo)入到一個集中的大型分布式數(shù)據(jù)庫,或者分布式存儲集群,而且在導(dǎo)入基礎(chǔ)上做一些簡單的辨析、抽取、清洗等操作。

①抽?。阂?yàn)槲覀兺ㄟ^各種途徑獲取的數(shù)據(jù)可能存在多種結(jié)構(gòu)和類型,而數(shù)據(jù)抽取過程可以有效地將這些復(fù)雜的數(shù)據(jù)轉(zhuǎn)換為單一的結(jié)構(gòu)或者便于處理的類型。以達(dá)到快速分析處理的目的。

②清洗:對于海量數(shù)據(jù)而言,數(shù)據(jù)所處的價值層次不一樣,就必然存在由于價值低而導(dǎo)致開發(fā)成本偏大的數(shù)據(jù),還有與數(shù)據(jù)分析毫無關(guān)系的數(shù)據(jù),而另一些數(shù)據(jù)則是完全錯誤的干擾項(xiàng),所以對數(shù)據(jù)通過過濾“去噪”從而提取出有效數(shù)據(jù)是十分重要的步驟。

1.3數(shù)據(jù)的存儲與管理

當(dāng)我們采集數(shù)據(jù)完成后,就需要將其存儲起來統(tǒng)一管理,主要途徑就是建立相應(yīng)的數(shù)據(jù)庫,進(jìn)行統(tǒng)一管理和調(diào)用。在此基礎(chǔ)上,需要解決大數(shù)據(jù)的可存儲、可表示、可處理、可靠性及有效傳輸?shù)葞讉€關(guān)鍵問題。還需開發(fā)可靠的分布式文件系統(tǒng)(DFS)、能效優(yōu)化的存儲、計算融入存儲、數(shù)據(jù)的去冗余及高效低成本的大數(shù)據(jù)存儲技術(shù);以及分布式非關(guān)系型大數(shù)據(jù)管理與處理技術(shù)、異構(gòu)數(shù)據(jù)的數(shù)據(jù)融合技術(shù)、數(shù)據(jù)組織技術(shù)、研究大數(shù)據(jù)建模技術(shù)、索引、移動、備份、復(fù)制、可視化技術(shù)。

1.4數(shù)據(jù)的統(tǒng)計分析

一般情況下,統(tǒng)計與分析主要就是利用分布式數(shù)據(jù)庫,或者分布式計算集群來對存儲于其內(nèi)的海量數(shù)據(jù)進(jìn)行普通的分析和分類匯總等,以滿足大多數(shù)常見的分析需求,在這方面,一些實(shí)時性需求會用到EMC的GreenPlum、Oracle的Exadata,以及基于MySQL的列式存儲Infobright等,而一些批處理,或者基于半結(jié)構(gòu)化數(shù)據(jù)的需求可以使用Hadoop。統(tǒng)計與分析這部分的主要特點(diǎn)和挑戰(zhàn)是分析涉及的數(shù)據(jù)量大,其對系統(tǒng)資源,特別是I/O會有極大的占用。

1.5數(shù)據(jù)分析與挖掘

所謂數(shù)據(jù)挖掘是指從數(shù)據(jù)庫中的大量不完全的、有噪聲的、模糊的、隨機(jī)的實(shí)際應(yīng)用數(shù)據(jù)中,揭示出隱含的、先前未知的并有潛在價值的信息的過程。與前面統(tǒng)計和分析過程不同的是,數(shù)據(jù)挖掘一般不會有預(yù)先設(shè)計好的主題,主要是在現(xiàn)有數(shù)據(jù)上面進(jìn)行基于各種算法的計算,從而起到預(yù)測(Predict)的效果,從而實(shí)現(xiàn)一些高級別數(shù)據(jù)分析的需求。比較典型的算法有用于聚類的K-means、用于統(tǒng)計學(xué)習(xí)的SVM和用于分類的NaiveBayes,主要使用的工具有Hadoop的Mahout等。該過程的特點(diǎn)和挑戰(zhàn)主要是用于挖掘的算法很復(fù)雜,并且計算涉及的數(shù)據(jù)量和計算量都很大,常用數(shù)據(jù)挖掘算法都以單線程為主。

2數(shù)據(jù)分析的8個層次

2.1標(biāo)準(zhǔn)化報告(StandardReports)

標(biāo)準(zhǔn)化報告作為數(shù)據(jù)分析的第一個層次,要求相對較低,主要是借助相應(yīng)的統(tǒng)計工具對數(shù)據(jù)進(jìn)行歸納總結(jié),得出包含主要參數(shù)指標(biāo)的標(biāo)準(zhǔn)化報告。類似于一個銷售企業(yè)每月或者每季度的財務(wù)報表。

2.2即席查詢(AdHocReports)

用戶可以通過自己的需求,靈活地選擇查詢條件,系統(tǒng)就能夠根據(jù)用戶的需求選擇生成相應(yīng)的統(tǒng)計報表。即席查詢與普通應(yīng)用查詢最大的不同是普通的應(yīng)用查詢是定制開發(fā)的,而即席查詢所有的查詢條件都是用戶自己定義的。在面向高層的數(shù)據(jù)分析軟件中,用戶隨意添加想要查詢的指標(biāo)按鈕再加上相應(yīng)的限制條件,就可以立即生成可視化的統(tǒng)計結(jié)果,不僅一目了然,而且沒有任何操作難度。

2.3多維分析(QueryDrilldown)

多維分析是指對具有多個維度和指標(biāo)所組成的數(shù)據(jù)模型進(jìn)行的可視化分析手段的統(tǒng)稱,常用的分析方式包括:下鉆、上卷、切片(切塊)、旋轉(zhuǎn)等各種分析操作。以便剖析數(shù)據(jù),使分析者、決策者能從多個角度多個側(cè)面觀察數(shù)據(jù),從而深入了解包含在數(shù)據(jù)中的信息和內(nèi)涵。上卷是在數(shù)據(jù)立方體中執(zhí)行聚集操作,通過在維級別中上升或通過消除某個或某些維來觀察更概括的數(shù)據(jù)。上卷的另外一種情況是通過消除一個或者多個維來觀察更加概括的數(shù)據(jù)。下鉆是在維級別中下降或者通過引入某個或者某些維來更細(xì)致地觀察數(shù)據(jù)。切片是在給定的數(shù)據(jù)立方體一個維上進(jìn)行的選擇操作,切片的結(jié)果是得到了一個二維的平面數(shù)據(jù)(切塊是在給定的數(shù)據(jù)立方體的兩個或者多個維上進(jìn)行選擇操作,而切塊的結(jié)果是得到了一個子立方塊)。轉(zhuǎn)軸相對比較簡單,就是改變維的方向。

2.4儀表盤與模擬分析(Alerts)

儀表盤用于監(jiān)控一些關(guān)鍵指標(biāo)。模擬分析是由操作者動態(tài)地加以調(diào)節(jié)的控件(如滑動塊、可調(diào)旋鈕、選擇框等),來控制管理決策模型行為某些參數(shù)。當(dāng)操作者通過控制面板對模型中的參數(shù)值或變量值進(jìn)行調(diào)節(jié)時,圖形中的曲線、柱形組或分析指標(biāo)等要素就會發(fā)生相應(yīng)的運(yùn)動,而這種運(yùn)動正好反映了該參數(shù)的變化對模型行為的影響,如果這種變動引起了模型中最優(yōu)解或其他關(guān)鍵數(shù)字的變化,能夠隨時將關(guān)于這種變化的結(jié)論正確地顯示出來。

2.5統(tǒng)計分析(StatisticallyAnalysis)

我們知道概率論是數(shù)理統(tǒng)計的基礎(chǔ),數(shù)理統(tǒng)計是在其基礎(chǔ)上研究隨機(jī)變量,并應(yīng)用概率論的知識做出合理的估計、推斷與預(yù)測。概率論中討論的各種分布在數(shù)理統(tǒng)計中作為統(tǒng)計模型來分析處理帶有隨機(jī)誤差的數(shù)據(jù)。典型的數(shù)理統(tǒng)計方法有參數(shù)估計、假設(shè)檢驗(yàn)和回歸分析。而統(tǒng)計分析主要是對用戶所關(guān)注的問題進(jìn)行推斷、預(yù)測和控制的分析方法。具體可以分為以下三方面:

①描述統(tǒng)計:主要是集中趨勢、離散程度、分布形狀等,統(tǒng)計圖(方圖、箱線圖、散點(diǎn)圖等);

②數(shù)據(jù)的分類匯總;

③基礎(chǔ)統(tǒng)計分析:方差分析、時間序列分析、相關(guān)和回歸分析、(主成分)因子分析等統(tǒng)計分析方法。

2.6預(yù)測(Forecasting)

在統(tǒng)計分析和數(shù)據(jù)挖掘領(lǐng)域,對未來的預(yù)測已經(jīng)有了很多數(shù)學(xué)模型以及解決具體問題的相關(guān)算法。其核心思想便是從歷史數(shù)據(jù)中找出數(shù)據(jù)的發(fā)展模式,然后以這些模式為支點(diǎn),就可以對未來進(jìn)行預(yù)測。

2.7預(yù)測模型(PredictiveModeling)

隨著數(shù)據(jù)分析學(xué)家對數(shù)據(jù)挖掘技術(shù)的不斷探索,出現(xiàn)了很多預(yù)測模型以及與之相對應(yīng)的算法,但是很難確定某個模型是最精確的,因?yàn)椴煌念I(lǐng)域,不同的條件,對應(yīng)的預(yù)測模型是不一樣的,所以沒有統(tǒng)一化的最優(yōu)模型,只存在有選擇性的最優(yōu)模型。下面介紹幾種典型的預(yù)測模型。

①回歸模型:回歸模型可以分為一元線性回歸模型和多元線性回歸模型。一元線性回歸模型可表示為yt=b0+b1xt+ut,該式表示變量yt和xt之間的真實(shí)關(guān)系。其中yt稱作被解釋變量(或相依變量、因變量),xt稱作解釋變量(或獨(dú)立變量、自變量),ut稱作隨機(jī)誤差項(xiàng),b0稱作常數(shù)項(xiàng)(截距項(xiàng)),b1稱作回歸系數(shù)。b0+b1xt是非隨機(jī)部分,ut是隨機(jī)部分。而在很多情況下,回歸模型必包含兩個或更多自變量才能夠適應(yīng)地描述經(jīng)濟(jì)現(xiàn)象各相關(guān)量之間的聯(lián)系,這就是多元線性回歸模型需要解決的問題,其一般形式為:Y=a+b1X1+b2X2+…+bmXm,式中X1、X2、…、Xm是這個多元回歸問題的m個自變量,b1、b2、…、bm是回歸方程對應(yīng)于各自變量的系數(shù),又稱偏回歸系數(shù)。

②貝葉斯網(wǎng)絡(luò):貝葉斯網(wǎng)絡(luò)是基于概率推理的數(shù)學(xué)模型,而概率推理是通過一些產(chǎn)量的信息來獲取其他概率信息的過程。貝葉斯網(wǎng)絡(luò)會建立一個有向無環(huán)圖和一個概率表集合,有向無環(huán)圖中的每一個節(jié)點(diǎn)便是一個隨機(jī)變量,而有向邊表示隨機(jī)變量間的條件依賴,條件概率表中的每一個元素對應(yīng)有向無環(huán)圖中唯一的節(jié)點(diǎn),存儲此節(jié)點(diǎn)對其所有直接前驅(qū)節(jié)點(diǎn)的條件概率。貝葉斯網(wǎng)絡(luò)是為了解決不定性與不完整性問題而提出的,在多個領(lǐng)域中獲得廣泛應(yīng)用。

③基于時間序列分析的指數(shù)平滑模型在時間序列分析中指數(shù)平滑模型是最靈活和準(zhǔn)確的方法,在經(jīng)濟(jì)領(lǐng)域也被證明是最有效的預(yù)測模型。在不同的時間序列下,指數(shù)平滑模型可以分為簡單指數(shù)平滑法、帶有趨勢調(diào)整的指數(shù)平滑法、帶有阻尼趨勢的指數(shù)平滑法、簡單季節(jié)指數(shù)平滑法、帶有趨勢和季節(jié)調(diào)整的指數(shù)平滑法五種不復(fù)雜度的模型。

2.8最優(yōu)化

(Optimization)因?yàn)閮?yōu)化問題往往可以帶來巨額的收益,通過一系列可行的優(yōu)化,可以使收益得到顯著提高。所謂最優(yōu)化就是從有限或者無限種可行的方案中選取最優(yōu)的方案。如果可以通過簡單的評判,就可以確定最優(yōu)方案那是最好的。但是事實(shí)不會那么簡單,所以優(yōu)化技術(shù)已經(jīng)發(fā)展出了一系列的理論來解決實(shí)際問題。其常用的優(yōu)化技術(shù)為:

①線性規(guī)劃:當(dāng)目標(biāo)函數(shù)與約束函數(shù)都是線性函數(shù)時,就是一個線性規(guī)劃問題。而當(dāng)同時滿足約束函數(shù)和目標(biāo)函數(shù)時,則可以認(rèn)為是最優(yōu)解。

②整數(shù)規(guī)劃:要求決策變量取整數(shù)值的數(shù)學(xué)規(guī)劃。

③多目標(biāo)規(guī)劃:指衡量一個決策優(yōu)劣的標(biāo)準(zhǔn)不止一個,也就是有多目標(biāo)函數(shù)。

④動態(tài)規(guī)劃:將一個復(fù)雜的問題劃分為多個階段,逐段求解,最終求出全局最優(yōu)解。

3用Excel實(shí)現(xiàn)簡單的數(shù)據(jù)分析

①對于企業(yè)而言最重要的是利潤,所以管理者必須要從這張表中得到最關(guān)鍵也最容易得到的銷量和銷售額以及與其相關(guān)的一些數(shù)據(jù),通常是用最基本的數(shù)理統(tǒng)計結(jié)果來直觀地反映該企業(yè)在某個期間的盈利情況。

②其次,我們必須要做進(jìn)一步的分析。已經(jīng)對整體的情況有了一定的把握,所以就可以朝著不同的方向去挖掘一些有價值的信息,為企業(yè)高層做決策提供有力的依據(jù)。對產(chǎn)品銷售而言,客戶結(jié)構(gòu)能夠有效地反映客戶的地域分布,企業(yè)可以根據(jù)客戶的來源,在未開辟客戶的地域去尋找新的目標(biāo)客戶群。而銷量結(jié)構(gòu)可以直觀地反映企業(yè)最大銷量來自哪個地區(qū),對銷量較小的地區(qū)可以加大宣傳力度或者增加銷售網(wǎng)點(diǎn)來保持各地區(qū)銷售均衡。還可以及時地調(diào)整銷售方式來擴(kuò)大市場份額,而對于銷量最小的地區(qū)考慮開辟新的市場。

統(tǒng)計了各地區(qū)的銷售總額和平均銷售額以及兩者的對比關(guān)系。由此可以得出地區(qū)平均購買力大小,以及各地區(qū)總銷售額大小。借助圖表描述,管理者可以對企業(yè)在某段期間內(nèi)的銷售狀況有一個大概的把握,只有掌握了這些的信息,才能更細(xì)化地去研究具體的影響因素。劃分等級,對于經(jīng)常性大量購買的客戶必須要以最優(yōu)惠的價格和最好的服務(wù)讓其滿意,以形成一個穩(wěn)定的大客戶群。而對于那些少量購買的客戶,也要制定出相應(yīng)合適的方案來留住客戶。所以,分析銷售額的分布情況,可以掌握客戶的購買力度而且還能及時做一些留住大客戶的舉措。

4用R語言實(shí)現(xiàn)數(shù)據(jù)多層次分析

R語言是一種自由軟件編程語言與操作環(huán)境,是一套完整的數(shù)據(jù)處理、計算和制圖軟件系統(tǒng),它是一種用來進(jìn)行數(shù)據(jù)探索、統(tǒng)計分析和作圖的解釋型語言。它可以提供一些集成的統(tǒng)計工具,但更大量的是它提供各種數(shù)學(xué)計算、統(tǒng)計計算的函數(shù),從而使使用者能靈活機(jī)動地進(jìn)行數(shù)據(jù)分析,甚至創(chuàng)造出符合需要的新的統(tǒng)計計算方法。而在使用R語言進(jìn)行數(shù)據(jù)分析處理時,當(dāng)我們遇到很大的原始數(shù)據(jù),但用來建模的數(shù)據(jù)較小,則可以先在數(shù)據(jù)庫中進(jìn)行整理,然后通過R與數(shù)據(jù)庫的接口提取數(shù)據(jù),數(shù)據(jù)庫適合存放和整理比較規(guī)整的數(shù)據(jù),和R中的數(shù)據(jù)框有良好的對應(yīng)關(guān)系,這也是R中絕大多數(shù)統(tǒng)計模型的標(biāo)準(zhǔn)數(shù)據(jù)結(jié)構(gòu)。數(shù)據(jù)庫中大部分的運(yùn)算都不需要消耗很大的內(nèi)存。

5結(jié)語

第2篇:數(shù)據(jù)分析論文范文

蚊蟲基因組序列的揭示為其基因的克隆鑒定和功能分析提供了很好的平臺。由于蚊基因組中高度重復(fù)序列的廣泛存在,給一些基因特別是非編碼序列的分子克隆帶來了困難,而基因組序列的提供給這一問題的解決帶來了福音。利用已獲得的白紋伊蚊基因組序列,我們已順利克隆了其嗅覺結(jié)合蛋白(OBP)和嗅覺受體(OR)基因及其調(diào)控序列,為其嗅覺發(fā)生分子機(jī)制的闡明奠定了基礎(chǔ)。Criscione等通過比較斯氏按蚊雌蚊和雄蚊的基因組DNA和RNA樣本的Illumina測序結(jié)果,發(fā)現(xiàn)了一個Y染色體特有的基因GUY1。Hall等則發(fā)明了一種更為有效的染色體熵法,該方法的優(yōu)勢是僅利用高通量測序獲得的基因組和轉(zhuǎn)錄組數(shù)據(jù),而不需要一個固定在染色體上的參考基因組來進(jìn)行比對。通過比對兩種瘧疾重要傳播媒介斯氏按蚊和岡比亞按蚊的高通量基因組和轉(zhuǎn)錄組數(shù)據(jù),系統(tǒng)性地在斯氏按蚊和岡比亞按蚊中各發(fā)現(xiàn)了3個Y基因。同時通過對鑒定的Y基因進(jìn)行生物進(jìn)化分析,結(jié)果表明按蚊的Y染色體進(jìn)化迅速。隨后,Hall等又使用染色體熵的方法比對了雄性和雌性埃及伊蚊基因組DNA和RNA的Illumina測序數(shù)據(jù),篩選并鑒定了一個新的基因myo-sex。myo-sex基因幾乎只存在于雄蚊的基因組,但是由于基因重組偶爾地能在雌蚊的基因組中發(fā)現(xiàn),具有雄性偏好性,是一個可能具有性別拮抗效應(yīng)的肌球蛋白重鏈基因。蚊蟲基因組數(shù)據(jù)也為蚊蟲性別決定網(wǎng)絡(luò)底部基因dsx的研究提供了依據(jù)。dsx是性別決定網(wǎng)絡(luò)中的調(diào)控核心,主要行使決定體細(xì)胞和生殖細(xì)胞性別的功能,也可調(diào)控中樞神經(jīng)相關(guān)基因fruitless,進(jìn)而調(diào)節(jié)。岡比亞按蚊基因組數(shù)據(jù)之后,Scali等率先鑒定了岡比亞按蚊dsx的性別特異性轉(zhuǎn)錄本,其橫跨2號染色體85kb的區(qū)域,通過選擇性拼接產(chǎn)生多個外顯子組成的雌性和雄性特異性轉(zhuǎn)錄本。而隨著2014年斯氏按蚊基因組的,有研究者將Scali等報導(dǎo)的Angdsx與剛的斯氏按蚊基因組和轉(zhuǎn)錄組進(jìn)行序列比對,發(fā)現(xiàn)一致性達(dá)到了97%,而與岡比亞按蚊基因組及轉(zhuǎn)錄組序列一致性僅為85%。Scali等在埃及伊蚊中發(fā)現(xiàn)了兩種雌性特異性的可變剪接方式,這不同于黑腹果蠅和岡比亞按蚊具有的特異性DsxF。

2蚊蟲的轉(zhuǎn)錄組學(xué)研究

轉(zhuǎn)錄組學(xué)(transcriptomics)是一個活細(xì)胞所能轉(zhuǎn)錄出來的所有RNA的總和,是研究細(xì)胞表型和功能的一個重要手段。傳統(tǒng)上用于轉(zhuǎn)錄組數(shù)據(jù)獲得和分析的方法主要有基于雜交技術(shù)的芯片技術(shù)包括cDNA芯片和寡聚核苷酸芯片,但目前使用最普遍的是RNA-seq即轉(zhuǎn)錄組測序技術(shù)?;贗llumina高通量測序平臺的轉(zhuǎn)錄組測序技術(shù)能夠在單核苷酸水平對任意物種的整體轉(zhuǎn)錄活動進(jìn)行檢測,在分析轉(zhuǎn)錄本的結(jié)構(gòu)和表達(dá)水平的同時,還能發(fā)現(xiàn)未知轉(zhuǎn)錄本和稀有轉(zhuǎn)錄本,精確地識別可變剪切位點(diǎn)以及cSNP(編碼序列單核苷酸多態(tài)性),提供最全面的轉(zhuǎn)錄組信息。相對于傳統(tǒng)的芯片雜交平臺,轉(zhuǎn)錄組測序無需預(yù)先針對已知序列設(shè)計探針,即可對任意物種的整體轉(zhuǎn)錄活動進(jìn)行檢測,提供更精確的數(shù)字化信號,更高的檢測通量以及更廣泛的檢測范圍,是目前深入研究轉(zhuǎn)錄組復(fù)雜性的強(qiáng)大工具。巨蚊屬是蚊科中三種不吸血的蚊屬之一,其幼蟲階段以同在小型水體中孳生的白紋伊蚊和埃及伊蚊為食,兩性成蚊均不吸血,以植物汁液和花蜜為食。為了探究巨蚊與其它吸血蚊種在搜尋宿主方面的基因水平上有何差異,國外有學(xué)者從巨蚊上分離出觸須、觸角和身體其他部分,分別提取這三部分的RNA,利用RNA-seq技術(shù),將獲得的序列片段從頭組裝,與目前已公布的致倦庫蚊、岡比亞按蚊、埃及伊蚊基因組數(shù)據(jù)進(jìn)行系統(tǒng)進(jìn)化樹分析,發(fā)現(xiàn)巨蚊與埃及伊蚊的種屬關(guān)系最近,并且在上述四種蚊種中均發(fā)現(xiàn)了編碼氣味分子受體(odorantreceptor,OR)蛋白和離子轉(zhuǎn)移受體(ionotropicreceptor,IR)蛋白的基因,但值得注意的是,巨蚊受體蛋白的表達(dá)量與豐度上較其它蚊種都有所降低[18]。因?yàn)檫@些受體蛋白被認(rèn)為與吸血昆蟲搜尋宿主氣味分子如CO2有關(guān),所以,巨蚊在長期的生物進(jìn)化過程中,喪失了原本存在的吸血習(xí)性。蚊唾液腺蛋白與其吸血傳病密切相關(guān)。國外有學(xué)者提取白紋伊蚊雌性成蚊的唾液腺RNA后進(jìn)行轉(zhuǎn)錄組和蛋白質(zhì)組分析,發(fā)現(xiàn)至少有32個基因在雌性成蚊的唾液腺中表達(dá)程度或者增高或者降低,另外有17個基因表達(dá)在雌性成蚊唾液腺和雄性成蚊中,但不表達(dá)在雌性成蚊的其他組織中。通過分析發(fā)現(xiàn),其中大約三分之一的基因功能表現(xiàn)在吸血、消化糖、免疫應(yīng)答等方面,但是并未發(fā)現(xiàn)其余基因的明確功能,所以非常有可能是長期吸血的過程中進(jìn)化出的新的功能分子。利用同樣的方法,分析岡比亞按蚊、斯氏按蚊、達(dá)氏按蚊、埃及伊蚊、白紋伊蚊、致倦庫蚊和致死按蚊(Anophelesfunestus)的唾液蛋白相關(guān)的轉(zhuǎn)錄組,可以將這些蛋白歸納為:

(1)昆蟲唾液腺中普遍存在的唾液蛋白,包括抗原-5蛋白家族、核酸酶、碳水化合物水解酶等;

(2)在吸血的長角亞目昆蟲(包括白蛉、蚋、蠓等)中豐富表達(dá)的D7蛋白;

(3)僅在蚊唾液腺中存在的蛋白,包括30000左右的過敏原蛋白家族(allergenfamily)和一些粘蛋白。很多昆蟲都被發(fā)現(xiàn)具有一種獨(dú)特的生物學(xué)現(xiàn)象——滯育(diapause)。昆蟲的滯育現(xiàn)象被認(rèn)為是一種休眠的形式,在昆蟲發(fā)育時遇到不適宜的環(huán)境時,就會馬上由體內(nèi)激素調(diào)節(jié)并控制,暫時停止發(fā)育。白紋伊蚊被發(fā)現(xiàn)同樣具有滯育現(xiàn)象,這是它能適應(yīng)環(huán)境氣候變化,實(shí)現(xiàn)快速擴(kuò)張入侵的生物學(xué)基礎(chǔ)之一。白紋伊蚊的雌性成蚊在每日受到較短時間的光照后,產(chǎn)下的卵不會立即孵化,這便是一種滯育的現(xiàn)象。有趣的是,同是伊蚊屬的埃及伊蚊,其雌性成蚊產(chǎn)的卵如果沒有接觸到水,也不會孵化、發(fā)育,這卻被認(rèn)為是一種靜息狀態(tài)(quiescence)。這兩種現(xiàn)象的區(qū)別在于,發(fā)生滯育后,白紋伊蚊的卵即使收到合適的外界環(huán)境的刺激,仍需要經(jīng)過一段時間的恢復(fù)才會孵化,而處于靜息狀態(tài)的埃及伊蚊的卵,只要受到適宜條件的刺激(如接觸到水),就會馬上進(jìn)入發(fā)育階段。國外有學(xué)者利用RNA-seq技術(shù),對這兩種現(xiàn)象進(jìn)行分析,發(fā)現(xiàn)這兩種現(xiàn)象在發(fā)育停止的階段,分子水平上是很相近的,不同之處在于滯育現(xiàn)象的早期準(zhǔn)備階段和后期修復(fù)階段,是其所獨(dú)有的。關(guān)于滯育現(xiàn)象的早期準(zhǔn)備階段,國外學(xué)者通過RNA-seq技術(shù),比較滯育前階段(pre-diapause)的白紋伊蚊胚胎與同時期非滯育的白紋伊蚊胚胎基因表達(dá)水平上的差異,發(fā)現(xiàn)前者在基因表達(dá)模式上有非常大的改變。目前,已有學(xué)者歸納和總結(jié)出了一套利用RNA-seq技術(shù)研究白紋伊蚊滯育現(xiàn)象的方法,為今后更全面、徹底地認(rèn)識白紋伊蚊以及其他媒介昆蟲的滯育現(xiàn)象提供了堅(jiān)實(shí)的基礎(chǔ)。利用RNA-seq技術(shù),我們對白紋伊蚊不同發(fā)育時期(卵、幼蟲、蛹、雄蚊、雌蚊)和感染登革病毒前后的轉(zhuǎn)錄組進(jìn)行了分析。對比分析不同發(fā)育階段特別是雌雄蚊的基因表達(dá)譜,我們找到了在胚胎早期對性別分化具有重要作用的候選基因和對雌蚊吸血傳病相關(guān)的性別偏愛基因。對比分析登革病毒感染與否的白紋伊蚊轉(zhuǎn)錄組,我們發(fā)現(xiàn)了可能與蚊媒與病原相互作用有關(guān)的免疫分子(未發(fā)表結(jié)果)。目前,針對這些候選基因的進(jìn)一步功能分析正在進(jìn)行之中。另外,對白紋伊蚊抗藥品系和敏感品系的RNA-seq對比分析也在進(jìn)行中,這對于其抗藥機(jī)制的闡明非常重要。

3蚊蟲的小RNA組學(xué)研究

小RNA(smallRNAs)主要指長度在18~30nt的一類非編碼RNA(ncRNAs),在真核生物中,具有基因表達(dá)調(diào)控功能的小RNA主要有微小RNA(microRNAs,miRNAs)、內(nèi)源小干擾RNA(endo-siRNAs)和piwi干擾RNA(piRNAs)。piRNA長度集中在26-31nt,目前只在動物的生殖系細(xì)胞及干細(xì)胞中被發(fā)現(xiàn),其主要功能是參與轉(zhuǎn)座子的沉默。miRNAs和endo-siRNAs長度主要集中在20~24nt。miRNAs在動植物和微生物中都普遍存在,據(jù)估計一個物種中約1/3的基因會受到miRNA的調(diào)控,大量的實(shí)驗(yàn)也表明miRNAs參與了諸多生命過程的調(diào)控,例如細(xì)胞周期、細(xì)胞分化、組織器官的發(fā)生、營養(yǎng)代謝、信號途徑以及對外界生物的非生物的環(huán)境的反應(yīng);同時,miRNAs在生產(chǎn)實(shí)踐與臨床治療上也具有很大的應(yīng)用前景。以往用于尋找miRNAs等小RNA的方法有實(shí)驗(yàn)克隆法、計算機(jī)預(yù)測法。克隆法可以直接用于鑒定新小RNA,是初期發(fā)掘小RNA的常用方法,不足之處是實(shí)驗(yàn)周期較長,對低表達(dá)的小RNA的發(fā)現(xiàn)能力十分有限。計算機(jī)預(yù)測法多是針對某一已知的小RNA特征設(shè)計算法,從全基因組或EST數(shù)據(jù)庫中快速發(fā)掘大量潛在的小RNA,一定程度上彌補(bǔ)了克隆法的缺點(diǎn),然而,預(yù)測的小RNA最終還需要實(shí)驗(yàn)證明,同時計算機(jī)預(yù)測法對新類型小RNA的發(fā)掘能力十分有限。隨著第二代高通量測序技術(shù)的問世,小RNA高通量測序(smallRNA-Seq)技術(shù)開始逐漸取代原始的小RNA發(fā)掘法方法,該法具有速度快、成本低、覆蓋度深等多方面的優(yōu)點(diǎn),對鑒定與發(fā)現(xiàn)生命體內(nèi)的小分子RNA及其功能與機(jī)理研究起極大的推動作用。全世界有超過3000種蚊蟲,目前為止僅有岡比亞按蚊、斯氏按蚊、埃及伊蚊、致倦庫蚊以及白紋伊蚊鑒定出miRNA。一些miRNA的文庫和功能分析表明miRNA對蚊蟲的卵巢發(fā)育和吸血后的血液消化具有調(diào)節(jié)作用。病毒感染可以對宿主細(xì)胞miRNA的表達(dá)水平產(chǎn)生深遠(yuǎn)影響,可能與宿主抗病毒機(jī)制及病毒入侵后改變細(xì)胞內(nèi)環(huán)境有關(guān),雌蚊中miRNA的表達(dá)模式會隨著病原體的感染而發(fā)生變化。Hussain等對登革病毒(DENV)編碼的miRNA或病毒小RNA(vsRNAs)的進(jìn)行了功能研究,他們發(fā)現(xiàn)6個vsRNAs能通過作用于病毒基因組RNA莖環(huán)結(jié)構(gòu)中的5''''和3''''的UTR區(qū),顯著增加病毒復(fù)制。中腸屏障是蚊蟲防止病原體入侵而建立的重要屏障,Alexander等的研究發(fā)現(xiàn)miR-1174僅在伊蚊和按蚊的中腸中表達(dá),且雌蚊吸血后其表達(dá)量明顯上調(diào);而當(dāng)miR-1174表達(dá)下調(diào)后,蚊子吸血率明顯降低,壽命明顯縮短。作者認(rèn)為:蚊特異性miRNAs,特別是miR-1174具有重要的生物學(xué)意義,它們可能影響人們今后控制蚊蟲的策略。我們對白紋伊蚊不同發(fā)育時期(卵、幼蟲、蛹、雄蚊、雌蚊、吸血后雌蚊)的小RNA進(jìn)行了深度測序分析。結(jié)果在白紋伊蚊中篩選出119條已知的miRNA基因,確定了15條novelmiRNA基因,其中11條是伊蚊特異的,并且觀察到許多miRNA呈現(xiàn)期特異表達(dá)的特點(diǎn)。經(jīng)過實(shí)驗(yàn)驗(yàn)證,miR-286、miR-2492和miR-1891分別在白紋伊蚊的卵、幼蟲和成蟲期特異高效表達(dá),敲低/敲除這些miRNA會對蚊蟲的生長發(fā)育造成顯著影響。這些研究為新型生物殺蟲劑的研發(fā)提供了靶標(biāo)。我們還對感染登革病毒前后白紋伊蚊的細(xì)胞和成蟲的小RNA進(jìn)行了深度測序分析。結(jié)果在感染登革病毒的白紋伊蚊中找到了10條表達(dá)上調(diào)的miRNA和11條表達(dá)下調(diào)的miRNA。通過對這些差顯表達(dá)miRNA的功能分析,發(fā)現(xiàn)miR-252通過與E蛋白3''''-UTR區(qū)域的結(jié)合,對登革病毒的復(fù)制起到抑制作用;而miR-281則通過與E蛋白5''''-UTR區(qū)域的結(jié)合,對登革病毒的復(fù)制具有促進(jìn)作用。這些研究為抗登革病毒藥物的設(shè)計和研發(fā)提供了線索。piRNA來源于轉(zhuǎn)座元件、基因間隔區(qū)和一些編碼蛋白質(zhì)基因的3''''UTRs,對維持基因的完整性和穩(wěn)定性有一定作用,但最近的研究證明它在抗病毒免疫中也有較大作用。Schnettler等的研究證明:對蚊蟲細(xì)胞感染蟲媒病毒可以引發(fā)piRNA路徑,而敲除piRNA蛋白質(zhì)會使病毒產(chǎn)生增多。Castellano等確定了多個24-30nt的Piwi相互作用RNAs基因組簇,通過比對到轉(zhuǎn)座元件和蛋白質(zhì)編碼基因的3''''UTRs,發(fā)現(xiàn)許多TEs和一些內(nèi)源性基因的3''''UTR產(chǎn)生大量具有piRNA樣特征的29-nt小RNAs峰。此外,來自岡比亞按蚊和黑腹果蠅TEs的正義和反義piRNAs揭示了piRNA序列偏差的新特征。弗吉尼亞理工大學(xué)的研究人員最近在庫蚊中發(fā)現(xiàn)了一種新型的抗病毒途徑,Morazzani等在無dicer-2和無突變的蚊細(xì)胞中進(jìn)行的實(shí)驗(yàn)表明,病毒產(chǎn)生的piRNA樣小RNA可以在病毒產(chǎn)生siRNA的過程中調(diào)節(jié)病毒感染的發(fā)生。同時也表明新的piRNA途徑存在于蚊媒的體細(xì)胞中并且可能發(fā)揮著比siRNA途徑更寬泛的的抗病毒作用,顯示出其為強(qiáng)大的免疫系統(tǒng)。因此,理解病毒如何繞開蚊蟲的雙重抗病毒反應(yīng)對于科學(xué)家來說是越來越有趣的挑戰(zhàn)。

4結(jié)語

第3篇:數(shù)據(jù)分析論文范文

關(guān)鍵詞:電子商務(wù)數(shù)據(jù)分析數(shù)據(jù)挖掘信息技術(shù)

一、市場調(diào)查

根據(jù)一份市場調(diào)查顯示;賣家本身體現(xiàn)的實(shí)力給人與信任可依賴程度越高,用戶越愿意來購買商品。

在我評論之前,我申明一下,一家之言只代表一個群體的言論,并不能涵蓋每個人的想法與判斷,電子商務(wù)的數(shù)據(jù)報告只能說明趨勢,并不能完全反應(yīng)出每個顧客真實(shí)的意圖。賣家信譽(yù)-28%。價格-26%。網(wǎng)站的外觀和感覺-16%。網(wǎng)站易用性-15%。商品打折-4%??爝f和交付等原因-3%。出現(xiàn)在搜索引擎上-2%。

這是一份市場調(diào)查的結(jié)果,數(shù)據(jù)報告對實(shí)際商業(yè)產(chǎn)生怎樣的影響,一個關(guān)鍵問題就是篩選問題的分類方式,他是否獨(dú)立又相互依存,論點(diǎn)論據(jù)之間重合度越低,數(shù)據(jù)報告能說明的問題越準(zhǔn)確。但在這之前首先是樣本數(shù)據(jù)的獲取與篩選方法,這里就不追溯了。我只是想根據(jù)個人對電子商務(wù)的理解,結(jié)合這份報告說點(diǎn)事,實(shí)際上這一組數(shù)據(jù)比較接近我個人對網(wǎng)購的理解,首先我們逐條說明這些影響一個網(wǎng)店的因素:

二、賣家信譽(yù)

之所以被普遍認(rèn)為是最重要的,是因?yàn)槲覀兙W(wǎng)購時并不真實(shí)的接觸到產(chǎn)品,也并不了解向你推銷商品的人是否值得可信,這都是顧客基本的一個需要認(rèn)知過程,互聯(lián)網(wǎng)上哪里去確認(rèn)?當(dāng)然如果你在一家多賣家的平臺上,往往都會有商家信用,評論等功能,很容易通過別的顧客消費(fèi)情況增加自己對商家的認(rèn)知。電子商務(wù)為什么要打假信用?這只是順應(yīng)顧客需求,維護(hù)健康秩序所必須做的事情。所以作為賣家不要輕易嘗試作假信用,或者你今天逃過一劫,但說不定你明天網(wǎng)店剛做大的時候被強(qiáng)行關(guān)閉了。

三、價格

價格是一道屏障,在相互比拼中,有人拼得起,有人拼不起,但如何更好的控制價格,削減顧客成本,不僅為自己贏得更多展示機(jī)會,也會贏得更多顧客。價格不會是越低廉越好,最好的平衡體系沒有,只有一個方法,如何在綜合上為自己贏得市場??有人習(xí)慣選一些比如3.99美元的價格,看上去不加拿一分錢顧客潛在心理是這個人沒賺錢,但值得說的是商品定價因產(chǎn)品,因地域時間,顧客等因素制宜,現(xiàn)在的顧客不都是傻子,商品有的是比價機(jī)會。也有人選擇款0利潤或者賠本的商品推,但在商品里關(guān)聯(lián)組合商品賣,通過吸引用戶購買自己的組合商品或者別的商品來拉動自己銷售利潤;還有的人也是利用免費(fèi)贈送或者賠本的方式掛商品,但通過物流利潤來保證自己不虧本的方式拉動店鋪其他產(chǎn)品行銷。

四、網(wǎng)站的外觀與感覺

有的人店鋪半年一年都是淘寶默認(rèn)的最爛的那套模板,也不知道為什么淘寶沒更新還是咋的,我沒賣過商品,還不是很了解那個,但我買東西基本不光顧這樣的店鋪,店主對店鋪的打理程度決定了我對店主的看法,因?yàn)樾庞貌皇墙^對可靠的;產(chǎn)品,服務(wù)好不好,全在你的形象與行為上。

五、網(wǎng)站易用性

你能忍受自己在一個網(wǎng)站嘩啦了半天結(jié)果沒搞懂應(yīng)該怎么買商品嗎?我一個朋友,按照我的認(rèn)識他也是比較理性,屬于心思敏捷的,他說他在XX網(wǎng)站搞了好久,都不知道怎么買東西,所以以后都沒去過;雖然易用的應(yīng)用都還是不能被所有人接受,但簡單清楚的,沒有歧義的每一步流程總是好的。不過這個雖然用戶關(guān)注的多,但我覺得但凡有點(diǎn)認(rèn)識的,認(rèn)識相應(yīng)語言的人大概都明白很多網(wǎng)購系統(tǒng)的操作流程。這里就不說什么了。

六、促銷打折

商品打折也屬于價格范疇,只是這里細(xì)化成了一個活動,活動可以是定期的比如每周二,三,四晚上限量搶購啊;選2款顧客競價??;前面“價格”里也提到的0價格換信用,換軟文之類的??;參與商盟聯(lián)合促銷?。粨Q季狂甩啊之類的??傊畢⑴c打折的,有資本經(jīng)歷運(yùn)作打折的,只要PV高,顧客肯定不會少,除非你的商品含有價格,性能,服務(wù)等水分太大,用什么樣的打折方法,最關(guān)鍵的你是銷售一時還是為了希望吸引到長久的顧客而去設(shè)計。

七、快遞與交付等原因

物流過程中雖然有很多不可控因素導(dǎo)致一些商品容易磨損之類的,但物流懼怕承擔(dān)責(zé)任的態(tài)度決定了自己的發(fā)展框架,假設(shè)一下,你的企業(yè)就在你的心胸里;你心胸只有100㎡大小,即使你鼓足了勁你也最多到120㎡,這樣的容量是沒有辦法和猶如大海寬廣心胸的人比較的。我是沒記住你,但有人記住你了,他下次要走物流,肯定不會選你,你損失的不只是一個用戶,而是損失了一個未來。

八、搜索排名

我沒有看到他們分析提交的數(shù)據(jù)時基于怎樣的搜索引擎,這個分類其實(shí)很不準(zhǔn)確,雖然數(shù)字已經(jīng)很少了,我自己買商品在淘寶,有啊上都用他們站內(nèi)的搜索引擎,如果我常用的幾個排序商品方法篩選數(shù)據(jù)你都沒排列在前三頁,那么即使你離我最近,就住在我隔壁,你服務(wù)態(tài)度最好,商品也不必別人的差;但你離我還是太遠(yuǎn)了,我根本找不到你。

對我個人來說,像百度,GOOGLE的網(wǎng)頁搜索這樣的綜合搜索出來的商品,對我吸引力太小了,綜合搜索出來的商品并不是他信譽(yù)最高,價格最低,服務(wù)最好就顯示在了綜合搜索引擎上,只因?yàn)樗捻撁娓m合搜索引擎邏輯而已。商品真正追求的東西不在文本上,而在商品與服務(wù)內(nèi)在的東西里。當(dāng)然,在同等條件下,不要錯過這樣一個增加PV與交易機(jī)會的機(jī)會。

九、總結(jié)

目前,數(shù)據(jù)挖掘技術(shù)正以前所未有的速度發(fā)展,并且擴(kuò)大著用戶群體,在未來越來越激烈的市場競爭中,擁有數(shù)據(jù)挖掘技術(shù)必將比別人獲得更快速的反應(yīng),贏得更多的商業(yè)機(jī)會?,F(xiàn)在世界上的主要數(shù)據(jù)庫廠商紛紛開始把數(shù)據(jù)挖掘功能集成到自己的產(chǎn)品中,加快數(shù)據(jù)挖掘技術(shù)的發(fā)展。我國在這一領(lǐng)域正處在研究開發(fā)階段,加快研究數(shù)據(jù)挖掘技術(shù),并把它應(yīng)用于電子商務(wù)中,應(yīng)用到更多行業(yè)中,勢必會有更好的商業(yè)機(jī)會和更光明的前景。

參考文獻(xiàn):

[1]韓家煒.Web挖掘研究[J].計算機(jī)研究與發(fā)展,2001.

[2]陳宏.消費(fèi)者數(shù)據(jù)挖掘系統(tǒng)建立的幾個問題.

[3]方美琪.電子商務(wù)概論.北京:清華大學(xué)出版社,1999.

第4篇:數(shù)據(jù)分析論文范文

近年來,全國大學(xué)生數(shù)學(xué)建模競賽迅速發(fā)展,為國家培養(yǎng)了大批應(yīng)用型人才。但由于各地區(qū)教育水平不同、相關(guān)部門對競賽的重視程度不同,導(dǎo)致各地區(qū)組織學(xué)生參加大學(xué)數(shù)學(xué)建模競賽的規(guī)模不同,在該項(xiàng)賽事中取得的成績差異比較顯著。2013年全國大學(xué)生數(shù)學(xué)建模競賽評選出的獎項(xiàng)有:賽區(qū)優(yōu)秀組織工作獎9個,本科組高教社杯獎1個,專科高教社杯獎1個,本科組MATLAB創(chuàng)新獎1個,??平MMATLAB創(chuàng)新獎1個,本科組IBMSPSS創(chuàng)新獎1個,??平MIBMSPSS創(chuàng)新獎1個,本科組一等獎共273名,本科組二等獎共1292名,專科組一等獎共44名,??平M二等獎共211名[1],但成績相對于參賽區(qū)分布不太均勻。分析各地區(qū)在2013年全國大學(xué)生數(shù)學(xué)建模競賽中取得的成績,明確各地區(qū)數(shù)學(xué)建模發(fā)展?fàn)顩r的差異和特點(diǎn),將有利于相關(guān)部門從宏觀上了解我國大學(xué)生數(shù)學(xué)建模競賽的整體發(fā)展現(xiàn)狀,分類制定相關(guān)政策[2-3],從而充分發(fā)揮數(shù)學(xué)建模的重要作用。

1建立綜合評價指標(biāo)體系

全國大學(xué)生數(shù)學(xué)建模競賽現(xiàn)狀的一個重要方面就是全國大學(xué)生數(shù)學(xué)建模競賽獲獎情況。依據(jù)全國大學(xué)生數(shù)學(xué)建模競賽設(shè)置的獎項(xiàng),遵循可比性原則,參考文獻(xiàn)[4-5],選取x1-x7共七項(xiàng)評價指標(biāo),具體如下:x1:本科組高教社杯、MATLAB創(chuàng)新獎和IBMSPSS創(chuàng)新獎獲獎情況;x2:本科組一等獎獲獎數(shù);x3:本科組二等獎獲獎數(shù);x4:??平M高教社杯、MATLAB創(chuàng)新獎和IBMSPSS創(chuàng)新獎獲獎情況;x5:??平M一等獎獲獎數(shù);x6:??平M二等獎獲獎數(shù);x7:年度競賽優(yōu)秀組織工作獎獲得情況。說明:鑒于本科組與專科組的高教社杯、MAT-LAB創(chuàng)新獎和IBMSPSS創(chuàng)新獎三類獎項(xiàng)每年只有一個隊(duì)獲獎,且基本不可重復(fù)獲得(參見歷年大學(xué)生數(shù)學(xué)建模競賽獲獎名單)故將其合并作為一類。

2數(shù)據(jù)資料依據(jù)

2013年全國大學(xué)生數(shù)學(xué)建模競賽獲獎名單,按指標(biāo)對各個賽區(qū)的獲獎情況統(tǒng)計如表1所示。

3R型聚類分析定性分析

七項(xiàng)指標(biāo)之間的相關(guān)性。編寫MAT-LAB程序如下:>>clc,clear>>symxy;>>x=xlsread(‘shuju.xls’);%將上表中的數(shù)據(jù)保存到MATLAB中WORK文件夾excel文件shu-ju.xls中,并將其賦于x>>y=corr(x)%輸出七項(xiàng)指標(biāo)間的相關(guān)系數(shù)矩陣(如表2所示)>>d=pdist(y,’correlation’);%計算相關(guān)系數(shù)導(dǎo)出的距離>>z=linkage(d,’average’);%按類平均法聚類>>h=dendrogram(z);%畫聚類圖(如圖1所示)>>T=cluster(z,’maxclust',5);%把變量劃分為5類>>fori=1:5tm=find(T==i);tm=reshape(tm,1,length(tm));>>fprintf(’第%d類的有%s\n’,i,int2str(tm));>>end程序輸出:第1類的有4;第2類的有56;第3類的有7;第4類的有23;第5類的有1。即:若將指標(biāo)分為5類,則指標(biāo)1、4、7各為一類,指標(biāo)2、3為一類,指標(biāo)4、5為一類。

4Q型聚類分析

4.1選取5個指標(biāo)的分類從R型聚類分析分出的5類指標(biāo)中各選一個,即選取5個指標(biāo)體系,對33個參賽地區(qū)進(jìn)行聚類分析。首先對變量數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理,采用歐氏距離度量樣本間相似性,選用類平均法計算類間距離。在MATLAB命令窗口輸入下列程序:>>symsxy;>>x=xlsread(’shuju.xls’);%將上表中的數(shù)據(jù)保存到MATLAB中WORK文件夾excel文件shu-ju.xls中,并將其賦于x>>x(:,[3,5])=[];%刪除數(shù)據(jù)矩陣的3,5兩列,即使用變量1,2,4,6,7>>x=zscore(x);%將數(shù)據(jù)標(biāo)準(zhǔn)化>>s=pdist(x);%每一行是一個對象,求對象間的歐式距離>>z=linkage(s,’average’);%按類平均法聚類>>h=dendrogram(z);%畫聚類圖(如圖2所示)>>T=cluster(z,’maxclust’,3);%把樣本點(diǎn)劃分成3類>>fori=1:3;tm=find(T==i);%求i類的對象tm=reshape(tm,1,length(tm));%變成行向量>>fprintf(’第%d類的有%s\n’,i,int2str(tm));%現(xiàn)實(shí)分類結(jié)果>>end程序輸出:第1類的有11318第2類的有2345678910111216171920212224252627282930313233第3類的有141523即:第一類:北京,福建,湖南;第三類:江西,山東,四川;第二類:其它地區(qū)。

4.2選取7個指標(biāo)的分類考慮到指標(biāo)2與指標(biāo)3,指標(biāo)5與指標(biāo)6具有一定的獨(dú)立性,若七個指標(biāo)體系全部取用,將33個地區(qū)分為4類,程序輸入如下:>>symsxy;>>x=xlsread(’shuju.xls’);>>s=pdist(x);>>z=linkage(s,’average’);>>h=dendrogram(z);%畫聚類圖(如圖3所示)>>T=cluster(z,’maxclust’,4);>>fori=1:4tm=find(T==i);tm=reshape(tm,1,length(tm));>>fprintf(’第%d類的有%s\n’,i,int2str(tm));>>end程序輸出:第1類的有116第2類的有6710151927第3類的有23489111213141718202223242528第4類的有521262930313233即:第一類:北京,河南;第二類:遼寧,吉林,江蘇,山東,廣東,陜西;第四類:內(nèi)蒙古,海南,,青海,寧夏,新疆,香港,澳門。4.3選取本科層次指標(biāo)的分類只考慮本科層次取得的成績,即選用指標(biāo)1,2,3,對33個參賽地區(qū)進(jìn)行聚類分析,從而明確掌握其本科階段的差異,則有:輸入程序:>>symsxy;>>x=xlsread(’shuju.xls’);>>x(:,[4,5,6,7])=[];>>x=zscore(x);>>s=pdist(x);>>z=linkage(s,’average’);>>h=dendrogram(z);%畫聚類圖(如圖4所示)>>T=cluster(z,’maxclust’,3);>>fori=1:3;tm=find(T==i);tm=reshape(tm,1,length(tm));>>fprintf(’第%d類的有%s\n’,i,int2str(tm));>>end程序輸出:第1類的有11318第2類的有101115161719222327第3類的有2345678912142021242526282930313233即:第一類:北京,福建,湖南;第二類:江蘇,浙江,山東,河南,湖北,廣東,重慶,四川,陜西;第三類:其它地區(qū)。4.4選取專科層次指標(biāo)的分類只考慮??茖哟稳〉玫某煽?,即選用指標(biāo)4,5,6,對33個參賽地區(qū)進(jìn)行聚類分析,從而明確掌握其??齐A段的差異,則有:輸入程序:>>symsxy;>>x=xlsread(’shuju.xls’);>>x(:,[1:3,7])=[];>>x=zscore(x);>>s=pdist(x);>>z=linkage(s,’average’);%畫聚類圖(如圖5所示)>>h=dendrogram(z);>>T=cluster(z,’maxclust',4);>>fori=1:4;tm=find(T==i);tm=reshape(tm,1,length(tm));>>fprintf(’第%d類的有%s\n’,i,int2str(tm));>>end程序輸出:第1類的有14第2類的有1523第3類的有41927第4類的有1235678910111213161718202122242526282930313233即:第一類:江西;第二類:山東,四川;第三類:山西,廣東,陜西;第四類:其余各地區(qū)。

5結(jié)束語

第5篇:數(shù)據(jù)分析論文范文

[摘要]目前地勘單位的檔案數(shù)據(jù)管理,存在職責(zé)不明、保存不妥的現(xiàn)象,造成了不良后果和嚴(yán)重?fù)p失,因此,加強(qiáng)地勘單位檔案管理工作,提高地勘人員質(zhì)量意識和建立地質(zhì)檔案數(shù)據(jù)管理體系。推動檔案管理工作的規(guī)范化、信息化,標(biāo)準(zhǔn)化。

地質(zhì)工作信息化建設(shè)是一項(xiàng)復(fù)雜的系統(tǒng)工程,而地勘單位的信息化建設(shè)與基礎(chǔ)數(shù)據(jù)也就是檔案是密不可分。地質(zhì)檔案數(shù)據(jù)是在地質(zhì)勘查活動中直接形成的、有保存價值的文字、圖表及聲像載體材料等,它既是野外勘測過程的真實(shí)反映和記錄、地勘經(jīng)濟(jì)發(fā)展的重要基礎(chǔ)和依據(jù),也是單位維權(quán)的憑證和依據(jù)。基礎(chǔ)的地質(zhì)數(shù)據(jù)文件具有內(nèi)容的單一性、載體的多樣性、形式的特殊性等特點(diǎn),隨著社會信息化的飛速發(fā)展,地勘單位數(shù)據(jù)文件的內(nèi)容、形式、載體等屬性也發(fā)生了較大的變化,特別是以地質(zhì)找礦項(xiàng)目為中心所形成的檔案材料具有全面化、精確化、系統(tǒng)化的成套性和現(xiàn)實(shí)性、專業(yè)性要求,而一個完整的地質(zhì)項(xiàng)目要經(jīng)過立項(xiàng)、設(shè)計、施工、竣工等階段,要經(jīng)過主管局等上級部門的審批和驗(yàn)收,因此收集整理符合標(biāo)準(zhǔn)的數(shù)據(jù)文件本身就有很多工作要做,那么如何做好管理工作,更好地為地質(zhì)找礦和社會經(jīng)濟(jì)發(fā)展服務(wù)?本文就結(jié)合著地勘單位的資料管理工作實(shí)際談幾點(diǎn)粗淺的認(rèn)識。

1加強(qiáng)領(lǐng)導(dǎo),建立組織,收集數(shù)據(jù)

抓好基礎(chǔ)數(shù)據(jù)文件工作,首先要從思想上重視檔案管理工作,提高認(rèn)識,從監(jiān)與管兩方面入手,分管檔案工作的領(lǐng)導(dǎo)應(yīng)給予多方面的支持和提供資源保障,用規(guī)范化、信息化、標(biāo)準(zhǔn)化來要求檔案的收集、整理、歸檔、保管和開發(fā)利用工作,建立起“內(nèi)外”有別而又相互統(tǒng)一的檔案管理體系?!皟?nèi)”就是要協(xié)調(diào)內(nèi)部各職能部門增強(qiáng)檔案意識,注重收集與及時移交,防止檔案材料的散失;“外”就是要抓住每一個環(huán)節(jié)的檔案收集,積極與主管部門、設(shè)計、施工等單位負(fù)責(zé)人及檔案人員通力協(xié)作,以保證歸檔案卷數(shù)據(jù)的完整、準(zhǔn)確、系統(tǒng)。建立健全檔案管理組織,不僅是行政管理的重要組成部分,而且是必須做好的一項(xiàng)基礎(chǔ)性工作,因此,要明確有關(guān)人員與部門的職責(zé),用制度管人,用制度辦事,將數(shù)據(jù)文件工作作為硬任務(wù)列入地勘項(xiàng)目指標(biāo)條款,在單位規(guī)章制度體系中將地勘單位檔案工作以法律文書的形式規(guī)定下來,鼓勵和支持檔案管理人員深入現(xiàn)場收集檔案資料,作為檔案人員應(yīng)有針對性地列出所需收集的資料名目,自始至終參與到項(xiàng)目管理中去,保質(zhì)保量地獲取第一手資料。另外,還要與外購、有關(guān)單位進(jìn)行交換、復(fù)制索取以及標(biāo)準(zhǔn)化的網(wǎng)絡(luò)收集等。形成完整有效的地質(zhì)數(shù)據(jù)文件。

2建立制度,編制方案,完善規(guī)則

長期以來,地勘工作執(zhí)行和延續(xù)計劃經(jīng)濟(jì)的管理體制,缺少市場經(jīng)濟(jì)體制中的競爭意識和對原始數(shù)據(jù)質(zhì)量問題的關(guān)注意識。只有調(diào)動全員的積極性,以完善科學(xué)的管理制度做指導(dǎo),按標(biāo)準(zhǔn)建立質(zhì)量管理體系,使一切工作有章可循,才能從根本上解決原始地質(zhì)數(shù)據(jù)的完整性和質(zhì)量問題。制度要健全,執(zhí)行要堅(jiān)決。按照檔案管理的法律法規(guī)及相關(guān)規(guī)定的有關(guān)規(guī)定與標(biāo)準(zhǔn),對已經(jīng)收集的文字、圖紙、圖片、聲像等資料,應(yīng)根據(jù)數(shù)據(jù)文件形成的規(guī)律和特點(diǎn),在便于保管和利用的前提下,進(jìn)行科學(xué)分類整理,設(shè)置相應(yīng)的歸檔類目,按原始地質(zhì)立卷歸檔規(guī)則如:范圍、規(guī)范性引用檔、術(shù)語與定義、歸檔范圍與分類、編號與編目、立卷歸檔要求等,還包括地質(zhì)項(xiàng)目的設(shè)計檔案、設(shè)施工檔案和竣工檔案等。應(yīng)根據(jù)本單位的實(shí)際情況和具體要求,制定本單位的數(shù)據(jù)文件管理實(shí)施細(xì)則,細(xì)則應(yīng)主要明確本單位數(shù)據(jù)文件的范圍,歸檔的基本要求和基本內(nèi)容,數(shù)據(jù)文件的移交與整理、保存與借閱的要求等。

數(shù)據(jù)要齊全,內(nèi)容要完整。要達(dá)到此目標(biāo)要求,應(yīng)該重視抓好資料的收集工作,堅(jiān)持地質(zhì)項(xiàng)目建檔工作按照檔案管理規(guī)范要求與項(xiàng)目施工、竣工驗(yàn)收同步,堅(jiān)持檔案部門與基層單位相結(jié)合,編制分類方案,正確區(qū)分和把握依據(jù)檔、設(shè)計檔、項(xiàng)目管理檔、施工竣工驗(yàn)收及檔等的分類工作,齊抓共管,進(jìn)一步做好基礎(chǔ)檔案歸檔工作。

管理要及時,立卷要規(guī)范。為確保數(shù)據(jù)文件齊全、完整、系統(tǒng),就要把數(shù)據(jù)文件工作與項(xiàng)目計劃、檢查、總結(jié)、驗(yàn)收各個環(huán)節(jié)的工作相聯(lián)系,同步進(jìn)行,立卷做到格式統(tǒng)一、字跡工整、圖像清晰,同時根據(jù)內(nèi)容、價值、數(shù)量和載體形式進(jìn)行系統(tǒng)整理,按項(xiàng)目組卷,使檔案數(shù)據(jù)做到文件齊全、分類準(zhǔn)確、體系鮮明、方便管理,方便利用,保持其整體功能。并將立卷好的檔案按規(guī)定移交有關(guān)檔案管理部門,嚴(yán)格交接手續(xù),認(rèn)真核查案卷質(zhì)量并確保檔案的完整。。

3加強(qiáng)培訓(xùn)依法制檔

目前,地勘單位的數(shù)據(jù)文件管理工作遠(yuǎn)不能跟上飛速發(fā)展的地勘形勢的要求。一個單位數(shù)據(jù)文件管理的好壞,不僅與本單位的檔案規(guī)章制度健全與否、主管檔案的領(lǐng)導(dǎo)的思想觀念、檔案管理人員水平的高低息息相關(guān),更與檔案數(shù)據(jù)的組織者對檔案數(shù)據(jù)的重視程度有著極大的關(guān)系。數(shù)據(jù)文件作為科技檔案的重要組成部分,它服務(wù)于今天,有利于未來,為歷史查找、產(chǎn)權(quán)查證、經(jīng)濟(jì)糾紛以及科學(xué)研究提供素材,針對某些領(lǐng)導(dǎo)和技術(shù)人員檔案意識薄弱、檔案管理人員素質(zhì)差的現(xiàn)狀,一是要結(jié)合地勘單位的特點(diǎn),加強(qiáng)對數(shù)據(jù)文件管理人員的培訓(xùn),應(yīng)該組織其學(xué)習(xí)、貫徹《中華人民共和國檔案法》?!吨腥A人民共和國檔案法》明文規(guī)定,一個國家機(jī)關(guān)、武裝力量、政黨、社會團(tuán)體、企業(yè)事業(yè)單位和公民都有保護(hù)檔案的義務(wù)。但目前地勘單位的數(shù)據(jù)文件管理缺乏有力的檔案執(zhí)法機(jī)制是一個比較突出的問題。在檔案未形成時,就有檔案資料散落在工程技術(shù)人員及合同管理人員或是一些領(lǐng)導(dǎo)者個人手中的現(xiàn)象,根據(jù)現(xiàn)存在情況,應(yīng)檔案法宣傳列入全年工作計劃和責(zé)任目標(biāo)考核內(nèi)容,并認(rèn)真制訂宣傳計劃,采取多種形式、通過不同媒體進(jìn)行宣傳,不斷強(qiáng)化監(jiān)督指導(dǎo)功能,特別是主管部門和業(yè)務(wù)指導(dǎo)部門,既要做好執(zhí)法檢查和業(yè)務(wù)指導(dǎo),又要做到定期或不定期抽查,做到點(diǎn)面結(jié)合、跟蹤督辦。結(jié)合正在實(shí)施的保密協(xié)議簽定工作形成有法必依、執(zhí)法必嚴(yán)的局面,推動檔案工作向規(guī)范化、標(biāo)準(zhǔn)化的方向發(fā)展。認(rèn)真學(xué)習(xí)檔案管理的有關(guān)法律法規(guī)及辦法,強(qiáng)化崗前培訓(xùn)。從目前看,許多檔案部門缺乏現(xiàn)代高科技人才,其中檔案、信息處理復(fù)合型人才就更加奇缺,大部分檔案人員現(xiàn)代技術(shù)水準(zhǔn)偏低,甚至有現(xiàn)代文盲現(xiàn)象。盡管引進(jìn)了現(xiàn)代化設(shè)備,仍不能充分發(fā)揮作用,就難以實(shí)現(xiàn)檔案信息化了。因此,信息化建設(shè)人才需要深厚的檔案學(xué)基礎(chǔ)理論,熟悉檔案工作的規(guī)律,從而創(chuàng)新科學(xué)先進(jìn)的管理方法,因此必須通過各種不同形式的培訓(xùn),提高檔案人員業(yè)務(wù)能力和管理水平,自覺增強(qiáng)責(zé)任意識,把檔案提升一個新臺階。

4檔案信息電子化紙質(zhì)檔案數(shù)字化

資料檔案信息化建設(shè)是一項(xiàng)長期復(fù)雜的系統(tǒng)工程,行業(yè)不同,信息化管理模式也不同。面對信息化帶來的挑戰(zhàn)與機(jī)遇,地勘單位與其它企業(yè)一樣面臨市場化和國際化競爭的挑戰(zhàn)。為提高地勘單位的整體素質(zhì),推動地勘單位的改革與發(fā)展,充分利用好信息化這個武器,走出一條適合自己的信息化建設(shè)之路。所謂檔案信息電子化,就是以館藏檔案數(shù)據(jù)紙質(zhì)或機(jī)讀形式的為主要物質(zhì)對象,用微機(jī)對檔案進(jìn)行收集、篩選、加工,使之轉(zhuǎn)化為微機(jī)軟件形式的二次文件信息電子文文件數(shù)據(jù)供利用的過程。把地質(zhì)資料數(shù)據(jù)文件歸檔電子化,充分利用計算機(jī)、掃描儀把紙質(zhì)檔案數(shù)字化,建立全文數(shù)據(jù)庫,以便于存儲查找和利用,既是地質(zhì)工作現(xiàn)實(shí)要求,也是檔案管理必然取向。因此地勘單位必須快速更新觀念,迅速實(shí)現(xiàn)檔案工作網(wǎng)絡(luò)化,為地質(zhì)找礦工作服務(wù),推動其它各項(xiàng)工作的現(xiàn)代化進(jìn)程。

參考文獻(xiàn):

第6篇:數(shù)據(jù)分析論文范文

關(guān)鍵詞:USB;數(shù)據(jù)采集;EZ-USBFX2;GPIF

1引言

現(xiàn)代工業(yè)生產(chǎn)和科學(xué)研究對數(shù)據(jù)采集的要求日益提高。目前比較通用的是在PC或工控機(jī)內(nèi)安裝數(shù)據(jù)采集卡(如A/D卡及422、485卡)。但這些數(shù)據(jù)采集設(shè)備存在以下缺陷:安裝麻煩、價格昂貴、受計算機(jī)插槽數(shù)量、地址、中斷資源的限制,可擴(kuò)展性差,同時在一些電磁干擾性強(qiáng)的測試現(xiàn)場,可能無法專門對其作電磁屏蔽,從而導(dǎo)致采集的數(shù)據(jù)失真。

傳統(tǒng)的外設(shè)與主機(jī)的通訊接口一般是基于PCI總線、ISA總線或者是RS-232C串行總線。PCI總線雖然具有較高的傳輸速度(132Mbps),并支持“即插即用”功能,但其缺點(diǎn)是插拔麻煩,且擴(kuò)展槽有限(一般為5~6個),ISA總線顯然存在同樣的問題。RS-232C串行總線雖然連結(jié)簡單,但其傳輸速度慢(56kbps),且主機(jī)的串口數(shù)目也有限。

通用串行總線(UniversalSerialBus,簡稱USB)是1995年康柏、微軟、IBM、DEC等公司為了解決傳統(tǒng)總線的不足,而推出的一種新型串行通信標(biāo)準(zhǔn)。該總線接口具有安裝方便、高帶寬、易擴(kuò)展等優(yōu)點(diǎn),已經(jīng)逐漸成為現(xiàn)代數(shù)據(jù)傳輸?shù)陌l(fā)展趨勢?;赨SB的數(shù)據(jù)采集系統(tǒng)充分利用USB總線的上述優(yōu)點(diǎn),有效地解決了傳統(tǒng)數(shù)據(jù)采集系統(tǒng)的缺陷。USB的規(guī)范能針對不同的性能價格比要求提供不同的選擇,以滿足不同的系統(tǒng)和部件及相應(yīng)不同的功能,從而給使用帶來極大方便。

2系統(tǒng)介紹

2.1數(shù)據(jù)采集系統(tǒng)的結(jié)構(gòu)與功能

常見的數(shù)據(jù)采集系統(tǒng)的硬件總體結(jié)構(gòu)如圖1所示。其中數(shù)據(jù)采集接口卡是硬件部分的核心,它包括A/D轉(zhuǎn)換器、微控制器、USB通信接口等。

在高速數(shù)據(jù)采集系統(tǒng)中由于現(xiàn)場輸入信號是高頻模擬信號,因而信號的變化范圍都比較大如果采用單一的增益放大那么放大以后的信號幅值有可能超過A/D轉(zhuǎn)換的量程所以必須根據(jù)信號的變化相應(yīng)地調(diào)整放大器的增益。在自動化程度較高的系統(tǒng)中希望能夠在程序中用軟件控制放大器的增益AD8321正是這樣一種具有增益可編程功能的芯片。AD8321是美國AD公司生產(chǎn)的一種增益可編程線性驅(qū)動器。它具有頻帶寬、噪聲低、增益可編程且易于與單片機(jī)進(jìn)行串行通信等優(yōu)點(diǎn),十分適合在數(shù)據(jù)采集系統(tǒng)中做前置放大。

經(jīng)過調(diào)理后的信號可送入模/數(shù)變換器(ADC)進(jìn)行A/D變換。筆者選用的ADC是TLC5540,它是一種高速8位模擬數(shù)字轉(zhuǎn)換器,能以高達(dá)每秒40M的采樣速率進(jìn)行轉(zhuǎn)換,由于采用半閃速結(jié)構(gòu)和CMOS工藝制造,因此功耗和成本很低。其75MHz(典型值)的模擬輸入帶寬使該器件成為欠采樣應(yīng)用的良好選擇。該器件帶有內(nèi)部電阻,可用于從5V電源產(chǎn)生2V滿度的基準(zhǔn)電壓,以減少外部元件數(shù)。數(shù)字輸出置于高阻方式。它僅需要5V電源工作,可由USB總線供電。

由于數(shù)據(jù)采集接口卡是硬件部分的核心,因此應(yīng)選擇能適用USB協(xié)議的合適芯片。EZ-USBFX2是一種USB2.0集成微控制器。它的內(nèi)部集成了USB2.0收發(fā)器、串行接口引擎(SIE)、增強(qiáng)的8051微控制器和一個可編程的串行接口。其主要特性如下:

帶有加強(qiáng)的8051內(nèi)核性能,可達(dá)到標(biāo)準(zhǔn)8051的5~10倍,且與標(biāo)準(zhǔn)8051的指令完全兼容;

集成度高,芯片內(nèi)部集成有微處理器、RAM、SIE(串行接口引擎)等多個功能模塊,從而減少了多個芯片接口部分需要時序配合的麻煩;

采用軟配置,在外設(shè)未通過USB接口接到PC機(jī)之前,外設(shè)上的固件存儲在PC上;而一旦外設(shè)連接到PC機(jī)上,PC則先詢問外設(shè)是“誰”(即讀設(shè)備描述符),然后將該外設(shè)的固件下載到芯片的RAM中,這個過程叫做再枚舉。這樣,在開發(fā)過程中,當(dāng)固件需要修改時,可以先在PC機(jī)上修改好,然后再下載到芯片中;

具有易用的軟件開發(fā)工具,該芯片開發(fā)系統(tǒng)的驅(qū)動程序和固件的開發(fā)和調(diào)試相互獨(dú)立,可加快開發(fā)的速度。

圖2USB接口示意圖

2.2方案選擇

FX2有三種可用的接口模式:端口、GPIF主控和從FIFO。

在“端口”模式下,所有I/O引腳都可作為8051的通用I/O口。

在“從FIFO”模式下,外部邏輯或外部處理器直接與FX2端點(diǎn)FIFO相連。在這種模式下,GPIF不被激活,因?yàn)橥獠窟壿嬁芍苯涌刂艶IFO。這種模式下,外部主控端既可以是異步方式,也可以是同步方式,并可以為FX2接口提供自己的獨(dú)立時鐘。

“GPIF主控”接口模式使用PORTB和PORTD構(gòu)成通向四個FX2端點(diǎn)FIFO(EP2EP4EP6和EP8)的16位數(shù)據(jù)接口。GPIF作為內(nèi)部的主控制器與FIFO直接相連,并產(chǎn)生用戶可編程的控制信號與外部接口進(jìn)行通信。同時,GPIF還可以通過RDY引腳采樣外部信號并等待外部事件。由于GPIF的運(yùn)行速度比FIFO快得多,因此其時序信號具有很好的編程分辨率。另外,GPIF既可以使用內(nèi)部時鐘,也可以使用外部時鐘。故此,筆者選擇了GPIF模式。

高速數(shù)據(jù)采集卡的設(shè)計存在兩大難點(diǎn):一是模擬信號的A/D高速轉(zhuǎn)換;二是變換后數(shù)據(jù)的高速存儲及提取。對于第一個問題,由于制造ADC的技術(shù)不斷進(jìn)步,這個問題已經(jīng)得到解決。而對于第二個問題,一般的數(shù)據(jù)采集系統(tǒng)是將A/D轉(zhuǎn)換后的數(shù)據(jù)先存儲在外部數(shù)據(jù)存儲器中,然后再對其進(jìn)行處理。對于高速數(shù)據(jù)采集而言,這種方式將嚴(yán)重影響采集速度,且存儲值也會受到很大限制。而改進(jìn)方案是將A/D轉(zhuǎn)換后的數(shù)據(jù)直接送至計算機(jī)內(nèi)存,這樣,采集速度將大大提高,而且可存儲大量數(shù)據(jù),以便于下一步的處理。

為了解決同步問題,可以由CPLD產(chǎn)生同步時鐘信號提供給ADC和FX2。在本數(shù)據(jù)采集系統(tǒng)的設(shè)計中,CPLD同時還可用于產(chǎn)生不同的控制信號,以便對采樣進(jìn)行實(shí)時控制。CPLD是復(fù)雜可編程邏輯器件,它包括可編程邏輯宏單元、可編程I/O單元和可編程內(nèi)部連線。由于CPLD的內(nèi)部資源豐富,因而可廣泛應(yīng)用在數(shù)據(jù)采集、自動控制、通訊等各個領(lǐng)域。在本系統(tǒng)的設(shè)計中,筆者選用的CPLD是Lattice公司的ispLSI1016。圖2所示是其整個USB接口卡的硬件電路圖。

3系統(tǒng)軟件設(shè)計

該系統(tǒng)軟件主要包括USB設(shè)備驅(qū)動程序、設(shè)備固件和應(yīng)用程序。

3.1設(shè)備固件(Firmware)設(shè)計

設(shè)備固件是設(shè)備運(yùn)行的核心,可采用匯編語言或C語言設(shè)計。其主要功能是控制CY7C68013接收并處理USB驅(qū)動程序的請求(如請求設(shè)備描述符、請求或設(shè)置設(shè)備狀態(tài),請求或設(shè)置設(shè)備接口等USB2.0標(biāo)準(zhǔn)請求)、控制芯片CY7C68013接收應(yīng)用程序的控制指令、控制A/D模塊的數(shù)據(jù)采集、通過CY7C68013緩存數(shù)據(jù)并實(shí)時上傳至PC等。

即使外部邏輯或內(nèi)置的普通可編程接口(GPIF)在沒有CPU的任何干涉下能夠通過四個大的端點(diǎn)FIFO來處理高速寬帶數(shù)據(jù),固件還是有如下固定的工作:

配置端點(diǎn);

通過控制端點(diǎn)零來響應(yīng)主機(jī)請求;

控制和監(jiān)測GPIF的活動;

利用USART處理所有的特殊請求任務(wù),如計時器、中斷、I/O引腳等。

3.2USB設(shè)備驅(qū)動程序開發(fā)

USB系統(tǒng)驅(qū)動程序采用分層結(jié)構(gòu)模型分別為較高級的USB設(shè)備驅(qū)動程序和較低級的USB函數(shù)層。其中USB函數(shù)層由兩部分組成:較高級的通用串行總線驅(qū)動程序模塊(USBD)和較低級的主控制器驅(qū)動程序模塊(HCD)。

在上述USB分層模塊中,USB函數(shù)層(USBD及HCD)由Windows提供,負(fù)責(zé)管理USB設(shè)備驅(qū)動程序和USB控制器之間的通信;加載及卸載USB驅(qū)動程序;與USB設(shè)備通用端點(diǎn)(endpoint)建立通信并執(zhí)行設(shè)備配置、數(shù)據(jù)與USB協(xié)議框架和打包格式的雙向轉(zhuǎn)換任務(wù)。目前Windows提供有多種USB設(shè)備驅(qū)動程序,但并不針對實(shí)時數(shù)據(jù)采集設(shè)備,因此需采用DDK開發(fā)工具來設(shè)計專用的USB設(shè)備驅(qū)動程序。該設(shè)備驅(qū)動程序應(yīng)由初始化模塊、即插即用管理模塊、電源管理模塊以及I/O功能等四個模塊來實(shí)現(xiàn)。

初始化模塊可提供一個DriverEntry入口點(diǎn)以執(zhí)行大量的初始化函數(shù)。

即插即用管理模塊用來實(shí)現(xiàn)USB設(shè)備的熱插拔及動態(tài)配置。當(dāng)硬件檢測到USB設(shè)備接入時,Windows查找相應(yīng)的驅(qū)動程序,并調(diào)用它的DriverEn-try例程,同時告訴它添加了一個設(shè)備;然后,驅(qū)動程序?yàn)閁SB設(shè)備建立一個FDO(功能設(shè)備對象)。在此處理過程中,驅(qū)動程序收到一個IRPMNSTARTDE-VICE的IRP,在它之中包括有設(shè)備的資源信息。至此,設(shè)備被正確配置,驅(qū)動程序開始與硬件進(jìn)行對話。當(dāng)然,在設(shè)備運(yùn)行過程中,如果設(shè)備狀態(tài)發(fā)生變化(拔除、暫停等),PnP管理器也同樣發(fā)出相應(yīng)的IRP,以便由驅(qū)動程序進(jìn)行相應(yīng)的處理。

電源管理模塊負(fù)責(zé)設(shè)備的掛起與喚醒。

I/O功能實(shí)現(xiàn)模塊可完成I/O請求的大部分工作。當(dāng)應(yīng)用程序提出I/O請求時,它將調(diào)用Win32API函數(shù)DeviceIoControl向設(shè)備發(fā)出命令,然后由I/O管理器構(gòu)造一個IRP并設(shè)置其MajorFunction.域?yàn)镮RPMJDEVICECONTROL。在USB設(shè)備驅(qū)動程序收到該IRP后它將取出其中的控制碼并利用一個開關(guān)語句查找對應(yīng)的程序入口。

3.3應(yīng)用程序設(shè)計

應(yīng)用程序設(shè)計由兩個部分組成:動態(tài)鏈接庫和應(yīng)用程序。動態(tài)鏈接庫負(fù)責(zé)與內(nèi)核態(tài)的USB功能驅(qū)動程序通信并接收應(yīng)用程序的各種操作請求,而應(yīng)用程序則負(fù)責(zé)對所采集的數(shù)據(jù)進(jìn)行實(shí)時顯示、分析和存盤。

動態(tài)鏈接庫的工作原理如下:當(dāng)它收到應(yīng)用程序開始采樣的請求后,首先創(chuàng)建兩個線程:采樣線程和顯示存盤線程。采樣線程負(fù)責(zé)將采樣數(shù)據(jù)寫到應(yīng)用程序提交的內(nèi)存;而顯示存盤線程則負(fù)責(zé)給應(yīng)用程序發(fā)送顯示和存盤消息。當(dāng)應(yīng)用程序接收到此消息后,便從它提交的內(nèi)存中讀取數(shù)據(jù)并顯示和存盤。要注意的是:采樣線程和顯示存盤線程在讀寫應(yīng)用程序提交內(nèi)存時要保持同步。

PC機(jī)或工控機(jī)應(yīng)用程序是數(shù)據(jù)實(shí)時采集系統(tǒng)的中心可采用Labview編程。它是當(dāng)今國際上唯一的編譯型圖形化編程語言,其特點(diǎn)如下:

(1)能完成對固體表面速度的實(shí)時測量;

(2)主介面與多重窗口結(jié)合可完成數(shù)據(jù)連續(xù)采集、實(shí)時統(tǒng)計分析、系統(tǒng)參數(shù)設(shè)置、信號波形顯示、被測參數(shù)輸出等綜合系統(tǒng)功能。

(3)能充分利用Labview開發(fā)平臺和WINDOWS視窗所提供的良好操作環(huán)境集曲線、圖形、數(shù)據(jù)于一體可準(zhǔn)確描述過程參數(shù)的變化。

圖3所示是用高速數(shù)據(jù)采集系統(tǒng)采集通過Lab-view顯示的一個波形實(shí)例,其輸入信號是一個頻率為5MHz的正弦波。

第7篇:數(shù)據(jù)分析論文范文

(一)統(tǒng)計調(diào)查對象虛報、瞞報、少報,當(dāng)前以少報、瞞報為主。今年4月份,我局對24家工業(yè)企業(yè)上報數(shù)據(jù)進(jìn)行了質(zhì)量檢查,發(fā)現(xiàn)少報產(chǎn)值的企業(yè)就有7家,少報產(chǎn)值2221萬元,戶均少報產(chǎn)值317萬元;而同期多報產(chǎn)值的企業(yè)只有3家,多報產(chǎn)值295萬元,戶均多報產(chǎn)值98萬元。剔除企業(yè)多報產(chǎn)值,加上企業(yè)少報產(chǎn)值,企業(yè)共少報產(chǎn)值1926萬元,占24家企業(yè)原上報產(chǎn)值28.1%,戶均少報產(chǎn)值80萬元。

(二)政府統(tǒng)計調(diào)查尤其是縣、鎮(zhèn)兩級政府統(tǒng)計力量不足,存在漏統(tǒng)現(xiàn)象

(三)統(tǒng)計部門地位不高,抗干擾整體能力不強(qiáng)

(四)統(tǒng)計過程中缺乏統(tǒng)一質(zhì)量監(jiān)控標(biāo)準(zhǔn)和依據(jù),反映在基層填報人員更換頻繁,臺帳、原始記錄不全,歷史資料混亂,原生性和再生性差錯層出不窮

(五)數(shù)出多門情況時有發(fā)生,也是造成數(shù)據(jù)質(zhì)量不實(shí)的原因之一。如在2002年我市抽查的19個鎮(zhèn)中,發(fā)現(xiàn)有9個鎮(zhèn)的2002年政府工作報告(或黨委工作報告)使用的統(tǒng)計數(shù)據(jù)與統(tǒng)計年報數(shù)據(jù)不一致,鎮(zhèn)政府工作報告(或黨委工作報告)所使用的統(tǒng)計數(shù)據(jù)普遍高于統(tǒng)計年報數(shù)據(jù),占被檢鎮(zhèn)的47.4%。

二、原因

統(tǒng)計數(shù)據(jù)質(zhì)量存在問題的原因是復(fù)雜和多方面的。既有內(nèi)在原因,又有外在原因:

(一)內(nèi)在原因

1、現(xiàn)行統(tǒng)計管理體制滯后?,F(xiàn)行我國統(tǒng)計管理體制實(shí)行的是“統(tǒng)一領(lǐng)導(dǎo)、分級負(fù)責(zé)”的辦法,統(tǒng)計部門作為地方政府的一個職能部門、人員、編制、經(jīng)費(fèi)以及任免都由地方政府決定,而地方領(lǐng)導(dǎo)干部的升降,在一定程度上系于體現(xiàn)在政績的統(tǒng)計數(shù)字上;地方統(tǒng)計部門領(lǐng)導(dǎo)的升降完全由地方?jīng)Q定,這樣的統(tǒng)計體制,客觀上強(qiáng)化了行政對統(tǒng)計數(shù)字的干預(yù),統(tǒng)計部門和統(tǒng)計人員難以獨(dú)立地行使統(tǒng)計監(jiān)督的職權(quán)。

2、統(tǒng)計調(diào)查方法制度改革滯后。改革開放以來,統(tǒng)計為適應(yīng)形勢的發(fā)展,統(tǒng)計方法制度進(jìn)行了一系列的改革。如恢復(fù)和建立農(nóng)產(chǎn)量抽樣調(diào)查和農(nóng)村住戶收支調(diào)查;推行了城市居民住戶收支調(diào)查;先后開展了社會商品零售價格指數(shù)、居民消費(fèi)價格指數(shù)、生產(chǎn)價格指數(shù);用SNA體系取代了MPS體系等等。但遺憾的是:改革統(tǒng)計生產(chǎn)關(guān)系,解決統(tǒng)計生產(chǎn)力的過程中,統(tǒng)計無論是體制還是方法制度基本沒有實(shí)質(zhì)性進(jìn)展,僅限于修修補(bǔ)補(bǔ)。

3、報表指標(biāo)種類繁多,調(diào)查項(xiàng)目之間重復(fù)?,F(xiàn)在的統(tǒng)計報表和指標(biāo)不說多如牛毛恐怕也離不遠(yuǎn)了。從長期統(tǒng)計工作實(shí)踐特別是近年來的實(shí)際統(tǒng)計工作中,不知是因?yàn)檫m應(yīng)形勢所累,還是在這經(jīng)濟(jì)轉(zhuǎn)軌時期本身就是不可逾越的障礙,確實(shí)使人感到統(tǒng)計改革有違原來的初衷。原來國家統(tǒng)計改革一直講的都是要精簡報表、精簡指標(biāo),理順工作關(guān)系,盡量減少或避免數(shù)出多門,最終目的是要減輕基層負(fù)擔(dān)、提高統(tǒng)計數(shù)字質(zhì)量。然而現(xiàn)在同一指標(biāo)在統(tǒng)計局內(nèi)部重復(fù)布置,你抄我的、我抄你的、互相核對打架的現(xiàn)象始終沒有能夠得到有效的解決,從而造成許多重復(fù)勞動和資源浪費(fèi)。與時同時,政府綜合統(tǒng)計制度與部門統(tǒng)計制度調(diào)查項(xiàng)目內(nèi)容之間重復(fù)。如:農(nóng)業(yè)耕地面積、農(nóng)業(yè)機(jī)械化情況、畜牧業(yè)生產(chǎn)情況、種植業(yè)產(chǎn)品產(chǎn)量、企業(yè)集團(tuán)統(tǒng)計、建筑統(tǒng)計、批發(fā)零售貿(mào)易統(tǒng)計、房地產(chǎn)統(tǒng)計、固定資產(chǎn)投資統(tǒng)計、鄉(xiāng)鎮(zhèn)企業(yè)統(tǒng)計等。就部門統(tǒng)計之間而言,同一指標(biāo)多個部門調(diào)查的現(xiàn)象時有發(fā)生。如糧食產(chǎn)量指標(biāo),農(nóng)業(yè)局、糧食局、統(tǒng)計局都調(diào)查;投資指標(biāo),改革與發(fā)展局、經(jīng)貿(mào)局、統(tǒng)計局、建設(shè)局都調(diào)查;出生人口指標(biāo),公安部門、計生局、統(tǒng)計局都搞。就政府綜合統(tǒng)計部門內(nèi)部各專業(yè)制度而言,重復(fù)統(tǒng)計內(nèi)容有:農(nóng)村鄉(xiāng)卡調(diào)查,綜合鄉(xiāng)卡調(diào)查數(shù)字抄農(nóng)村鄉(xiāng)卡數(shù)等。另外,由于各項(xiàng)制度組織主體不同,造成不同統(tǒng)計制度需要時對一調(diào)復(fù)布置,也形成了部分統(tǒng)計內(nèi)容重復(fù)調(diào)查現(xiàn)象。

(二)外在原因

1、《統(tǒng)計法》作用有限。《統(tǒng)計法》的頒布實(shí)施,對統(tǒng)計違法現(xiàn)象的認(rèn)定和處罰都有明確的規(guī)定,對凈化統(tǒng)計環(huán)境起到了積極作用。但是,由于基層統(tǒng)計力量的薄弱和統(tǒng)計數(shù)字與政績的關(guān)系,統(tǒng)計法的作用受到極大限制,近些年縣級政府綜合統(tǒng)計部門進(jìn)行的統(tǒng)計執(zhí)法大檢查“雷聲大、雨點(diǎn)小”,不足以震懾統(tǒng)計違法者。

2、統(tǒng)計部門人力、經(jīng)費(fèi)、物資投入不足制約統(tǒng)計數(shù)字質(zhì)量的提高。雖然統(tǒng)計部門與過去比現(xiàn)在統(tǒng)計力量、經(jīng)費(fèi)投入得到了一些加強(qiáng),但是與當(dāng)前統(tǒng)計任務(wù)比還不適應(yīng)。特別是在縣鎮(zhèn)兩級的統(tǒng)計工作中這個問題特別嚴(yán)重。比如,鎮(zhèn)級只有一名兼職統(tǒng)計人員,一方面要完成鎮(zhèn)中心工作,另一面又要應(yīng)付統(tǒng)計的調(diào)查任務(wù),“頂上千條線,底下一根針”,不管上邊有多好的想法和做法都得基層去完成,基層是統(tǒng)計數(shù)字的源頭。目前,我市各縣統(tǒng)計局工作人員一般只有15—20人,在統(tǒng)計工作量不斷增加情況下,縣級統(tǒng)計部門完成現(xiàn)行18個專業(yè)報表任務(wù)己窮于應(yīng)付。人力、物力、經(jīng)費(fèi)不足,是嚴(yán)重影響統(tǒng)計數(shù)字質(zhì)量的一個很重要的因素。

3、客觀環(huán)境的變化,對統(tǒng)計數(shù)字質(zhì)量產(chǎn)生了很大影響。從客觀外界條件看,一方面統(tǒng)計調(diào)查環(huán)境迅速的變化確實(shí)給統(tǒng)計工作帶來許多困難。統(tǒng)計數(shù)“正規(guī)”來源渠道越來越窄,在企業(yè)改制中許多國有、集體企業(yè),通過股份制、拍賣、兼并重組,原有的統(tǒng)計機(jī)構(gòu)和人員變化或撤消,獲取資料的正常渠道不存在了。由于市場經(jīng)濟(jì)的運(yùn)行,調(diào)查量劇增,與當(dāng)前統(tǒng)計管理體制和統(tǒng)計方法制度不適應(yīng)。另一方面,全社會對統(tǒng)計信息需要的數(shù)量、質(zhì)量都提出更新更高的要求,社會需要的“缺口”很大,有一些數(shù)字根本沒有。不需要的,要上一大堆,都在躺著睡大覺。所以統(tǒng)計方法制度要進(jìn)行重大調(diào)整改革。

4、被調(diào)查者合作程度降低,影響了統(tǒng)計數(shù)字質(zhì)量。經(jīng)濟(jì)改革的深入,使得統(tǒng)計調(diào)查對象越來越復(fù)雜。原來主要調(diào)查對象都是組織、有管理的單位,現(xiàn)在是面對千家萬戶全社會。在市場經(jīng)濟(jì)條件下,形成利益多元集團(tuán),由于利益的驅(qū)使,使得各種各樣的被調(diào)查對象總是千方百計地保守自己的“秘密”,出現(xiàn)瞞報、少報統(tǒng)計數(shù)字的現(xiàn)象十分嚴(yán)重。

5、基層統(tǒng)計人員積極性無法調(diào)動性。

三、建議

要有效提高統(tǒng)計數(shù)據(jù)質(zhì)量,必須從影響質(zhì)量的根本著手,提高質(zhì)量才能持久。

(一)改革現(xiàn)行的統(tǒng)計管理體制。最好能實(shí)行垂直領(lǐng)導(dǎo),使政府統(tǒng)計部門地位更加超脫。若近期未能實(shí)行垂直管理,則要從5個方面加強(qiáng)統(tǒng)計活動的獨(dú)立性:

一是抓住國家啟動修改統(tǒng)計法的有利時機(jī),通過立法進(jìn)一步確定和加強(qiáng)現(xiàn)行的國家、省、地、縣四級統(tǒng)計調(diào)查體系進(jìn)行統(tǒng)計活動的超脫性、獨(dú)立性地位。

二是進(jìn)一步加強(qiáng)鎮(zhèn)級統(tǒng)計工作,將鎮(zhèn)級統(tǒng)計真正納入政府統(tǒng)計工作序列,使鎮(zhèn)級統(tǒng)計工作實(shí)體化。

三是現(xiàn)行“下管一級”的思路要向整個統(tǒng)計調(diào)查體系的深度和廣度拓展。在可能的情況下,編制、人員、經(jīng)費(fèi)等都可以下管一級。

四是鎮(zhèn)一級統(tǒng)計業(yè)務(wù)全部由鎮(zhèn)一級獨(dú)立完成,縣級統(tǒng)計部門只對其進(jìn)行業(yè)務(wù)指導(dǎo)和監(jiān)督,通過各種手段,把好鎮(zhèn)級統(tǒng)計數(shù)據(jù)關(guān)。

五是加強(qiáng)對全社會的統(tǒng)計管理職能,各級政府統(tǒng)計部門應(yīng)加速業(yè)務(wù)職能為主向管理執(zhí)法職能為主的轉(zhuǎn)變過程,將自己從繁重的業(yè)務(wù)中解脫出來。政府統(tǒng)計部門只干綜合的統(tǒng)計業(yè)務(wù)。如國民經(jīng)濟(jì)核算、基本單位名錄庫,全國性的普查等,能讓部門搞的就讓部門去搞,能讓民間統(tǒng)計調(diào)查機(jī)構(gòu)搞的就讓他們?nèi)ジ?,對這些統(tǒng)計工作,政府統(tǒng)計部門主要抓管理,抓數(shù)據(jù)的評估與監(jiān)督。

(二)明確政府統(tǒng)計職能。當(dāng)前,統(tǒng)計職能有不斷被擴(kuò)大的趨勢,其結(jié)果是報表增多、指標(biāo)增設(shè)、調(diào)查頻率增快,造成基層窮于應(yīng)付,也難以應(yīng)付,最終是馬虎應(yīng)付,質(zhì)量下降,走入惡性循環(huán)。對此,應(yīng)重新界定政府統(tǒng)計職能,我們認(rèn)為政府統(tǒng)計職能就是為國家宏觀調(diào)控經(jīng)濟(jì)、社會服務(wù),其它能減少職能都應(yīng)減少,非此職能工作能不參與的最好不參與。

(三)建議組織部門改革干部考核制度,完善干部管理體制。統(tǒng)計實(shí)踐告訴我們,現(xiàn)行干部考核制度和干部管理體制也是導(dǎo)致和助長統(tǒng)計數(shù)字造假的重要源頭。因此,應(yīng)建議組織部門進(jìn)一步改革干部考核制度,完善干部管理體制,按科學(xué)發(fā)展觀要求對各級干部的進(jìn)行全面考核、評價。

(四)改革現(xiàn)行統(tǒng)計方法制度。統(tǒng)計制度方法與統(tǒng)計數(shù)據(jù)質(zhì)量密不可分,當(dāng)前制度方法應(yīng)著重從三個方面進(jìn)行改革:首先必須明確政府統(tǒng)計應(yīng)收集那些資料,這是統(tǒng)計方法制度改革重點(diǎn);其次建立一套符合我國國情的國民經(jīng)濟(jì)核算體系及適應(yīng)科學(xué)發(fā)展觀要求的統(tǒng)計指標(biāo)體系,并且保證經(jīng)確定的統(tǒng)計指標(biāo)體系的全國統(tǒng)一和相對穩(wěn)定,對指標(biāo)的含義、統(tǒng)計口徑、計算方法都必須做出說明和界定范圍,同一指標(biāo)不能有兩種口徑和隨意變更。第三是研究建立從我國實(shí)際出發(fā)的科學(xué)適用的統(tǒng)計調(diào)查方法體系,適當(dāng)減少全面統(tǒng)計報表,推廣抽樣調(diào)查。

(五)加強(qiáng)統(tǒng)計執(zhí)法力度。要通過不斷統(tǒng)計執(zhí)法,讓全社會都能認(rèn)識、了解統(tǒng)計工作,正確認(rèn)識統(tǒng)計工作,支持和配合統(tǒng)計工作,正確認(rèn)識和使用統(tǒng)計統(tǒng)計數(shù)據(jù)。一是要建立專門的統(tǒng)計執(zhí)法隊(duì)伍,國家成立執(zhí)法總隊(duì),各省設(shè)立執(zhí)法支隊(duì),地、縣建立執(zhí)法分隊(duì)。并開展全國或全省一盤棋的統(tǒng)計執(zhí)法。

二是要建立人民法院對統(tǒng)計行政處罰予以強(qiáng)制執(zhí)行的制度,把統(tǒng)計執(zhí)法活動與人民法院的強(qiáng)制執(zhí)行制度相銜接,與其他執(zhí)法部門聯(lián)合辦案,形成合力,發(fā)揮行政執(zhí)法的整體效能。

三是要加強(qiáng)統(tǒng)計執(zhí)法檢查的力度與頻度,使統(tǒng)計執(zhí)法檢查工作日?;?、規(guī)范化,要建立違法統(tǒng)計案件的舉報制度。

(六)對統(tǒng)計工作全過程實(shí)行全面質(zhì)量管理。第一對每項(xiàng)統(tǒng)計調(diào)查要制定數(shù)據(jù)質(zhì)量評價標(biāo)準(zhǔn),應(yīng)把現(xiàn)有數(shù)據(jù)質(zhì)量的評估標(biāo)準(zhǔn)從準(zhǔn)確性擴(kuò)大到準(zhǔn)確性、及時性、適用性三維的質(zhì)量標(biāo)準(zhǔn)。第二健全和完善數(shù)據(jù)質(zhì)量管理體系。建立必要的組織機(jī)構(gòu)或相對獨(dú)立的統(tǒng)計數(shù)字質(zhì)量監(jiān)督評價機(jī)構(gòu)。美國、英國、加拿大等國家的統(tǒng)計機(jī)構(gòu)十分重視統(tǒng)計數(shù)字質(zhì)量評價管理,都建立了專門的統(tǒng)計數(shù)字質(zhì)量監(jiān)督管理機(jī)構(gòu),來評價政府的統(tǒng)計數(shù)字。這一方面值得我們借鑒學(xué)習(xí)。第三采用多種形式開展質(zhì)量管理,如定期開展數(shù)據(jù)質(zhì)量情況調(diào)查和分析、邀請統(tǒng)計機(jī)構(gòu)外部專家來評價等。

(七)加大對縣及縣以下統(tǒng)計部門的經(jīng)費(fèi)、人力投入?,F(xiàn)在基層統(tǒng)計力量、經(jīng)費(fèi)不足的問題、矛盾十分突出,縣及縣以下統(tǒng)計部門是統(tǒng)計數(shù)字質(zhì)量的源頭,數(shù)字源頭不能保證,又怎能保證全過程的統(tǒng)計數(shù)字質(zhì)量呢?因此,加大對基層經(jīng)費(fèi)、人力和計算機(jī)投入也是保證統(tǒng)計數(shù)字質(zhì)量很重要措施。

第8篇:數(shù)據(jù)分析論文范文

【關(guān)鍵詞】關(guān)聯(lián)數(shù)據(jù);定量分析;語義網(wǎng)

Abstract:The paper focused on Linked Data which has been published by 1990- 2010 in China for the analysis of data,then used quantitative analysis method to carry on the statistical analysis,analyzed the situation of Linked Data from time distribution,author distribution,periodicals distribution,Scientific research fund distribution and the subject distribution.At the same time,this paper summarized the shortcoming and development trend of Linked Data research.

Key words:Linked Data;quantitative analysis;Semantic Web

關(guān)聯(lián)數(shù)據(jù)的概念為WWW(World Wide Web)的發(fā)明者,被譽(yù)為互聯(lián)網(wǎng)之父的Tim Berners-Lee于2006年在《關(guān)聯(lián)數(shù)據(jù)筆記》中首次提出,在該文中他分析了Web的發(fā)展與演變,提出了發(fā)展數(shù)據(jù)網(wǎng)絡(luò)的思想,而數(shù)據(jù)網(wǎng)絡(luò)的核心和關(guān)鍵則是關(guān)聯(lián)數(shù)據(jù)。2009 年在TED大會上,他提出關(guān)聯(lián)數(shù)據(jù)就是一箱箱數(shù)據(jù),當(dāng)通過開放標(biāo)準(zhǔn)關(guān)聯(lián)在一起時,從中可以萌發(fā)出很多新事物和新應(yīng)用[1]。

關(guān)聯(lián)數(shù)據(jù)簡單的說就是一些RDF格式的數(shù)據(jù),也是用三元組(主體,謂詞,客體)來表示資源。所以研究關(guān)聯(lián)數(shù)據(jù),知道數(shù)據(jù)的RDF(Resource Description Framework)格式是必不可少的。關(guān)聯(lián)數(shù)據(jù)和RDF數(shù)據(jù)最主要的區(qū)別在于關(guān)聯(lián)數(shù)據(jù)是要到網(wǎng)上,并供人搜索的,所以描述資源的三元組的不再是統(tǒng)一資源標(biāo)志符(URI),而是URI和.

[2]白海燕.基于關(guān)聯(lián)數(shù)據(jù)技術(shù)的信息組織深度序化研究[2010-09-26]..

[3]Boutin G.Tying Web 3.0,the semantic Web and linked data together[2010-09-26].http:///archives/understanding_the_new_web_era_web_30_linked_data_s.php.

[4]趙華等.UG在我國的研究、應(yīng)用現(xiàn)狀及進(jìn)展[J].現(xiàn)代情報,2008(10):137-141.

[5]黃永文.關(guān)聯(lián)數(shù)據(jù)在圖書館中的應(yīng)用研究綜述[J].現(xiàn)代圖書情報技術(shù),2010,05:1-7.

[6]吳玥,李占羽.基于關(guān)聯(lián)數(shù)據(jù)開放政府?dāng)?shù)據(jù)[J].電腦知識與技術(shù),2010,31:8688-8691.

[7]趙梓彤,謝海先.關(guān)聯(lián)數(shù)據(jù)在網(wǎng)絡(luò)信息管理中的應(yīng)用[J].圖書館學(xué)研究,2011,12:47-50.

[8]張寧.基于關(guān)聯(lián)數(shù)據(jù)的農(nóng)業(yè)信息空間數(shù)據(jù)組織研究[J].農(nóng)機(jī)化研究,2012,04:249-252.

[9]洪娜,錢慶,方安,范煒,李亞子,王軍輝.生物醫(yī)學(xué)關(guān)聯(lián)數(shù)據(jù)研究進(jìn)展與比較分析[J].圖書情報工作,2012,06:123-129.

[10]劉煒.關(guān)聯(lián)數(shù)據(jù):概念、技術(shù)及應(yīng)用展望[J].大學(xué)圖書館學(xué)報,2011,02:5-12.

[11]D2R Server-Publishing Relational Databases on the Semantic Web[EB/OL][2010-12-28].http://www4.Wiwiss.fu-berlin.de/bizer/d2r-server/.

[12]:Overview[EB/OL].[2010-09-12].http:///.

[13]Open Link Software[EB/OL][2010-09-11].http://.

[14]Coetzee P,Heath T,Motta E.SparqPlug:Generating linked data from legacy Html,Sparql and the DOM.[2010-09-26].http:///ldow2008/papers/05-coetzee-heath-sparqplug.pdf.

[15]Cygan關(guān)聯(lián)數(shù)據(jù)k B.Pubby-a linked data frontend for Sparql endpoints.2010-09-26].http://www4.wiwiss.fu-berlin.de/pubby/.

[16]Talis platform.[2010-09-26].http:///platform/.

[17]沈志宏,張曉林.關(guān)聯(lián)數(shù)據(jù)及其應(yīng)用現(xiàn)狀綜述[J].現(xiàn)代圖書情報技術(shù),2010,11:1-9.

[18]徐華.關(guān)聯(lián)數(shù)據(jù)在國外圖書館中的應(yīng)用及其借鑒意義[J].圖書館學(xué)研究,2011,16:87-89.

[19]紐約時報以關(guān)聯(lián)數(shù)據(jù)形式新聞目錄[J].中國傳媒科技,2009,06:11.

第9篇:數(shù)據(jù)分析論文范文

論文摘要介紹了在陽臺利用花盆栽培韭菜的技術(shù),包括品種選擇、栽培器皿和營養(yǎng)土的選擇、播種育苗、日常管理以及采收等方面內(nèi)容。

近年來盆栽蔬菜發(fā)展迅速,利用花盆在陽臺種植蔬菜,既可點(diǎn)綴居室,又可綠化環(huán)境、美化生活,具有觀賞、食用、綠化環(huán)境等多種功能,受到人們的喜愛,市場前景十分誘人。

韭菜是我國人民傳統(tǒng)的食用蔬菜,它除含有豐富的蛋白質(zhì)、維生素、礦物鹽等人體所需的各種營養(yǎng)外,還是大家公認(rèn)的高纖維素含量蔬菜,由于纖維素對人體特殊的醫(yī)療保健作用,韭菜被稱為第七大營養(yǎng)蔬菜。盆栽韭菜既起到綠化觀賞價值,又可作為蔬菜食用,是一種無公害食品,深受市民喜愛。韭菜利用花盆栽培,技術(shù)簡單,不受地區(qū)和季節(jié)的限制,生長快、病蟲害較少,一年四季都可以種植,并且可以連續(xù)采收,適合家庭陽臺栽培。盆栽韭菜栽培關(guān)鍵是要配好營養(yǎng)土,掌握好種植技術(shù)?,F(xiàn)將韭菜利用花盆陽臺栽培技術(shù)介紹如下。

1品種選擇

韭菜的各個品種均可進(jìn)行盆栽,但最好選用生長力強(qiáng)的品種,如791韭菜、韭寶F1、平韭五號等。

2栽培器皿選擇

栽培韭菜的器皿選瓦盆、陶瓷盆、塑料盆均可,但以外觀好看、質(zhì)地輕、透水、透氣好的花盆為宜。室內(nèi)陽臺種植時應(yīng)在花盆下放1個底碟,防止?jié)菜畷r滲出影響陽臺衛(wèi)生?;ㄅ璧男螤顖A形、方型均可,圓形花盆的直徑在25cm以上,高度25~30cm,底部要有滲孔。

3營養(yǎng)土的選擇

花盆栽培韭菜因容器容積有限,韭菜根系生長受到限制,因此盆里所用的栽培土必須含有充足的肥力,才能維持韭菜連續(xù)生長與連續(xù)采收的需要。一般采用的培養(yǎng)土的配比是腐熟的樹葉3份、腐熟的畜禽糞、骨粉2份、優(yōu)質(zhì)農(nóng)田土5份,或用5份腐熟的農(nóng)家肥、3份園土和砂土2份配成盆土。入盆時盆底孔用1~2片碎瓦片蓋上,裝少許粗砂,上面裝營養(yǎng)土至盆邊2~3cm。

4播種育苗

陽臺種植韭菜,春夏秋3季均可播種,也可采用韭根直接定植。播種育苗最好用頭年新種,4月中旬至5月上旬進(jìn)行播種育苗。種前先將花盆澆足底水,水滲下后播種,蓋1cm厚營養(yǎng)土,始終保持盆土表面呈濕潤狀態(tài)而不板結(jié),出苗后根據(jù)盆土情況適當(dāng)澆水。如用韭根定植,以春季定植為好,由于空間有限,盆內(nèi)韭菜定植密度不可過大,定植后及時澆水,促進(jìn)幼苗或韭根成活。

5日常管理

5.1澆水施肥

當(dāng)新葉發(fā)出后根據(jù)盆土干濕情況及時澆緩苗水,并對盆土進(jìn)行中耕保墑。經(jīng)常保持土壤濕潤。入秋后天氣日漸涼爽,適宜韭菜旺盛生長,此時要充分供應(yīng)肥水,一般4~5d澆1次水,并追肥3~4次。追肥把芝麻餅、豆餅等碎塊放入密封的容器充分發(fā)酵,取其腐熟的上層液體,加入15~20倍清水施入,促進(jìn)葉片生長,為鱗莖的膨大和根系的生長打下良好的基礎(chǔ)。以后氣溫繼續(xù)降低,植株生長緩慢,此時應(yīng)適當(dāng)減少澆水,保持盆土不干即可。

5.2溫度

夏季若韭菜長時間生長在35℃的高溫條件下,再遇上空氣干燥,就會造成葉尖干枯。因此,此時可將花盆移到北陽臺或室內(nèi)陰涼處,隔一斷時間適當(dāng)移到太陽光照曬的地方接受光照。冬季外界溫度較底,若想在此期間吃上韭菜,可將帶盆移到密封的陽臺內(nèi)。

5.3中耕培土

早春返青后將根莖部位的土壤剔開,數(shù)天后再復(fù)原,以提高地溫,消滅種蠅,促進(jìn)根系生長,淘汰細(xì)弱分蘗。結(jié)合剔根,每年春季可以蓋2~3cm營養(yǎng)土,以利于鞘伸長和軟化。

5.4換土

由于花盆是一個相對封閉的空間,長時間栽培容易造成養(yǎng)分及部分微量元素缺乏。因此應(yīng)每2~3年換盆土1次,換土宜在冬季休眠期進(jìn)行,韭根最長使用期限為6~7年。

5.5病蟲害防治

盆栽韭菜病蟲害較少,若盆土未充分腐熟,則易產(chǎn)生根蛆危害;若發(fā)現(xiàn)根蛆幼蟲可用90%敵百蟲600倍液或敵敵畏800倍液灌根觸殺。

6采收

定植當(dāng)年根據(jù)生長情況,長勢強(qiáng)時可適當(dāng)采收,長勢弱時一般不采收,著重養(yǎng)根。盆栽韭菜采收不可過于頻繁,一般1年可采收5~6次,每次相隔25~30d,且夏季不宜采收。澆水、噴藥后不宜立即收割,以免水珠滴入傷口和農(nóng)藥殘留過多。收割時留茬高度必須適當(dāng),過淺影響產(chǎn)量和品質(zhì),過深易影響根莖,影響下次采收和整個植株長勢,以剛割到鱗莖上3~4cm黃色葉鞘處為宜。割后應(yīng)及時進(jìn)行澆水、追肥,促進(jìn)根系和地上部葉片生長。