av色综合网,成年片色大黄全免费网站久久,免费大片黄在线观看,japanese乱熟另类,国产成人午夜高潮毛片

公務(wù)員期刊網(wǎng) 精選范文 社交媒體文本分析范文

社交媒體文本分析精選(九篇)

前言:一篇好文章的誕生,需要你不斷地搜集資料、整理思路,本站小編為你收集了豐富的社交媒體文本分析主題范文,僅供參考,歡迎閱讀并收藏。

社交媒體文本分析

第1篇:社交媒體文本分析范文

挖掘社交媒體的商務(wù)價(jià)值

3月11日日本發(fā)生9.0級(jí)大地震以后,很多人通過(guò)微博及時(shí)得到親人、朋友安全的消息,也有很多人通過(guò)微博了解到震區(qū)的實(shí)時(shí)情況。社交媒體在此次地震中更加彰顯了其巨大的威力。國(guó)外Facebook、Twitter等社交媒體深受歡迎,國(guó)內(nèi)人人網(wǎng)、開(kāi)心網(wǎng)、新浪微博等社交媒體也被廣泛應(yīng)用。

在過(guò)去,社交媒體更多地被作為個(gè)人娛樂(lè)、休閑,以及獲取感興趣的信息的一個(gè)途徑。在商業(yè)領(lǐng)域,社交媒體也越來(lái)越被企業(yè)用來(lái)進(jìn)行市場(chǎng)營(yíng)銷(xiāo)等工作。比如說(shuō),新產(chǎn)品推出早期,可以借助社交媒體得到產(chǎn)品特性的優(yōu)劣評(píng)價(jià),以及需要進(jìn)行哪些改進(jìn)。再比如說(shuō),可以在社交媒體的關(guān)系網(wǎng)絡(luò)里找到關(guān)鍵節(jié)點(diǎn)的關(guān)鍵人物,從而有針對(duì)性地對(duì)產(chǎn)品進(jìn)行有效推廣。充分挖掘社交媒體中的信息,成為輔助企業(yè)進(jìn)行正確決策的有效工具。

但是在過(guò)去,社交網(wǎng)絡(luò)中的這些非結(jié)構(gòu)化的數(shù)據(jù)很難被整理和挖掘。隨著社交媒體信息的商務(wù)價(jià)值的不斷提升,BI廠商開(kāi)始考慮通過(guò)有效手段挖掘這些信息。

SAP中國(guó)區(qū)首席技術(shù)官?gòu)垈b在接受記者采訪時(shí)指出,BusinessObjects 4.0中的深層文本分析能整合人們?cè)谏缃幻襟w流、博客和電子郵件中所表達(dá)的想法和觀點(diǎn),并輔助企業(yè)做出更加正確的商業(yè)決策。這樣,人們不僅可以準(zhǔn)確地監(jiān)控、分析、搜索、報(bào)告和處理他們的交易數(shù)據(jù),而且還可以充分地了解博客、電子郵件和社交媒體流等非結(jié)構(gòu)化內(nèi)容中所表達(dá)的趨勢(shì)和觀點(diǎn)。這種新的多源、多維語(yǔ)義層及共同編程體驗(yàn),簡(jiǎn)化了即時(shí)分析和內(nèi)容創(chuàng)建過(guò)程,能以更快的速度向用戶提供更全面的建議。

關(guān)注三大特性

BusinessObjects 4.0是BusinessObjects產(chǎn)品近三年以來(lái)最重要的一次更新。SAP于2008年收購(gòu)了BusinessObjects公司后,以最快的速度將其產(chǎn)品轉(zhuǎn)化為自身的商業(yè)智能軟件平臺(tái)。

在此次的產(chǎn)品中,SAP將整合了BI和EIM(企業(yè)信息管理)的解決方案稱為商業(yè)分析軟件,并指出實(shí)時(shí)、移動(dòng)和社交是商務(wù)分析軟件的發(fā)展趨勢(shì):基于內(nèi)存計(jì)算,實(shí)現(xiàn)實(shí)時(shí)商務(wù)分析;用戶手中瞬間擁有強(qiáng)大的商業(yè)智能能力,并且能夠得到比以往任何時(shí)候都多的移動(dòng)終端的支持;借助準(zhǔn)確的企業(yè)和社交數(shù)據(jù),結(jié)合結(jié)構(gòu)化和非結(jié)構(gòu)化信息,提供信息管理工具。

在實(shí)時(shí)方面,BusinessObjects 4.0借助SAP內(nèi)存計(jì)算工具(SAP HANA)的優(yōu)化應(yīng)用使客戶能夠借助內(nèi)存計(jì)算功能處理大數(shù)據(jù)量,從而使實(shí)時(shí)商務(wù)成為可能。內(nèi)存設(shè)備以閃電般的速度處理海量數(shù)據(jù)催生了一種新分析模式――這種分析可以立即將大規(guī)模、復(fù)雜的數(shù)據(jù)轉(zhuǎn)換成更加明智的商業(yè)決策。

第2篇:社交媒體文本分析范文

【摘 要】“周一見(jiàn)”娛樂(lè)事件以其喧鬧的微博文本成功吸引了線上、線下媒體以及千百萬(wàn)網(wǎng)民的熱烈關(guān)注和討論,制造了一個(gè)由微博首發(fā)的全民消費(fèi)現(xiàn)象,成為中國(guó)娛樂(lè)事件通過(guò)微博文本傳播消費(fèi)產(chǎn)生聚集討論和強(qiáng)大影響力的典范。本文通過(guò)對(duì)“周一見(jiàn)”事件微博文本元文本的互文性的研究,力求解答為何以微博首發(fā)的“周一見(jiàn)”會(huì)產(chǎn)生如此喧鬧的微博文本。

關(guān)鍵詞 微博文本 文本消費(fèi) 互文性

微博自誕生以來(lái)一直扮演著媒介事件升溫爐與加速器的角色,不論是近期火爆的“鋒菲戀”等娛樂(lè)新聞,還是早在4月份轟動(dòng)一時(shí)的“周一見(jiàn)”事件都是微博傳播的典范。而作為引路石的“周一見(jiàn)”事件的微博傳播雖然事件已經(jīng)淡出了公眾視線,但由于明星的私生活報(bào)道產(chǎn)生微博轉(zhuǎn)發(fā)破百萬(wàn)、登上傳統(tǒng)媒體頭版頭條,網(wǎng)民集體議論、網(wǎng)絡(luò)造句大批出現(xiàn)、國(guó)外媒體投入關(guān)注等現(xiàn)象在國(guó)內(nèi)還是首次,也是微博擔(dān)任娛樂(lè)事件文本傳播的典范,其事件本身的消費(fèi)特點(diǎn)與傳播,對(duì)后來(lái)娛樂(lè)事件及社會(huì)熱點(diǎn)事件傳播的意義與影響是不可忽視的。本文通過(guò)互文性的文本分析研究,解釋產(chǎn)生于微博時(shí)代的“周一見(jiàn)”事件媒介文本的生產(chǎn)意圖與消費(fèi)意義。

一、微博文本的交互呈現(xiàn)

一方面,微博等自媒體提供的平臺(tái)使得言論相對(duì)自由,轉(zhuǎn)發(fā)、評(píng)論等功能更是文本快速傳播的引擎,網(wǎng)絡(luò)刮起造句風(fēng)潮,“咎由自取體”、“伊琍體”一時(shí)成為熱門(mén)句式。從馬伊琍回復(fù)文章致歉聲明的微博來(lái)看,“戀愛(ài)雖易,婚姻不易,且行且珍惜”被網(wǎng)友大量仿造,“畢業(yè)雖易,求職不易,且行且珍惜”、“駕駛雖易,安全不易,且開(kāi)且珍惜”、“網(wǎng)站雖易,賺錢(qián)不易,且行且珍惜”等等造句既是在句式和意境上參照了馬伊琍微博原文,又是網(wǎng)友們結(jié)合求職難、駕駛事故多發(fā)、網(wǎng)站盈利機(jī)制不成熟等社會(huì)現(xiàn)實(shí),對(duì)原信息進(jìn)行的解碼又重新編碼的過(guò)程,互文性的文本生產(chǎn)方式貫穿始終。

另一方面,由于微博的加入,其實(shí)時(shí)性、開(kāi)放性與交互性使得整個(gè)“周一見(jiàn)”事件文本的生產(chǎn)與消費(fèi)方式越來(lái)越高明,每一個(gè)媒介文本的出現(xiàn)都恰如其分,整個(gè)事件的媒介文本邏輯嚴(yán)密,文本的交互性呈現(xiàn)無(wú)處不在。這兩個(gè)方面的傳播現(xiàn)象共同的介質(zhì)就是媒介文本,并且在微博的推波助瀾下,媒介文本的“互文性”生產(chǎn)愈加靈活多樣。

網(wǎng)絡(luò)造句的熱度反映著受眾對(duì)事件和文本的消費(fèi)熱情,這種熱情也在推動(dòng)著媒介文本連續(xù)劇式的呈現(xiàn)。從謝曉的“微博預(yù)告”開(kāi)始,小道消息滿天飛,網(wǎng)友猜測(cè),真實(shí)圖文報(bào)道,到文章的供認(rèn)不諱和致歉聲明,馬伊琍的微博回應(yīng),文本的呈現(xiàn)至此將事件引入一個(gè)高峰。輿論的壓力讓文章微博繼續(xù)發(fā)聲“我賤命一條,陪你們到底!”直接叫板《南都娛樂(lè)》,讓網(wǎng)友們聯(lián)想是否是《南都娛樂(lè)》報(bào)私仇,《南都娛樂(lè)》官微回應(yīng)否認(rèn)“報(bào)私仇”傳聞,隨即署名為“馬伊琍爸爸”的微博號(hào)發(fā)文質(zhì)問(wèn)《南都娛樂(lè)》,希望還家庭安靜,事情發(fā)展接近尾聲,喧鬧的文本現(xiàn)象也逐漸平息。但我們從主要媒介文本的呈現(xiàn)經(jīng)過(guò)可以看出,每一次媒介文本的生產(chǎn)及呈現(xiàn)都恰如其分,有嚴(yán)密的邏輯性和故事發(fā)展情節(jié)。事情的發(fā)展以《南都娛樂(lè)》發(fā)起,并于每次與當(dāng)事人交鋒引起輿論,文章的反應(yīng)和其岳父的發(fā)文以及網(wǎng)友一邊倒的譴責(zé)文章同時(shí)也暗示著《南都娛樂(lè)》的傳播目的成功實(shí)現(xiàn)。

二、互文性文本的兩個(gè)維度

互文性不僅體現(xiàn)在文本交互性呈現(xiàn)的表現(xiàn)形式上,通過(guò)互文性的文本呈現(xiàn)也深刻揭示著整個(gè)事件中媒介文本生產(chǎn)與消費(fèi)的意義。著名媒介文化研究學(xué)者約翰·菲斯克在《電視文化》中從水平和垂直兩個(gè)維度分析電視文本的互文性,筆者借用菲斯克分析電視互文性的兩個(gè)維度的研究思路,并結(jié)合互文性的廣義(解構(gòu)主義)視角——發(fā)生性互文與接受性互文分析“周一見(jiàn)”事件涉及的媒介文本的互文性生產(chǎn),將文本按水平維度分為事件當(dāng)事人文章、馬伊琍的言論;按垂直維度,將事件當(dāng)事人文章、馬伊琍的文本分為一級(jí)文本,將媒體報(bào)道、網(wǎng)友評(píng)論分為二級(jí)文本(見(jiàn)下表)。

發(fā)生性互文和接受性互文是分別從文本的生產(chǎn)和接受兩個(gè)角度對(duì)媒介文本進(jìn)行剖析的。而在利用互文性視角解析文本生產(chǎn)時(shí),接受與生產(chǎn)是必不可少的兩個(gè)過(guò)程?!爸芤灰?jiàn)”事件的二級(jí)文本基本是對(duì)一級(jí)文本的回應(yīng),是在對(duì)一級(jí)文本接受、解構(gòu)的前提下并結(jié)合歷史文本生產(chǎn)的結(jié)果。而一級(jí)文本的生產(chǎn)過(guò)程也是基于對(duì)先時(shí)文本的接受、解構(gòu)進(jìn)而產(chǎn)生的回應(yīng)與結(jié)合。正如大量網(wǎng)友指出的文章的致歉聲明有抄襲高曉松之前酒駕致歉聲明之嫌,說(shuō)明文章的微博致歉聲明或多或少是對(duì)高曉松版致歉聲明有某種程度上的接受,而又因事件性質(zhì)的不同和身份的不同,存在具體內(nèi)容的差異,因而最終產(chǎn)生的文本是一個(gè)對(duì)先時(shí)文本的接受、解構(gòu)與再生產(chǎn)的過(guò)程。又如“伊琍挺住”、“伊琍不哭”等網(wǎng)友評(píng)論,首先是對(duì)一級(jí)文本文章致歉聲明的抗拒性解讀與對(duì)馬伊琍“且行且珍惜”微博的接受性解讀;其次,“挺住”“不哭”等句式初在2008年汶川地震時(shí)便已出現(xiàn),成為一種流行的固定的網(wǎng)絡(luò)文體,用以表示對(duì)汶川的支持,后來(lái)在玉樹(shù)地震、雅安地震中也大量出現(xiàn)。網(wǎng)友將這個(gè)文體用在這里,顯然是借對(duì)這個(gè)歷史文本的互文性生產(chǎn)表達(dá)對(duì)馬伊琍的同情與支持。因此,在互文性的文本分析視角下,不論是一級(jí)文本還是二級(jí)文本,都是在對(duì)先前文本的接受或解構(gòu)的前提下,或結(jié)合歷史文本,或結(jié)合現(xiàn)實(shí)環(huán)境生產(chǎn)的結(jié)果。

而這些文本生產(chǎn)與消費(fèi)對(duì)于事件的內(nèi)涵意義的生產(chǎn)方面,也從水平和垂直維度的文本中得到體現(xiàn)。從水平維度來(lái)看,媒介文本是由事件的當(dāng)事人文章所發(fā),代表了當(dāng)事人的傳播意圖和立場(chǎng)。文章的致歉聲明與之后的微博因互文性相互關(guān)照,后文是對(duì)前文意義的強(qiáng)調(diào)。文章所發(fā)微博雖然言辭粗魯,但是很急切的表達(dá)了他不希望事情繼續(xù)發(fā)展,希望媒體息事寧人。但當(dāng)事者生產(chǎn)文本的本意卻并沒(méi)能夠得到受眾的完全解讀。因?yàn)閺拇怪本S度來(lái)看,媒體的報(bào)道和網(wǎng)友的評(píng)論呈現(xiàn)愈演愈烈的態(tài)勢(shì),并且輿論的導(dǎo)向也偏離文章減輕形象傷害的意圖。在此事件中,二級(jí)文本的生產(chǎn)者站在一級(jí)文本生產(chǎn)者的對(duì)立面,例如謝曉接受騰訊訪談稱“馬伊琍給我發(fā)了一條感謝短信”,更加印證事件的真實(shí)性和文章出軌男的形象,以及《南都娛樂(lè)》所發(fā)表的言論始終堅(jiān)持一個(gè)態(tài)度和立場(chǎng),引導(dǎo)受眾按自己的傳播意圖去解讀這些文本。在這場(chǎng)對(duì)立文本生產(chǎn)與消費(fèi)過(guò)程中,網(wǎng)民受眾是一群基礎(chǔ)性的存在,他們的評(píng)論和立場(chǎng)推動(dòng)著一級(jí)文本和二級(jí)文本的生產(chǎn),他們的評(píng)論即構(gòu)成了對(duì)所有媒介文本的消費(fèi)。

三、微博文本生產(chǎn)與消費(fèi)的背后

“周一見(jiàn)”事件的發(fā)生、發(fā)展過(guò)程的報(bào)道表面上是一個(gè)新舊媒體爭(zhēng)相爆料、共同發(fā)聲、合理推進(jìn)的過(guò)程。實(shí)際上,在新興媒體和移動(dòng)互聯(lián)網(wǎng)的沖擊下,傳統(tǒng)媒體面臨激烈的競(jìng)爭(zhēng)壓力,該事件某種程度上可以看做《南都娛樂(lè)》為提高自身公信力和影響力而制造的一次對(duì)自身傳統(tǒng)報(bào)業(yè)品牌的營(yíng)銷(xiāo)活動(dòng)。

微博具有傳播速度快、流傳廣的特點(diǎn),同時(shí)它也是一個(gè)負(fù)面消息散布極快的平臺(tái)?!赌隙紛蕵?lè)》最先選擇微博發(fā)聲是刻意為之,意在利用微博的傳播特點(diǎn)和強(qiáng)大用戶群體,使話題迅速擴(kuò)散,產(chǎn)生社會(huì)影響。從對(duì)文本的分析以及事件的發(fā)展可以看出,《南都娛樂(lè)》一直掌控著報(bào)道的導(dǎo)向和受眾的導(dǎo)向,比如最先的微博預(yù)告中“我也理解當(dāng)事人此時(shí)的焦灼,但請(qǐng)相信此報(bào)道絕無(wú)任何陰謀論,記者也拒絕了巨大的利益誘惑”表明信源的真實(shí)公正客觀,樹(shù)立傳統(tǒng)媒體的權(quán)威性。不論是“周一見(jiàn)”熱詞的火爆、網(wǎng)民的全體參與,還是文章的回應(yīng)“我賤命一條,陪你們到底!”都在印證著《南都娛樂(lè)》的借勢(shì)營(yíng)銷(xiāo)、傳播意圖取得成功。

通過(guò)對(duì)“周一見(jiàn)”事件的微博文本分析說(shuō)明,一個(gè)熱點(diǎn)娛樂(lè)事件或熱點(diǎn)社會(huì)事件的產(chǎn)生和發(fā)展、其文本的生產(chǎn)與消費(fèi)既有宏觀層面受眾、媒體和技術(shù)發(fā)展的因素,也有微觀層面文本生產(chǎn)的方式的影響,文本的互文性生產(chǎn)與呈現(xiàn)、文本生產(chǎn)者的立場(chǎng)與文本傳播的意圖都對(duì)整個(gè)事件的文本的產(chǎn)生與消費(fèi)起著重要作用,特別是在新媒體技術(shù)的支持下,對(duì)社交軟件的精心駕馭能夠一定程度上促進(jìn)事件的傳播。

參考文獻(xiàn)

①胡曉云、陸琪男,《“故宮星巴克”事件中的媒介文本研究》[J].《廣告大觀》,2007(5)

②約翰·菲斯克:《電視文化》[M].商務(wù)印書(shū)館,2005

③鮑海波,《喧鬧的文本——媒介文化文本視閾中的“李剛門(mén)”事件》[J].《山西大學(xué)學(xué)報(bào)》,2011(2)

④張穎,《網(wǎng)絡(luò)新聞話語(yǔ)建構(gòu)的互文性分析》[D].中央民族大學(xué),2012

第3篇:社交媒體文本分析范文

關(guān)鍵詞:預(yù)測(cè)分析 大數(shù)據(jù)處理 大數(shù)據(jù)應(yīng)用 數(shù)據(jù)挖掘

中圖分類(lèi)號(hào):TP393 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1672-3791(2017)06(c)-0053-03

隨著云計(jì)算、大數(shù)據(jù)、物聯(lián)網(wǎng)和移動(dòng)互聯(lián)網(wǎng)等新一代信息技術(shù)的發(fā)展,傳統(tǒng)企業(yè)級(jí)IT架構(gòu)正在朝基于互聯(lián)網(wǎng)的分布式新架構(gòu)轉(zhuǎn)型。大數(shù)據(jù)作為新一代信息技術(shù)的核心,正在使各個(gè)領(lǐng)域變得越來(lái)越可感知,并走向智能化。大數(shù)據(jù)將會(huì)發(fā)揮自身獨(dú)特的優(yōu)勢(shì),帶給我們更多的方便和便捷。大數(shù)據(jù)分析的方法理論有哪些、在行業(yè)、企業(yè)的活動(dòng)中有哪些應(yīng)用。

1 大數(shù)據(jù)分析的五個(gè)基本要素

1.1 大數(shù)據(jù)預(yù)測(cè)性分析

大數(shù)據(jù)技術(shù)的主要應(yīng)用是預(yù)測(cè)性分析,如在線教學(xué)資源網(wǎng)站通過(guò)數(shù)據(jù)分析用戶會(huì)對(duì)推薦的教學(xué)模是否感興趣,保險(xiǎn)公司通過(guò)數(shù)據(jù)預(yù)測(cè)被保險(xiǎn)人是否會(huì)違規(guī),地震監(jiān)測(cè)部門(mén)通過(guò)對(duì)大數(shù)據(jù)的分析,預(yù)測(cè)某地點(diǎn)發(fā)生地震的大致時(shí)間,氣象部門(mén)利用數(shù)據(jù)預(yù)測(cè)天氣變化等。預(yù)測(cè)是人類(lèi)本能的一部分,通過(guò)大數(shù)據(jù)預(yù)測(cè)人類(lèi)才可以獲得有意義的、智能的信息。許許多多的行業(yè)應(yīng)用都會(huì)涉及到大數(shù)據(jù),大數(shù)據(jù)的豐富特征表述了快速增長(zhǎng)的存儲(chǔ)數(shù)據(jù)的復(fù)雜性。大數(shù)據(jù)預(yù)測(cè)分析打破了數(shù)據(jù)預(yù)測(cè)一直是象牙塔里數(shù)據(jù)科學(xué)家和統(tǒng)計(jì)學(xué)家的工作,伴隨著大數(shù)據(jù)的出現(xiàn),并融合到現(xiàn)有的MIS、MRPII、DSS 、CIMS和其他核心業(yè)務(wù)系統(tǒng),大數(shù)據(jù)預(yù)測(cè)分析將起到越來(lái)越重要的作用。

1.2 數(shù)據(jù)管理和數(shù)據(jù)質(zhì)量

大數(shù)據(jù)分析跟數(shù)據(jù)質(zhì)量和數(shù)據(jù)管理緊密相關(guān),而質(zhì)量高的數(shù)據(jù)和有效的數(shù)據(jù)管理可以使分析結(jié)果有價(jià)值、真實(shí)并得到有力的保證。

1.3 可視化分析

普通用戶和大數(shù)據(jù)分析專家是大數(shù)據(jù)分析的直接使用者,因此他們對(duì)大數(shù)據(jù)分析的基本要求就是要可視化,因?yàn)樗麄兿胪ㄟ^(guò)可視化分析獲得可觀的大數(shù)據(jù)特征,讓用戶直觀看到結(jié)果。

提高解釋信息的能力可以通過(guò)數(shù)據(jù)的可視化展示來(lái)實(shí)現(xiàn),而可視化展示主要由圖形和圖表來(lái)呈現(xiàn)。要從大量的數(shù)據(jù)和信息中找尋相關(guān)性非常的不容易,而圖形或圖表能夠在短時(shí)間內(nèi)展示數(shù)據(jù)之間的相關(guān)信息,并為用戶提供所需的信息。

1.4 語(yǔ)義引擎

語(yǔ)義引擎是把現(xiàn)有的數(shù)據(jù)標(biāo)注語(yǔ)義,其實(shí)可以把它理解為結(jié)構(gòu)化或者非結(jié)構(gòu)化的數(shù)據(jù)集上的一個(gè)語(yǔ)義疊迭層。它是數(shù)據(jù)分析及語(yǔ)義技術(shù)最直接的應(yīng)用,好的語(yǔ)義引擎能夠使大數(shù)據(jù)分析用戶快而準(zhǔn)地獲得比較全面的數(shù)據(jù)。

數(shù)據(jù)分析的新挑戰(zhàn)及困難主要表現(xiàn)在非結(jié)構(gòu)化數(shù)據(jù)與異構(gòu)數(shù)據(jù)等的多樣性,必須配合大量的工具去分析、解析、提取數(shù)據(jù)。語(yǔ)義引擎的設(shè)計(jì)可以達(dá)到能夠從文檔中自動(dòng)提取有用信息,使語(yǔ)義引擎能挖掘出大數(shù)據(jù)的特征,在此基礎(chǔ)上科學(xué)建模和輸入新的數(shù)據(jù),來(lái)預(yù)測(cè)未來(lái)的可用數(shù)據(jù)。

1.5 數(shù)據(jù)挖掘算法

大數(shù)據(jù)分析的理論核心就是數(shù)據(jù)挖掘。各種數(shù)據(jù)的算法基于不同的數(shù)據(jù)類(lèi)型和格式,能更加科學(xué)地呈現(xiàn)出數(shù)據(jù)本身的特點(diǎn),能更快速地處理大數(shù)據(jù)。如果采用一個(gè)算法需要花好幾年才能得出結(jié)論,那大數(shù)據(jù)價(jià)值也就無(wú)從f起了??梢暬墙o人看的,數(shù)據(jù)挖掘是給機(jī)器看的。集群、分割、孤立點(diǎn)分析還有其他的算法可以使我們深入挖掘數(shù)據(jù)內(nèi)部的價(jià)值,并且這些算法能夠處理大數(shù)據(jù)的數(shù)據(jù)量,也可以滿足處理大數(shù)據(jù)的效率要求。

2 大數(shù)據(jù)處理方法

大數(shù)據(jù)處理技術(shù)在社會(huì)的發(fā)展中占有重要的地位,現(xiàn)在有很多的研究者對(duì)大數(shù)據(jù)處理技術(shù)進(jìn)行研究,將大數(shù)據(jù)處理技術(shù)與交互設(shè)計(jì)結(jié)合,讓交叉科學(xué)得到發(fā)展,計(jì)算機(jī)技術(shù)的進(jìn)步,讓交叉技術(shù)被廣泛應(yīng)用,并引起了很多人的重視,例如:計(jì)算機(jī)技術(shù)可以在藝術(shù)中被應(yīng)用,進(jìn)行色彩搭配,還可以將計(jì)算機(jī)技術(shù)應(yīng)用到垃圾分類(lèi)里,這些都是研究人員對(duì)計(jì)算機(jī)和交叉設(shè)計(jì)的結(jié)合。這種結(jié)合讓設(shè)計(jì)學(xué)與計(jì)算機(jī)技術(shù)緊急的結(jié)合在一起,將傳統(tǒng)的調(diào)研方式和測(cè)試方式應(yīng)用到交叉科學(xué)領(lǐng)域,這種方法的研究可以為用戶調(diào)研和測(cè)試方法提供依據(jù),能夠減少人工的成本。大數(shù)據(jù)處理方法其實(shí)有很多,筆者根據(jù)長(zhǎng)時(shí)間的實(shí)踐,總結(jié)了幾種基本的大數(shù)據(jù)處理方法,如非結(jié)構(gòu)數(shù)據(jù)處理法、自然語(yǔ)言處理法等,該文主要介紹非結(jié)構(gòu)數(shù)據(jù)處理流程涉及到的主要方法和技術(shù)。非結(jié)構(gòu)化數(shù)據(jù)處理流程主要以網(wǎng)頁(yè)處理為例來(lái)闡述,包括3個(gè)階段,分別是信息采集、網(wǎng)頁(yè)預(yù)處理和網(wǎng)頁(yè)分類(lèi)。

2.1 信息采集

信息采集主要是根據(jù)相關(guān)主題由固定的專業(yè)人士來(lái)完成,其采集的數(shù)據(jù)只能用于所針對(duì)的主題和相關(guān)的模塊,出于對(duì)效率和成本的考慮完全不必對(duì)整個(gè)互聯(lián)網(wǎng)進(jìn)行遍歷,因此,模塊信息采集時(shí)往往需要研究以哪種方式預(yù)測(cè)鏈接指向的頁(yè)面與主題的關(guān)聯(lián)性,并測(cè)算其是否值得訪問(wèn);然后研究以哪種相關(guān)策略訪問(wèn)Web,以在采集到主題相關(guān)頁(yè)面的同時(shí),盡可能地減少采集到主題無(wú)關(guān)的頁(yè)面。

預(yù)先設(shè)定好種子鏈接是信息采集的基本方法,充分使用HTTP協(xié)議下載被訪問(wèn)的頁(yè)面,運(yùn)用分析算法對(duì)頁(yè)面與主題的相關(guān)性進(jìn)行分析,然后確定待訪問(wèn)的相關(guān)鏈接,預(yù)測(cè)可能指向主題相關(guān)頁(yè)面的鏈接,最后循環(huán)迭代地運(yùn)用不同的相關(guān)策略訪問(wèn)網(wǎng)頁(yè)。

2.2 網(wǎng)頁(yè)預(yù)處理

網(wǎng)頁(yè)預(yù)處理最主要涉及到網(wǎng)頁(yè)去重處理,網(wǎng)頁(yè)去重可以歸為兩類(lèi):一類(lèi)是基于URL的對(duì)比去重,它適用哈希算法;另一類(lèi)是基于內(nèi)容的對(duì)比去重,它適用基于信息指紋的文本相似度算法。

網(wǎng)頁(yè)去重是先抽取文檔對(duì)象的特征,再對(duì)文檔內(nèi)容進(jìn)行分解,將文檔的特征集合表示出來(lái),然后有目的針對(duì)特征集合的壓縮編碼,通過(guò)將哈希編碼等文本轉(zhuǎn)為數(shù)字串映射方式,為后續(xù)的特征存儲(chǔ)以及特征比較提供方便,這樣可以起到減少存儲(chǔ)空間,提高比較速度的作用,最后就是計(jì)算文檔的相似度,此步需要根據(jù)文檔特征重復(fù)比例來(lái)確定文檔內(nèi)容是否重復(fù)。一般是提取網(wǎng)頁(yè)的某一個(gè)信息特征,通常是一組關(guān)鍵詞,或者是關(guān)鍵詞加權(quán)重的組合,調(diào)用相應(yīng)的算法,轉(zhuǎn)換為一組關(guān)鍵代碼,也被稱為指紋,若兩個(gè)頁(yè)面有大數(shù)量的相似指紋,那么可以預(yù)測(cè)這兩個(gè)頁(yè)面內(nèi)容具有很高的重復(fù)性。

2.3 網(wǎng)頁(yè)分類(lèi)

網(wǎng)絡(luò)時(shí)代,人類(lèi)所面臨的一個(gè)非常重要且具有普遍意義的問(wèn)題就是網(wǎng)頁(yè)分類(lèi)。將網(wǎng)絡(luò)信息正確分類(lèi),方便人們更好地使用網(wǎng)絡(luò)資源,使雜亂無(wú)章的網(wǎng)絡(luò)環(huán)境變得有條理。而網(wǎng)頁(yè)分類(lèi)一般是先對(duì)網(wǎng)頁(yè)中的文本素材進(jìn)行分類(lèi),通常采用文本分類(lèi)來(lái)完成。文本分類(lèi)主要應(yīng)用于電子郵件分類(lèi)、信息過(guò)濾、文獻(xiàn)翻譯、數(shù)據(jù)檢索等任務(wù),文本分類(lèi)的一個(gè)關(guān)鍵問(wèn)題是特征詞的選擇問(wèn)題及其權(quán)重分配。

在搜索引擎中,文本分類(lèi)主要有以下用途:相關(guān)性排序會(huì)根據(jù)不同的網(wǎng)頁(yè)類(lèi)型做相應(yīng)的排序規(guī)則;根據(jù)網(wǎng)頁(yè)是索引頁(yè)面還是信息頁(yè)面,下載調(diào)度時(shí)會(huì)做不同的調(diào)度策略;在做頁(yè)面信息抽取的時(shí)候,會(huì)根據(jù)頁(yè)面分類(lèi)的結(jié)果做不同的抽取策略;在做檢索意圖識(shí)別的時(shí)候,會(huì)根據(jù)用戶所點(diǎn)擊的URL所屬的類(lèi)別來(lái)推斷檢索串的類(lèi)別等。

網(wǎng)頁(yè)分類(lèi)方法有SVM分方法和樸素貝葉斯方法,其中比較推薦的是支持向量機(jī)分類(lèi)方法(SVM),該算法主要基于統(tǒng)計(jì)學(xué)理論及線性分類(lèi)器準(zhǔn)則之上,從線性可分入手,再擴(kuò)展到線性不可分的情況。甚至有時(shí)會(huì)擴(kuò)展到使用非線性函數(shù)中去,這種分類(lèi)器統(tǒng)稱為支持向量機(jī)。近年來(lái),支持向量機(jī)分類(lèi)方法越來(lái)越多的受到網(wǎng)頁(yè)分類(lèi)技術(shù)人員的青睞。

3 大數(shù)據(jù)分析在行業(yè)活動(dòng)中的應(yīng)用

非結(jié)構(gòu)數(shù)據(jù)處理和數(shù)據(jù)挖掘的應(yīng)用范圍較廣,它可能應(yīng)用于運(yùn)營(yíng)商、銀行、傳統(tǒng)企業(yè)和電商,挑選幾個(gè)具有代表性的案例與大家分享。

3.1 電信行業(yè)

某城市電信運(yùn)營(yíng)商的上網(wǎng)日志分析系統(tǒng),該系統(tǒng)通過(guò)收集用戶上網(wǎng)日志歷史記錄數(shù)據(jù),分析出每個(gè)用戶的偏好。首先該系統(tǒng)通過(guò)并行統(tǒng)計(jì)出每個(gè)人有效歷史上網(wǎng)日志URL;然后從日志URL中抓取網(wǎng)頁(yè)內(nèi)容,提取正文,并通過(guò)文本分類(lèi)算法計(jì)算分類(lèi);最后通過(guò)統(tǒng)計(jì)出每個(gè)用戶上網(wǎng)關(guān)注類(lèi)別總數(shù),分析出每個(gè)用戶的偏好。

3.2 地產(chǎn)行業(yè)

某房地產(chǎn)企業(yè)的社會(huì)化品牌實(shí)時(shí)營(yíng)銷(xiāo)系統(tǒng),該系統(tǒng)通過(guò)社交媒體數(shù)據(jù),進(jìn)行網(wǎng)絡(luò)口碑監(jiān)測(cè),負(fù)面情緒被及時(shí)地發(fā)現(xiàn)并制止;通過(guò)與客戶進(jìn)行互動(dòng),爭(zhēng)取客戶忠誠(chéng)度;通過(guò)監(jiān)控同行及競(jìng)爭(zhēng)對(duì)手的各方面資訊,量化評(píng)估競(jìng)爭(zhēng)態(tài)勢(shì);快速提升品牌知曉度和美譽(yù)度,將媒體影響力轉(zhuǎn)換為客戶量,縮短人氣聚集周期。

3.3 證券行業(yè)

某證券商戰(zhàn)略信息監(jiān)測(cè)通過(guò)歷史回顧與信息摘要,提供題目、摘要、原文URL,今日輿情焦點(diǎn),今日輿論,展示抓取的所有期貨產(chǎn)品相關(guān)信息的縮略,并提供全文鏈接。通過(guò)熱點(diǎn)事件列表可以看到歷史相似事件對(duì)趨勢(shì)的影響,通過(guò)天氣指數(shù)與趨勢(shì)對(duì)應(yīng)曲線可以看到歷史相似天氣與歷史趨勢(shì)的對(duì)照。

3.4 金融行業(yè)

某大型股份制商業(yè)銀行供應(yīng)商風(fēng)險(xiǎn)評(píng)估系統(tǒng),該系統(tǒng)通過(guò)抓取供應(yīng)商內(nèi)部數(shù)據(jù),如企業(yè)年報(bào)、公司變動(dòng)、領(lǐng)導(dǎo)情況、財(cái)務(wù)狀況等數(shù)據(jù),分析公司運(yùn)營(yíng)指數(shù);通過(guò)計(jì)算各供應(yīng)商社交數(shù)據(jù),對(duì)其社會(huì)影響力做評(píng)估;通過(guò)同行之間的數(shù)據(jù)分析對(duì)比,對(duì)供應(yīng)商進(jìn)行實(shí)力評(píng)估,這些數(shù)據(jù)指數(shù)可以有效協(xié)助商業(yè)銀行進(jìn)行供應(yīng)商風(fēng)險(xiǎn)評(píng)估。

4 結(jié)語(yǔ)

大數(shù)據(jù)處理數(shù)據(jù)的基本理念是用全體代替抽樣,用效率代替絕對(duì)精確,用相關(guān)代替因果。證券、微商、地產(chǎn)等行業(yè)每天都會(huì)產(chǎn)生巨大的數(shù)據(jù)量,大數(shù)據(jù)分析與處理已成為大數(shù)據(jù)技術(shù)的最重要的應(yīng)用,通過(guò)大數(shù)據(jù)技術(shù)從海量數(shù)據(jù)中提取、挖掘?qū)I(yè)務(wù)發(fā)展有價(jià)值的、潛在的信息,找出產(chǎn)品或服務(wù)未來(lái)發(fā)展趨勢(shì),為決策者提供有力依據(jù),有益于推動(dòng)企業(yè)內(nèi)部的科學(xué)化、信息化管理。

參考文獻(xiàn)

[1] 孟小峰,慈祥.大數(shù)據(jù)管理:概念、技術(shù)與挑戰(zhàn)[J].計(jì)算機(jī)研究與發(fā)展,2013,50(1):146-149.

[2] 國(guó)際電子商情2013年大數(shù)據(jù)應(yīng)用與趨勢(shì)調(diào)查[Z].

[3] 大數(shù)據(jù)時(shí)代來(lái)臨:國(guó)內(nèi)IT企業(yè)布局已然落后[EB/OL].新浪網(wǎng),2012-06-01.

[4] 大數(shù)據(jù)時(shí)代降臨[EB/OL].半月談網(wǎng),2012-09-22.

[5] 王惠.大數(shù)據(jù)時(shí)代下數(shù)據(jù)分析理念研究[J].中國(guó)市場(chǎng),2015(22):74.

第4篇:社交媒體文本分析范文

關(guān)鍵詞:文本挖掘 新聞 支持向量機(jī) 貝葉斯分類(lèi) 粗糙集 股票價(jià)格

注:2014年國(guó)家級(jí)創(chuàng)新基金項(xiàng)目(項(xiàng)目編號(hào)201410287046):基于文本挖掘技術(shù)的網(wǎng)絡(luò)新聞對(duì)中國(guó)股市影響的分析預(yù)測(cè)

隨著互聯(lián)網(wǎng)技術(shù)的不斷發(fā)展,互聯(lián)網(wǎng)新聞中包含了越來(lái)越多的財(cái)經(jīng)資訊。財(cái)經(jīng)網(wǎng)站已經(jīng)演變成投資者用來(lái)交換想法與新聞媒體傳播的主流載體,行業(yè)新聞與個(gè)股新聞在證券市場(chǎng)上對(duì)投資者的投資決策起到關(guān)鍵性作用。但是,投資者從海量的財(cái)經(jīng)新聞中分離出有效的信息仍然存在著較大困難。因此,提供一種科學(xué)有效的方法來(lái)幫助投資者判斷新聞的影響力是至關(guān)重要的。

目前,探索互聯(lián)網(wǎng)媒體與股市關(guān)系的傳統(tǒng)研究較少,大多數(shù)學(xué)者在有限理性假說(shuō)的基礎(chǔ)上,對(duì)投資者心理、投資行為、市場(chǎng)信息非對(duì)稱性、政府對(duì)新聞媒體的控制以及財(cái)經(jīng)新聞?wù)Z義分析等方面進(jìn)行研究,其研究結(jié)果偏理論性和概括性。而近幾年,隨著大數(shù)據(jù)的不斷成熟,數(shù)據(jù)挖掘技術(shù)在證券市場(chǎng)預(yù)測(cè)上的運(yùn)用也逐漸增加。

互聯(lián)網(wǎng)財(cái)經(jīng)新聞所蘊(yùn)含的數(shù)據(jù)是非結(jié)構(gòu)化的,所以將新聞量化成可視化的時(shí)間序列數(shù)據(jù)具有一定的挑戰(zhàn)性。國(guó)內(nèi)學(xué)者運(yùn)用文本分類(lèi)的基本方法對(duì)新聞標(biāo)題或者板塊個(gè)股的新聞進(jìn)行情感分類(lèi),構(gòu)建中文分詞詞典和情感詞典。分詞方面,羅海飛等在不斷改進(jìn)貝葉斯算法的基礎(chǔ)上進(jìn)一步提高文本分類(lèi)的正確率。西南財(cái)經(jīng)大學(xué)趙麗麗等主要應(yīng)用文本挖掘技術(shù)和多元線性回歸分析方法,結(jié)合股票主要技術(shù)主表就互聯(lián)網(wǎng)財(cái)經(jīng)新聞對(duì)股市影響進(jìn)行了實(shí)證分析與定量研究。國(guó)外機(jī)器學(xué)習(xí)領(lǐng)域的學(xué)者以互聯(lián)網(wǎng)社交媒體為主要研究對(duì)象,根據(jù)用戶表達(dá)的投資意愿來(lái)分析其與股價(jià)之間的聯(lián)系,運(yùn)用支持向量回歸模型、多核學(xué)習(xí)方法等建立股價(jià)預(yù)測(cè)模型。歷史研究表明,智能方法與傳統(tǒng)的CAPM和Fama四因素股價(jià)預(yù)測(cè)模型相比具有更高的準(zhǔn)確性。

本文將運(yùn)用數(shù)據(jù)挖掘技術(shù)分別預(yù)測(cè)個(gè)股新聞與行業(yè)新聞對(duì)股價(jià)的影響,建立智能方法模型,比較股價(jià)預(yù)測(cè)模型的準(zhǔn)確性,在國(guó)內(nèi)研究中具有創(chuàng)新意義。

一、方法

(一)系統(tǒng)概述

圖一闡述了我們預(yù)測(cè)系統(tǒng)的全面流程。首先,我們需要搜集數(shù)據(jù)。在這過(guò)程中,我們運(yùn)用文本挖掘技術(shù)抓爬財(cái)經(jīng)網(wǎng)站上的數(shù)據(jù),并建立相關(guān)股票新聞數(shù)據(jù)庫(kù)。其次,我們?cè)谶@些無(wú)結(jié)構(gòu)數(shù)據(jù)中分離出有用的信息。我們?nèi)コ鼿TML的標(biāo)簽,并且分離出有用的新聞特征,例如時(shí)間、新聞文本等,對(duì)新聞進(jìn)行文本情感分類(lèi),將無(wú)結(jié)構(gòu)數(shù)據(jù)量化。最后,我們的系統(tǒng)能夠通過(guò)運(yùn)用支持向量機(jī)(SVM)、貝葉斯算法、粗糙集模型對(duì)證券價(jià)值分別進(jìn)行預(yù)測(cè)。

(二)數(shù)據(jù)搜集

我們選擇證券行業(yè)為主要研究對(duì)象,在新浪財(cái)經(jīng)網(wǎng)站(http://.cn/stock/)上搜集了證券行業(yè)18家股票的個(gè)股新聞和行業(yè)新聞。本研究抓取了2012年12月至2014年9月期間的行業(yè)新聞5063條,個(gè)股新聞10309 條。其中,將2012年12月至2014年7月作為訓(xùn)練集時(shí)間段,選取2014年8月至9月作為預(yù)測(cè)集時(shí)間段,采用訓(xùn)練好的模型預(yù)測(cè)2014年8至9月期間每一則新聞報(bào)道對(duì)股票收益所產(chǎn)生的影響。本文以前一天15點(diǎn)到次日15點(diǎn)為T(mén)日,建立2012年12月4日至2014年9月26日期間的新聞文本資料庫(kù)。

(三)情感分類(lèi)

對(duì)于情感分類(lèi)引入評(píng)價(jià)理論,通過(guò)從文本中提取形容詞及修飾語(yǔ)構(gòu)成的短語(yǔ)作為特征,進(jìn)行語(yǔ)義傾向分析。本文將股票新聞的情感特征詞劃分為情感詞和行為詞兩類(lèi),并進(jìn)一步分為5個(gè)維度(正、負(fù)、程度、否定詞、不確定詞),利用ICTCLAS程序接口以及C++對(duì)所有新聞文本進(jìn)行了分詞,建立金融特征詞庫(kù)。

(四)文本結(jié)構(gòu)化處理

在處理數(shù)據(jù)的過(guò)程中,本文基于金融特征詞庫(kù),進(jìn)行特征選擇,利用向量空間模型(Vector Space Model,簡(jiǎn)稱VSM)將無(wú)結(jié)構(gòu)數(shù)據(jù)的新聞文本轉(zhuǎn)換成計(jì)算機(jī)可以處理的結(jié)構(gòu)化向量。通過(guò)TFIDF方法評(píng)估每個(gè)特征詞在整個(gè)文檔集中的重要程度。

(五)學(xué)習(xí)模型

1、SVM模型

SVM模型由Vapnik首先提出,主要思想是建立一個(gè)超平面作為決策曲面,使得正例和反例之間的隔離邊緣被最大化。本文選用的是SVM模型中的C-SVC的分類(lèi)器,其過(guò)程如下:

基于libsvm工具箱,本文選用多項(xiàng)式核函數(shù),以結(jié)構(gòu)化的文本向量及股票收益率為模型的輸入。其中,每日股票收益率采用的是新聞當(dāng)天數(shù)據(jù),周末新聞算為下周一數(shù)據(jù),對(duì)應(yīng)下周一股票收益率,以此類(lèi)推。同時(shí),將停牌股的股票收益與當(dāng)日新聞?dòng)枰匀コ?。在進(jìn)行預(yù)測(cè)時(shí),由于特征歸一化對(duì)預(yù)測(cè)結(jié)果有影響,本文考慮分別保留未歸一化和歸一化的兩類(lèi)預(yù)測(cè)數(shù)據(jù),模型分別用SVM1,SVM2表示。

2、樸素貝葉斯分類(lèi)

貝葉斯分類(lèi)原理是通過(guò)選取適當(dāng)?shù)哪P偷南闰?yàn)分布,利用貝葉斯公式計(jì)算出其后驗(yàn)概率。本文樸素貝葉斯分類(lèi)器所選擇的訓(xùn)練集和預(yù)測(cè)集與SVM的所選擇數(shù)據(jù)相同,模型用Bayes表示。

3、粗糙集預(yù)測(cè)

由于分類(lèi)器與新聞因素的差異對(duì)預(yù)測(cè)的數(shù)據(jù)都有影響,本文構(gòu)建了一種基于粗糙集的組合預(yù)測(cè)方法,進(jìn)而比較分類(lèi)數(shù)據(jù)預(yù)測(cè)的準(zhǔn)確性。

本文將SVM1,SVM2,Bayes三種模型求解的行業(yè)新聞與公司新聞的預(yù)測(cè)值作為條件屬性集C的元素,將預(yù)測(cè)真實(shí)值y視為決策屬性D{y}。論域?yàn)楦鞴绢A(yù)測(cè)集內(nèi)各日數(shù)據(jù)的集合,該論域中對(duì)象的屬性即為對(duì)應(yīng)日的屬性集C。考慮粗糙集理論中屬性集等價(jià)類(lèi)的概率分布[X;p]、[Y;p],引入信息論中信息熵,構(gòu)建如下公式:

<E:\123456\財(cái)經(jīng)界?學(xué)術(shù)版201513\6下-7.TIF>

經(jīng)過(guò)運(yùn)算:

<E:\123456\財(cái)經(jīng)界?學(xué)術(shù)版201513\6下-8.TIF>

得出C各元素重要性,即各公司不同預(yù)測(cè)方法,不同新聞因素的重要性。在此基礎(chǔ)上,加權(quán)不同的預(yù)測(cè)方法的預(yù)測(cè)值,可以得出新的預(yù)測(cè)值;加權(quán)不同方法對(duì)新聞因素的影響,可以得出兩新聞因素影響的重要性。

二、實(shí)驗(yàn)與結(jié)果

(一)組合預(yù)測(cè)與其他預(yù)測(cè)結(jié)果比較

本文分別研究了互聯(lián)網(wǎng)行業(yè)與個(gè)股新聞對(duì)證券行業(yè)股票影響強(qiáng)度,比較SVM、貝葉斯以及粗糙集三種模型的預(yù)測(cè)結(jié)果,得出結(jié)果如表1所示。

<E:\123456\財(cái)經(jīng)界?學(xué)術(shù)版201513\6下-5.TIF>表1組合預(yù)測(cè)與其他預(yù)測(cè)結(jié)果的比較

從表1中可以看出,基于粗糙集組合預(yù)測(cè)結(jié)果的準(zhǔn)確率總體而言相對(duì)于其他兩種方法較高。由于粗糙集組合預(yù)測(cè)需要在預(yù)測(cè)期間內(nèi)相同時(shí)間段內(nèi)同時(shí)存在行業(yè)與個(gè)股新聞,其可采用的新聞數(shù)據(jù)數(shù)量比其他兩種預(yù)測(cè)方法會(huì)有所減少,影響了結(jié)果。所以在綜合考慮行業(yè)與個(gè)股新聞時(shí),同時(shí)考慮公司新聞因素和行業(yè)因素準(zhǔn)確性并不見(jiàn)得會(huì)比單獨(dú)考慮高,反而會(huì)出現(xiàn)更低的準(zhǔn)確度,具體表現(xiàn)以中信、西南、招商、國(guó)金、光大、東吳為例。

但對(duì)于整個(gè)證券行業(yè)而言,粗糙集組合預(yù)測(cè)綜合了各個(gè)模型的優(yōu)缺點(diǎn)以及各新聞因素對(duì)各公司的影響程度大小,較大的提升了預(yù)測(cè)準(zhǔn)確率。

(二)公司新聞和行業(yè)新聞對(duì)各公司影響結(jié)果分析

<E:\123456\財(cái)經(jīng)界?學(xué)術(shù)版201513\6下-6.TIF>

表2 行業(yè)新聞與公司新聞?dòng)绊懸蛩乇容^

根據(jù)表2可以得知,公司新聞因素為股票價(jià)格的主導(dǎo)因素。當(dāng)我們?nèi)コA(yù)測(cè)率較低的個(gè)股后,這一現(xiàn)象表現(xiàn)的更為顯著,這是因?yàn)楣拘侣勚兴挠袃r(jià)值信息超過(guò)行業(yè)新聞中的有價(jià)值信息。

三、結(jié)束語(yǔ)

本文采用文本挖掘技術(shù)和向量空間模型,引入了機(jī)器學(xué)習(xí)方法,結(jié)合股票技術(shù)指標(biāo),就證券行業(yè)與個(gè)股新聞對(duì)股市的影響進(jìn)行了分析研究。在研究過(guò)程中,本文發(fā)現(xiàn),互聯(lián)網(wǎng)新聞對(duì)股票收益率存在一定的影響,并且個(gè)股新聞對(duì)股票收益率的影響高于行業(yè)新聞。互聯(lián)網(wǎng)新聞的樣本數(shù)量和質(zhì)量也會(huì)影響預(yù)測(cè)的準(zhǔn)確性,樣本新聞信息處理的越好,預(yù)測(cè)則更加精準(zhǔn)。

由于股票新聞存在不完整、不確定的特性,考慮到這個(gè)因素,本文在運(yùn)用SVM模型和貝葉斯分類(lèi)方法的基礎(chǔ)上,創(chuàng)新運(yùn)用粗糙集模型組合不同預(yù)測(cè)模型,得到了更加精確的預(yù)測(cè)結(jié)果。由此可以看出,運(yùn)用數(shù)據(jù)挖掘預(yù)測(cè)股票收益具有較大的前景。

然而,互聯(lián)網(wǎng)財(cái)經(jīng)新聞不是一直可信賴的,投資決策還應(yīng)該結(jié)合更多的技術(shù)指標(biāo)和信息來(lái)進(jìn)行分析。在未來(lái)的研究中,作者將進(jìn)一步結(jié)合影響股票價(jià)格收益率的更多因素綜合預(yù)測(cè)價(jià)格的波動(dòng)。

參考文獻(xiàn):

[1]鄒亞寶.媒體對(duì)有限理性投資者投資行為的影響研究[J].金融教育研究.2012.第25卷第5期

[2]譚華.不確定時(shí)態(tài)數(shù)據(jù)挖掘方法及其在證券行情預(yù)測(cè)中的應(yīng)用[D].長(zhǎng)沙:湖南大學(xué).2008

[3]高D,周莉,張勇,邢春曉,孫一鋼,朱先忠.面向股票新聞的情感分類(lèi)方法[J].軟件學(xué)報(bào).2010. Vol.21.P349-642

[4]陳華,梁循.互聯(lián)網(wǎng)股票新聞歸類(lèi)和板塊分析的方法[J].電腦開(kāi)發(fā)與應(yīng)用,2006,11:2-3+6.

[5]李丹.基于樸素貝葉斯方法的中文文本分類(lèi)研究[D].河北大學(xué),2011

[6]趙麗麗. 互聯(lián)網(wǎng)財(cái)經(jīng)新聞對(duì)股市影響的定量分析[D].成都:西南財(cái)經(jīng)大學(xué).2012:1-49

[7] Yang Yu,WenjingDuan,Qing Cao.The impact of social and conventional media on firm equity value: A sentiment analysis approach.Decision Support Systems 55 (2013) 919C926

第5篇:社交媒體文本分析范文

關(guān)鍵詞: 多模態(tài)語(yǔ)言 多元識(shí)讀能力 大學(xué)生

1.研究背景

隨著國(guó)際化進(jìn)程的加快,傳播媒介新技術(shù)的發(fā)展及普及,人與人之間的多模態(tài)交流日益頻繁。傳統(tǒng)以語(yǔ)言為主符號(hào)單一的傳統(tǒng)識(shí)讀能力在當(dāng)今社會(huì)已不夠用,因而由圖像、聲音、動(dòng)作和顏色等表達(dá)意義的符號(hào)元素,正在與語(yǔ)言符號(hào)一起形成構(gòu)建意義的多模態(tài)系統(tǒng),并給識(shí)讀教育帶來(lái)重大變革(胡壯麟,2007)。如今,多模態(tài)構(gòu)建成為主流表達(dá)形式,使得傳統(tǒng)與現(xiàn)代化教學(xué)相互補(bǔ)充與滲透,有利于更好地發(fā)揮教學(xué)的整體功能。在外部學(xué)習(xí)環(huán)境和媒介發(fā)生變化的同時(shí),多元識(shí)讀能力在一定程度上決定大學(xué)生獲取知識(shí)和資源的廣度和深度,因此,提高大學(xué)生的多元識(shí)讀能力是多模態(tài)輸入環(huán)境下應(yīng)運(yùn)而生的內(nèi)在需求。

關(guān)于多模態(tài)語(yǔ)言的輸入和多元識(shí)讀能力的培養(yǎng),目前已有許多學(xué)者作過(guò)相關(guān)研究和分析。Kress和van Leeuwen(2001)認(rèn)為,模態(tài)可以定義為參與交際的所有渠道和媒介,除了傳統(tǒng)的語(yǔ)言符號(hào)外,還包括圖像、顏色、音樂(lè)、技術(shù)等符號(hào)系統(tǒng)。各種符號(hào)資源(如有聲語(yǔ)言、形象、聲音、設(shè)計(jì)、動(dòng)作等)共同參與日常的人際交往活動(dòng),形成多模態(tài)交流。張德祿(2009)指出,在現(xiàn)代技術(shù)條件下,在多模態(tài)話語(yǔ)交際的框架下,對(duì)模態(tài)的選擇可以為外語(yǔ)教學(xué)提供盡可能的便利條件和輔助條件,提高教學(xué)效率,還可以為多模態(tài)話語(yǔ)交際提供多通道話語(yǔ)意義的表達(dá)方式。胡壯麟教授(2007)認(rèn)為多元識(shí)讀能力既包含文化識(shí)讀又包含技術(shù)識(shí)讀,也就是說(shuō)這種能力不僅包括傳統(tǒng)的讀寫(xiě)識(shí)讀能力,還包括文化、視覺(jué)、聽(tīng)覺(jué)、空間、姿態(tài)及現(xiàn)代信息網(wǎng)絡(luò)時(shí)代的技術(shù)識(shí)讀和信息識(shí)讀等多種識(shí)讀能力。顧曰國(guó)(2007)分析了利用多模態(tài)進(jìn)行教學(xué)的重要性。此外,研究者還相繼探索了多元識(shí)讀的教學(xué)實(shí)踐(葛俊麗、羅曉燕,2010;張義君,2011)。

然而,在前人的研究范疇里,面向?qū)W習(xí)主體開(kāi)展的實(shí)證類(lèi)研究為數(shù)不多。本研究試圖回答以下四個(gè)問(wèn)題:(1)大學(xué)教學(xué)中多模態(tài)語(yǔ)言的輸入現(xiàn)狀?(2)大學(xué)生進(jìn)行多元識(shí)讀的具體學(xué)習(xí)表現(xiàn)?(3)大學(xué)生多元識(shí)讀能力提高的具體表現(xiàn)?(4)多模態(tài)語(yǔ)言輸入和識(shí)讀能力提高之間存在的問(wèn)題?

2.調(diào)查對(duì)象與方法

2.1問(wèn)卷調(diào)查對(duì)象

本實(shí)驗(yàn)從某高校隨機(jī)選取150名大學(xué)生作為問(wèn)卷調(diào)查對(duì)象,理工科學(xué)生為100人(67%),文科英語(yǔ)專業(yè)學(xué)生為50人(33%)。

2.2調(diào)查工具

2.2.1多元識(shí)讀能力調(diào)查問(wèn)卷的設(shè)計(jì)

問(wèn)卷共20題,涉及4個(gè)方面,每個(gè)方面設(shè)計(jì)5個(gè)選擇題。四個(gè)方面分別為:多模態(tài)語(yǔ)言的輸入現(xiàn)狀、多元識(shí)讀的學(xué)習(xí)表現(xiàn)、多元識(shí)讀能力提高的表現(xiàn)和目前多模態(tài)語(yǔ)言輸入和識(shí)讀能力提高之間還存在的問(wèn)題。選項(xiàng)采用五級(jí)制,分別為完全同意、同意、基本同意、不同意、完全不同意。

2.2.2學(xué)生作業(yè)樣本

英語(yǔ)專業(yè)三年級(jí)的預(yù)習(xí)作業(yè)。形式是PPT,預(yù)習(xí)課文選自高級(jí)英語(yǔ)第二冊(cè)Lesson10 The Sad Young Man。

2.3數(shù)據(jù)收集

共計(jì)發(fā)放150份調(diào)查問(wèn)卷,回收150份,全部有效,有效回收率100%。共計(jì)收取25份PPT作業(yè),每班各5份作業(yè)樣本。

3.結(jié)果與討論

3.1調(diào)查問(wèn)卷數(shù)據(jù)及結(jié)果

3.1.1英語(yǔ)教學(xué)中多模態(tài)語(yǔ)言的輸入現(xiàn)狀

表1很明確地說(shuō)明了一個(gè)事實(shí):多媒體設(shè)備已基本完備(A組數(shù)據(jù)選擇基本同意以上總計(jì)為90.4%),多模態(tài)語(yǔ)言輸入的教學(xué)模式已基本在該所高校的課堂普及(B組數(shù)據(jù)選擇基本同意以上總計(jì)為100%),并且多數(shù)教師和學(xué)生都已積極接受多模態(tài)語(yǔ)言輸入的教學(xué)模式,教學(xué)過(guò)程中多數(shù)教師積極采用PPT等多模態(tài)輔助教學(xué)工具,而PPT形式多樣(C組數(shù)據(jù)選擇基本同意以上總計(jì)為94%),內(nèi)容生動(dòng)有趣,使學(xué)生積極地采用此類(lèi)學(xué)習(xí)模式。此外,除了以PPT為主要形式外,一些任課教師也開(kāi)始使用其他類(lèi)型的多媒體輔助教學(xué)工具,如CAD等(D組數(shù)據(jù)選擇基本同意以上總計(jì)為80%)。另外,網(wǎng)絡(luò)作為多模態(tài)的載體在教學(xué)和學(xué)習(xí)中的作用凸顯。該所高校已開(kāi)通網(wǎng)絡(luò)學(xué)習(xí)平臺(tái),凸顯了學(xué)習(xí)資源豐富,集各種語(yǔ)言輸入模式為一體的特色,但是課程覆蓋率還處于較低狀態(tài)(E組數(shù)據(jù)選擇基本同意以上總計(jì)為75.2%)。

3.1.2多元識(shí)讀的學(xué)習(xí)表現(xiàn)

從表2可以看出:多數(shù)學(xué)生具備上網(wǎng)獲取各類(lèi)學(xué)習(xí)輔助資料的能力,包括網(wǎng)頁(yè)文本、網(wǎng)頁(yè)圖片、音頻、視頻等多種形式資料,同時(shí)也能夠在課外多渠道獲取各類(lèi)信息和資料(A組和C組數(shù)據(jù)選擇基本同意以上總計(jì)分別為86.4%和82.4%)。以英語(yǔ)學(xué)習(xí)為例,學(xué)生經(jīng)常使用新聞報(bào)刊、影視劇集、論壇貼吧等開(kāi)展自主聽(tīng)說(shuō)讀寫(xiě)練習(xí)。該校部分課程已開(kāi)通課程網(wǎng)絡(luò)學(xué)習(xí)平臺(tái),在任課教師的要求和學(xué)生學(xué)習(xí)主動(dòng)性的激發(fā)下,一般都會(huì)使用網(wǎng)絡(luò)平臺(tái)開(kāi)展自主學(xué)習(xí);但是許多課程暫時(shí)還處于網(wǎng)絡(luò)課程開(kāi)放之前的建設(shè)過(guò)程中,因此從數(shù)據(jù)顯示來(lái)看(B組和E組數(shù)據(jù)選擇基本同意以上總計(jì)分別為64%和69.6%),大學(xué)生通過(guò)課程網(wǎng)絡(luò)平臺(tái)加強(qiáng)多元識(shí)讀的學(xué)習(xí)方式亟待開(kāi)發(fā)和推進(jìn)。此外,隨著課堂互動(dòng)的日益增加,學(xué)生由主要知識(shí)接收者逐漸轉(zhuǎn)變?yōu)橹R(shí)輸出者,進(jìn)行課堂講演的機(jī)會(huì)越來(lái)越多。目前PPT是學(xué)生進(jìn)行講演時(shí)使用的主要工具(D組數(shù)據(jù)選擇基本同意以上總計(jì)為87.4%)。

3.1.3多元識(shí)讀能力提高的表現(xiàn)

隨著網(wǎng)絡(luò)的普及,學(xué)生對(duì)網(wǎng)絡(luò)技術(shù)日漸熟悉,大部分學(xué)生的多元識(shí)讀能力明顯得到提高,能夠主動(dòng)獨(dú)立地發(fā)揮多元識(shí)讀能力開(kāi)展學(xué)習(xí)和參與演講活動(dòng)。多數(shù)學(xué)生能夠熟練使用信息技術(shù)檢索資料,包括論壇貼吧、各種新聞網(wǎng)站和電影網(wǎng)站等。根據(jù)表3數(shù)據(jù)顯示,該校學(xué)生自我評(píng)價(jià)相對(duì)較高,A組顯示88%以上基本同意熟練使用信息技術(shù)檢索資料;B組顯示92.8%正確刪選資料;C組顯示高達(dá)95.2%的學(xué)生利用PPT進(jìn)行課堂講演;E組顯示89.6%的學(xué)生利用網(wǎng)絡(luò)合作解決學(xué)習(xí)問(wèn)題;D組是唯一顯示學(xué)生多元識(shí)讀能力不足的方面,即在參加網(wǎng)絡(luò)學(xué)習(xí)討論并提出意見(jiàn)方面還有待提高。

3.1.4存在問(wèn)題

根據(jù)表4,不難發(fā)現(xiàn)存在的問(wèn)題:雖然學(xué)生在多模態(tài)語(yǔ)言輸入環(huán)境下有較好的聽(tīng)覺(jué)、視覺(jué)、空間及網(wǎng)絡(luò)信息識(shí)讀能力,但學(xué)生對(duì)于搜索信息技術(shù)的掌握、刪選重組網(wǎng)絡(luò)信息的自學(xué)能力和轉(zhuǎn)化信息的能力仍然不足(C組、D組和E組認(rèn)可該能力的總和分別是81.9%、73.3%和75.3%)。此外,學(xué)生普遍認(rèn)為教學(xué)中的多模態(tài)形式不但局限于靜態(tài)PPT,而且大多數(shù)PPT畫(huà)面過(guò)于花哨,對(duì)學(xué)習(xí)者多元識(shí)讀的接受能力將會(huì)產(chǎn)生消極影響(A組和B組認(rèn)為有以上兩組情況的數(shù)據(jù)分別為88%和92.8%)。

3.2學(xué)生作業(yè)樣本分析及結(jié)果

通過(guò)統(tǒng)計(jì)學(xué)生的作業(yè)樣本(見(jiàn)表5),主要有三項(xiàng)發(fā)現(xiàn):第一,文字和圖片模態(tài)是學(xué)生較喜歡的兩種呈現(xiàn)方式,只有9份作業(yè)選擇增加音頻視頻資料進(jìn)行課堂演示,說(shuō)明學(xué)生對(duì)多模態(tài)信息輸入的重要性和必要性已經(jīng)有所認(rèn)識(shí),少數(shù)學(xué)生會(huì)通過(guò)運(yùn)用聲音模態(tài)的信息表達(dá)自己的觀點(diǎn);第二,在資料收集方面,25組作業(yè)完成者都會(huì)運(yùn)用網(wǎng)絡(luò)收集自己所需的資料,對(duì)大量資料也有一定的篩選能力,但是發(fā)現(xiàn)只有4組學(xué)生能運(yùn)用網(wǎng)絡(luò)社交平臺(tái)進(jìn)行討論和收集問(wèn)卷資料,由此可以看出利用網(wǎng)絡(luò)社交平臺(tái)促進(jìn)學(xué)習(xí)的優(yōu)勢(shì)還沒(méi)有得到充分的挖掘;第三,通過(guò)仔細(xì)對(duì)照在PPT作業(yè)中的圖片,筆者認(rèn)為多數(shù)學(xué)生對(duì)圖片的選擇比較隨意,有些圖片的表現(xiàn)內(nèi)容并不與其想表達(dá)的主題相符,反而影響PPT的整體性和趣味性。這些都說(shuō)明學(xué)生對(duì)資料的辨別篩選能力還有待提高。

3.3對(duì)策及建議

3.3.1多模態(tài)化學(xué)習(xí)資源的充分運(yùn)用和輸入

首先,在多模態(tài)語(yǔ)言輸入條件下,學(xué)習(xí)內(nèi)容不應(yīng)該只局限于紙質(zhì)的書(shū)本,可以多加入一些其他模態(tài)的信息。例如,在英語(yǔ)教學(xué)中,應(yīng)該借助多種信息資源,如文化、語(yǔ)言、宗教、地域、歷史、語(yǔ)境等,融視、聽(tīng)、觸等多感官刺激于一體,為學(xué)習(xí)者提供文、圖、聲、像交互并存的語(yǔ)言環(huán)境,激活學(xué)生知識(shí)體系中已有的相關(guān)經(jīng)驗(yàn),并借助多模態(tài)的互動(dòng)效果,引導(dǎo)學(xué)生了解、探討、研究與語(yǔ)言相關(guān)的文化現(xiàn)象,從多維的角度理解語(yǔ)言、分析語(yǔ)言。其次,多模態(tài)PPT設(shè)計(jì)可以通過(guò)文本、音頻、視頻等引導(dǎo),有選擇地對(duì)學(xué)習(xí)內(nèi)容的背景知識(shí)和傳達(dá)的價(jià)值觀念進(jìn)行補(bǔ)充。特別值得引起重視的是,網(wǎng)絡(luò)課程平臺(tái)的建設(shè)和在教學(xué)中的運(yùn)用將在未來(lái)起到舉足輕重的作用,教師應(yīng)積極開(kāi)設(shè)網(wǎng)絡(luò)課程,為學(xué)生提供全面豐富的學(xué)習(xí)資源,在課余搭建健康的學(xué)習(xí)交流平臺(tái),幫助學(xué)生開(kāi)拓更寬更廣的學(xué)習(xí)視角。

3.3.2多元識(shí)讀能力的有效培養(yǎng)和輸出

調(diào)查結(jié)果顯示大部分學(xué)生已擁有較好的多元識(shí)讀能力,且該能力不斷提高。雖然學(xué)生對(duì)自己的多元識(shí)讀能力評(píng)估較高,但是內(nèi)心深處還是期待有質(zhì)的改變。比如,在調(diào)查問(wèn)卷中學(xué)生多選“同意”或“基本同意”,而不是“非常同意”可以看出學(xué)生的期待值。此外,從學(xué)生的作業(yè)樣本分析中可以看出,多數(shù)學(xué)生明顯將多模態(tài)語(yǔ)言輸入局限于一種單純的網(wǎng)絡(luò)資料堆積,而不是利用各種符號(hào)系統(tǒng)建構(gòu)意義,事實(shí)上,大多數(shù)學(xué)生并沒(méi)有從多模態(tài)的網(wǎng)絡(luò)資源中獲得充分合理的支持。早在2009年,研究者就已經(jīng)提出學(xué)生對(duì)電腦的網(wǎng)絡(luò)操作能力還有待提高,資料收集和利用網(wǎng)絡(luò)資源進(jìn)行主動(dòng)學(xué)習(xí)的能力較差(韋琴紅,2009)。時(shí)隔三年,盡管網(wǎng)絡(luò)資料和媒體模式日新月異地發(fā)展,大學(xué)生對(duì)于合理運(yùn)用多模態(tài)語(yǔ)言輸入的觀念還不曾有明顯的改變。教師在當(dāng)前多模態(tài)輸入的網(wǎng)絡(luò)環(huán)境下,有必要繼續(xù)提高學(xué)生對(duì)多模態(tài)語(yǔ)言輸入的認(rèn)識(shí)及加強(qiáng)多元識(shí)讀能力的培養(yǎng)。在選擇多模態(tài)語(yǔ)言輸入信息時(shí),要首先確保這種輸入是可理解性的輸入,同時(shí),學(xué)生應(yīng)該自主設(shè)定學(xué)習(xí)目標(biāo)和進(jìn)程,有意識(shí)地提高信息檢索能力和刪選能力,多參與在線作業(yè)和討論,多與老師同學(xué)開(kāi)展以課程網(wǎng)絡(luò)為平臺(tái)的交流活動(dòng)。

4.結(jié)語(yǔ)

隨著課堂上多媒體運(yùn)用的日益普及,大學(xué)教學(xué)多模態(tài)化的迅速發(fā)展,學(xué)生多元識(shí)讀能力的培養(yǎng)和提高值得深入探討。當(dāng)然,多元識(shí)讀能力的培養(yǎng)是一個(gè)漫長(zhǎng)的過(guò)程,大學(xué)生從容應(yīng)對(duì)經(jīng)濟(jì)全球化、信息技術(shù)多模態(tài)化和語(yǔ)言文化的多元融合,與多模態(tài)化和多元識(shí)讀能力的培養(yǎng)息息相關(guān)。

參考文獻(xiàn):

[1]Kress,G.&van Leeuwen,T.Multimodal Discourse:The Modes and Media of Contemporary Communication[M].London:Arnold,2001.

[2]葛俊麗,羅曉燕.新媒介時(shí)代外語(yǔ)教學(xué)新視覺(jué)角[J].外語(yǔ)界,2010,(5).

[3]顧曰國(guó).多媒體_多模態(tài)學(xué)習(xí)剖析[J].外語(yǔ)電化教學(xué),2007,(4).

[4]胡壯麟.社會(huì)符號(hào)學(xué)研究中的多模態(tài)化[J].語(yǔ)言教學(xué)與研究,2007,(1).

[5]韋琴紅.多模態(tài)化與大學(xué)生多元識(shí)讀能力研究-韋琴紅[J].外語(yǔ)電化教學(xué),2009.

[6]張德祿.多模態(tài)話語(yǔ)理論與媒體技術(shù)在外語(yǔ)教學(xué)中的應(yīng)用[J].外語(yǔ)教學(xué),2009,(7).

[7]張德祿.多模態(tài)外語(yǔ)教學(xué)的設(shè)計(jì)與模態(tài)調(diào)用初探[J].中國(guó)外語(yǔ),2010(5).

第6篇:社交媒體文本分析范文

【關(guān)鍵詞】 互動(dòng)易; 信息披露; 新媒體; 股票收益率; 交易量

【中圖分類(lèi)號(hào)】 F830.9 【文獻(xiàn)標(biāo)識(shí)碼】 A 【文章編號(hào)】 1004-5937(2017)08-0048-08

一、引言

隨著互聯(lián)網(wǎng)技術(shù)的快速發(fā)展,各種各樣的新媒體層出不窮,不少企業(yè)已經(jīng)擁有自己的微博、微信等交流平臺(tái)。新媒體已逐漸成為當(dāng)今世界非常重要的信息集散樞紐,其開(kāi)放性、及時(shí)性和互動(dòng)性等特點(diǎn)契合資本市場(chǎng)的公平、公開(kāi)和公正原則。

基于此,近年來(lái)新媒體對(duì)證券市場(chǎng)的作用逐漸引起了學(xué)者的重視[1-5]。作為傳媒手段之一,新媒體將公司信息及時(shí)、高效地傳遞給投資者。上市公司和投資者傳統(tǒng)的溝通方式主要包括年報(bào)、半年報(bào)、季報(bào)等定期報(bào)告的渠道,然而時(shí)效性差是其最大缺點(diǎn)。而新媒體的出現(xiàn)恰恰補(bǔ)了這一缺陷。

得益于網(wǎng)絡(luò)技術(shù)的加入,對(duì)傳統(tǒng)的信息披露制度進(jìn)行改進(jìn)是大勢(shì)所趨。近年來(lái)監(jiān)管機(jī)構(gòu)對(duì)待使用新媒體披露信息的態(tài)度也愈加開(kāi)放。美國(guó)證券交易委員會(huì)(SEC)在2013年就曾發(fā)表聲明,允許上市公司使用Twitter、Facebook等社交媒體披露公司信息,只要上市公司提前告知投資者將要在何種社交平臺(tái)上信息即可。

本文的研究對(duì)象“互動(dòng)易”平臺(tái)就是深交所為適應(yīng)新形勢(shì)下信息披露的需求而設(shè)立的。它由深圳證券交易所于2010年1月1日推出,在2011年11月12日基于Web 2.0平臺(tái)(類(lèi)微博模式)進(jìn)行系統(tǒng)升級(jí),并改名為“互動(dòng)易”。投資者可通過(guò)該平臺(tái)直接向上市公司提問(wèn),上市公司在“互動(dòng)易”平臺(tái)上答復(fù)。其成立的初衷在于提高上市公司和投資者之間的溝通效率,幫助投資者將市場(chǎng)信息化繁為簡(jiǎn),使投資者在信息獲取、信息鑒別、與上市公司之間的互動(dòng)交流方面更加容易。從形式上來(lái)看,“互動(dòng)易”平臺(tái)上的公司回復(fù)實(shí)質(zhì)上可以視為上市公司進(jìn)行的自愿性信息披露①。深交所在《上市公司信息披露工作考核辦法》(2011年修訂)第十六條也增加了對(duì)“互動(dòng)易”的監(jiān)管要求,以此引導(dǎo)上市公司充分重視,不斷提高投資者關(guān)系管理水平。

目前對(duì)信息披露經(jīng)濟(jì)后果的研究主要集中在定期報(bào)告中自愿性信息披露對(duì)股權(quán)資本成本的影響方面[6-7]。文獻(xiàn)研究表明,信息披露主要存在兩方面潛在的益處:(1)幫助糾正公司的錯(cuò)誤估值;(2)提高股票的流動(dòng)性,降低資本成本[8]。理論上說(shuō),及時(shí)的信息披露使財(cái)務(wù)信息得以迅速在資本市場(chǎng)中擴(kuò)散,將信息的滯后性影響減少到最低水平,有效地解決信息披露的及時(shí)性問(wèn)題,在短時(shí)間內(nèi)降低信息不對(duì)稱[3]。傳統(tǒng)渠道下信息披露的經(jīng)濟(jì)后果已取得較為豐富的研究成果,然而對(duì)于新媒體形式下的信息披露鮮有研究。

那么新媒體是否真的如上所述在資本市場(chǎng)中起到積極作用呢?本文采用“互動(dòng)易”平臺(tái)上公司的回復(fù)作為研究對(duì)象,引入回復(fù)指數(shù)對(duì)公司回復(fù)質(zhì)量進(jìn)行刻畫(huà),嘗試探究新媒體平臺(tái)上的公司信息披露對(duì)于股票收益率和交易量的作用。

本文的創(chuàng)新點(diǎn)在于針對(duì)新媒體形式下信息披露的作用進(jìn)行研究,以“互動(dòng)易”平臺(tái)為例,首次對(duì)該平臺(tái)上的公司回復(fù)進(jìn)行挖掘分析,證明了及時(shí)的公司回復(fù)是有效的。新媒體對(duì)于公司信息披露的重要性逐漸提升,在此背景下研究“互動(dòng)易”這類(lèi)平臺(tái)的公司回復(fù)將更具現(xiàn)實(shí)意義。此外,根據(jù)“互動(dòng)易”這類(lèi)新媒體平臺(tái)的特性,本文設(shè)計(jì)了可行且具有較強(qiáng)推廣性的新媒體披露質(zhì)量測(cè)度指標(biāo),對(duì)之后類(lèi)似的研究具有積極的借鑒意義。

二、文獻(xiàn)回顧與假設(shè)提出

傳統(tǒng)的自愿性信息披露渠道以定期報(bào)告為主,其對(duì)資本市場(chǎng)的作用已有大量研究成果[9-12]。對(duì)公司來(lái)說(shuō),進(jìn)行廣泛自愿性信息披露主要有三種資本市場(chǎng)效應(yīng):提高股票流動(dòng)性、降低資本成本、提升公司價(jià)值。但是由于定期報(bào)告時(shí)間跨度過(guò)大,無(wú)法滿足普通投資者日益增長(zhǎng)的信息需求,并且是以公司為主導(dǎo)對(duì)外披露,受到公司特質(zhì)等諸多因素的限制。隨著互聯(lián)網(wǎng)技術(shù)的不斷發(fā)展,各種新媒體層出不窮,微博、微信等社交媒體因其傳播速度快、時(shí)效性強(qiáng)、互動(dòng)性強(qiáng)等特點(diǎn)發(fā)展迅速,開(kāi)始在企業(yè)的投資者關(guān)系中扮演重要的角色。

國(guó)外學(xué)者較早開(kāi)展新媒體對(duì)資本市場(chǎng)的作用研究。Wysocki[13]以發(fā)帖量度量論壇信息,考察其和公司基本面、股市表現(xiàn)之間的關(guān)系,發(fā)現(xiàn)發(fā)帖量的確能夠預(yù)測(cè)第二天股票的交易量與異常收益率。Antweiler et al.[14]通過(guò)分析Yahoo Finance和Raging Bull兩大金融論壇的帖子,構(gòu)建情緒指數(shù),結(jié)果發(fā)現(xiàn)論壇信息可以用來(lái)預(yù)測(cè)股票波動(dòng)率。

國(guó)內(nèi)類(lèi)似的研究起步稍晚。張永杰等[15]不局限于特定論壇,將社交媒體信息內(nèi)容的抓取范圍擴(kuò)展至整個(gè)中文互聯(lián)網(wǎng),以此研究社交媒體信息在資產(chǎn)定價(jià)方面的影響,發(fā)現(xiàn)不斷發(fā)展的中文社交媒體蘊(yùn)含著對(duì)股票收益率有著顯著解釋能力的信息內(nèi)容。金雪軍等[16]抓取了股吧在2012年10月至2013年9月期間共580萬(wàn)條發(fā)帖數(shù)據(jù),借助文本分析技術(shù)研究發(fā)現(xiàn),看漲指數(shù)與股票收益率呈正向相關(guān),論壇發(fā)帖量對(duì)股票成交量有著顯著的正向影響,證實(shí)了中小投資者在股票論壇的討論確實(shí)會(huì)對(duì)股票的收益率與成交量產(chǎn)生影響。

早期的研究對(duì)象主要集中于論壇信息。近年來(lái)隨著社交媒體的迅猛發(fā)展,信息的流動(dòng)得到快速提高,其對(duì)資本市場(chǎng)的作用引起了大量學(xué)者的興趣。

因?yàn)閱渭兊幕貜?fù)數(shù)還可能受到不同公司的被關(guān)注程度影響,為了消除由于關(guān)注度不同所造成的影響,對(duì)指標(biāo)進(jìn)行歸一化處理,最后得出回復(fù)指數(shù)的計(jì)算公式:

其中i為回答日期與提問(wèn)日期之差,ni為第i天前的問(wèn)題總數(shù)。相比較傳統(tǒng)的以絕對(duì)數(shù)量代替信息披露質(zhì)量的測(cè)度方式,該回復(fù)指數(shù)進(jìn)一步考慮了信息的及時(shí)性特征,同時(shí)還能夠較好地衡量不同公司之間回復(fù)質(zhì)量的差異。

2.因變量

本文的交易量指標(biāo)(Volume)采用日個(gè)股交易股數(shù),而收益率指標(biāo)(Return)采用不考慮現(xiàn)金紅利的日個(gè)股回報(bào)率,上述數(shù)據(jù)均來(lái)源于國(guó)泰安數(shù)據(jù)庫(kù)。

3.控制變量

在控制變量選擇上,本文加入深圳A股每日市場(chǎng)回報(bào)率(Market Return)和公司回復(fù)的絕對(duì)數(shù)量(Reply Count),分別控制整體的市場(chǎng)效應(yīng)和投資者關(guān)注度不同造成的影響。

具體變量的說(shuō)明和計(jì)算方法見(jiàn)表1。

(三)模型設(shè)計(jì)

樣本數(shù)據(jù)既包含時(shí)間序列又包含截面數(shù)據(jù),為了更好地分析各變量間相互關(guān)系并預(yù)測(cè)其變化趨勢(shì),本文采用面板回歸進(jìn)行數(shù)據(jù)分析。同時(shí)由于投資者的反應(yīng)可能存在滯后效應(yīng),因此本文參考Tetlock[19]的模型設(shè)計(jì),引入了滯后5階的回復(fù)指數(shù),使用L5(Reply Index)表示(其中L5(xt)=[xt-1xt-2xt-3xt-4xt-5])。

為確定面板回歸模型,本了如下檢驗(yàn),即Hausman檢驗(yàn)(用于確定選擇固定效應(yīng)還是隨機(jī)效應(yīng))以及F檢驗(yàn)(用于確定選擇混合效應(yīng)還是固定效應(yīng))。根據(jù)表2的檢驗(yàn)結(jié)果,F(xiàn)檢驗(yàn)顯示固定效應(yīng)模型優(yōu)于混合效應(yīng)模型,Hausman檢驗(yàn)顯示固定效應(yīng)模型優(yōu)于隨機(jī)效應(yīng)模型。所以,最終對(duì)模型統(tǒng)一選擇固定效應(yīng)模型。

回歸模型如下:

其中,Reply Indexi,t表示i公司第t天的回復(fù)指數(shù),Market Equityi,t和Asseti,t分別表示對(duì)應(yīng)時(shí)間公司的流通市值和資產(chǎn)規(guī)模,Reply Indexi,t表示對(duì)應(yīng)時(shí)間的回復(fù)總數(shù),Market Returnt表示第t天不考慮現(xiàn)金紅利再投資的日市場(chǎng)回報(bào)率(流通市值加權(quán)平均法),在回歸方程中Market Equity、Asset和Reply Count均已進(jìn)行對(duì)數(shù)化處理,以消除量綱的影響。

四、實(shí)證檢驗(yàn)結(jié)果與分析

(一)描述性統(tǒng)計(jì)

針對(duì)本研究所選取的樣本,本文對(duì)上市公司披露情況以及其他解釋變量進(jìn)行了描述性統(tǒng)計(jì),結(jié)果如表3所示。從描述性統(tǒng)計(jì)結(jié)果來(lái)看,由于回復(fù)數(shù)據(jù)的稀疏性導(dǎo)致80%以上與回復(fù)相關(guān)的數(shù)據(jù)為0,因此整體回復(fù)指數(shù)均值較小,只有0.041,個(gè)股每日回復(fù)量也從0至262條不等,這與“互動(dòng)易”平臺(tái)推出時(shí)間比較短,整個(gè)市場(chǎng)的參與度較小相關(guān)。市場(chǎng)日回報(bào)率比較穩(wěn)定,在-0.066至0.055之間波動(dòng),其均值也趨于0。相比較而言,個(gè)股回報(bào)率變化較大,最低為-0.263,最高則為16.773,但是兩者標(biāo)準(zhǔn)差比較接近。資產(chǎn)和市值的變化波動(dòng)較大,最大和最小值之間相差103以上數(shù)量級(jí),說(shuō)明A股市場(chǎng)存在較大的分化現(xiàn)象,這也為下文對(duì)資產(chǎn)和市值分組進(jìn)行穩(wěn)健性檢驗(yàn)提供了依據(jù)。雖然參與互動(dòng)的公司數(shù)在逐年增加(未列出),這表明我國(guó)上市公司日益認(rèn)識(shí)到與投資者保持良好關(guān)系及信息披露的重要性,也說(shuō)明越來(lái)越多的投資者開(kāi)始關(guān)注“互動(dòng)易”平臺(tái),但是也應(yīng)當(dāng)看到,仍有眾多的上市公司并沒(méi)有參與到投資者的提問(wèn)互動(dòng)中來(lái),說(shuō)明“互動(dòng)易”平臺(tái)建設(shè)和上市公司與投資者的互動(dòng)還有很大的提升空間。

(二)面板回歸檢驗(yàn)

公司回復(fù)指數(shù)對(duì)股票收益率和交易量影響的實(shí)證結(jié)果如表4所示,滯后一天的公司回復(fù)對(duì)于收益率的影響為負(fù),公司回復(fù)指數(shù)每增加一個(gè)單位,將導(dǎo)致隔日收益率降低0.056%,而滯后2天和3天的回復(fù)對(duì)于收益率的影響顯著為正。通過(guò)對(duì)公司回復(fù)時(shí)間的深入分析,本文發(fā)現(xiàn)“互動(dòng)易”平臺(tái)上的公司平均回復(fù)時(shí)間間隔為2.61天,因此本文認(rèn)為上述現(xiàn)象可能是投資者對(duì)于公司回復(fù)不及時(shí)的“懲罰”所致,具體主要有兩種原因:(1)投資者看到公司的回復(fù),但是由于公司回復(fù)過(guò)晚導(dǎo)致消息的價(jià)值(時(shí)效性)大大降低,雖然公司回復(fù)了投資者的提問(wèn),但投資者對(duì)此作出負(fù)面的評(píng)價(jià),之后才逐漸修正之前有偏的評(píng)價(jià),對(duì)公司回復(fù)價(jià)值的認(rèn)識(shí)呈先降后升的變化。(2)由于公司回復(fù)得不及時(shí),存在間隔數(shù)天登錄一次并集中回復(fù)的現(xiàn)象,長(zhǎng)此以往造成投資者和公司的低效溝通,投資者也并未每天關(guān)注平臺(tái)更新,導(dǎo)致新的回復(fù)可能未被消化,此時(shí)投資者認(rèn)為公司仍“未回復(fù)”,從而作出消極的評(píng)價(jià)。受限于數(shù)據(jù)及處理能力,本文并未對(duì)上述原因進(jìn)行進(jìn)一步的驗(yàn)證和分析。

“互動(dòng)易”平臺(tái)本是為投資者和公司提供高效互動(dòng)的平臺(tái),但是有很大一部分公司的回復(fù)并不及時(shí),個(gè)別公司漠視投資者的心聲,如烯碳新材(000511)、中信國(guó)安(000839)、陜國(guó)投A(000563)等公司在樣本中的平均回復(fù)時(shí)間達(dá)16天以上,回復(fù)間隔時(shí)間過(guò)長(zhǎng)已經(jīng)引起了投資者的強(qiáng)烈質(zhì)疑③。因此考慮到回復(fù)的滯后效應(yīng),本文將滯后5期的回復(fù)指數(shù)聯(lián)合考慮,發(fā)現(xiàn)公司回復(fù)的作用顯著為正,回復(fù)指數(shù)每增加1個(gè)單位,將導(dǎo)致股票收益率增加0.027%,這就說(shuō)明,公司回復(fù)指數(shù)在以周為基本單位的時(shí)間軸上對(duì)股票收益率呈正向促進(jìn)作用。然而作為控制變量的回復(fù)數(shù)量對(duì)個(gè)股回報(bào)率的作用為負(fù),回復(fù)數(shù)量每變化1%將引起股票收益率變化0.006%,從量級(jí)上來(lái)看,其影響力低于公司回復(fù)指數(shù)。這說(shuō)明公司的回復(fù)數(shù)量雖然起到了反向修正股票收益的作用,但其作用甚微,不足以抵消公司回橢甘對(duì)于股票收益的整體正向促進(jìn)作用。

交易量對(duì)公司回復(fù)的回歸結(jié)果顯示,除滯后第3期外,滯后期的公司回復(fù)對(duì)于交易量的作用均顯著為正,在0.1%的水平拒絕了公司回復(fù)對(duì)于交易量無(wú)影響的原假設(shè)。聯(lián)合5期同時(shí)考慮,發(fā)現(xiàn)公司回復(fù)指數(shù)每增加1個(gè)單位,將導(dǎo)致股票成交量變化2.28%,有效地支持了假設(shè)2,說(shuō)明“互動(dòng)易”平臺(tái)上公司的披露確實(shí)大大降低了信息不對(duì)稱程度,降低了買(mǎi)賣(mài)價(jià)差,提升了交易量。

(三)穩(wěn)健性檢驗(yàn)

為了驗(yàn)證上述結(jié)果的穩(wěn)健性,本文分別采用了對(duì)每年分組回歸和按不同市值、資產(chǎn)分組回歸以及換用總市值及對(duì)應(yīng)的收益率等方法,以檢驗(yàn)公司回復(fù)對(duì)股市的作用。

如表5所示,公司回復(fù)對(duì)于股票收益率的作用除了2013年的系數(shù)在1%的水平顯著為正,其余年份均不顯著,這可能是因?yàn)?013年之前的年份公司回復(fù)的數(shù)據(jù)量過(guò)少。通過(guò)對(duì)“互動(dòng)易”平臺(tái)上公司回復(fù)數(shù)的深入分析,發(fā)現(xiàn)平臺(tái)上每年的問(wèn)題數(shù)量逐步上升,由2011年的36 249條猛增至2013年的239 194條,說(shuō)明“互動(dòng)易”逐漸得到了廣大投資者的認(rèn)可,參與程度大大提高,其在股票市場(chǎng)的作用也隨之增強(qiáng)。雖然2014年平臺(tái)回復(fù)數(shù)依舊增長(zhǎng)迅速,但本文并未發(fā)現(xiàn)該年度公司回復(fù)對(duì)于股票收益率有顯著影響的證據(jù),需要做進(jìn)一步的研究和分析。

公司回復(fù)對(duì)于交易量的回歸結(jié)果顯示,除2011年外,2012年至2014年的系數(shù)均為正,1單位回復(fù)指數(shù)的變化將導(dǎo)致隔日交易量1.6%以上的波動(dòng),其預(yù)測(cè)作用依舊顯著。上述結(jié)果同時(shí)說(shuō)明交易量對(duì)于公司回復(fù)的信號(hào)感知程度比收益率更高,也證明了公司回復(fù)在不同年份,確實(shí)起到了降低信息不對(duì)稱、提高股市的流動(dòng)性的作用,從而促進(jìn)了股市的成交量。

本文按照流通市值和總資產(chǎn)的大小分別劃分成高(約25%)、中(約50%)、低(約25%)三組,其中流通市值大于100萬(wàn)元為中,大于400萬(wàn)元為高,其余均為低;資產(chǎn)大于10億元為中,大于40億元為高,其余均為低。由表6和表7可以看出,公司回復(fù)對(duì)于股票收益率的影響主要在低市值和低資產(chǎn)的兩個(gè)分組中作用顯著,說(shuō)明低市值和低資產(chǎn)的公司需要高度重視投資者關(guān)系管理。其余分組表現(xiàn)不顯著可能是上述公司由于其資產(chǎn)或市值規(guī)模大,本身就擁有較高的關(guān)注度和知名度,信息披露渠道相對(duì)公開(kāi),除“互動(dòng)易”平臺(tái)外,還有其他的披露渠道,比如官網(wǎng)、新聞媒體報(bào)道等,因此“互動(dòng)易”平臺(tái)上公司回復(fù)對(duì)于其收益率的變化影響并不顯著。

反觀交易量的回歸結(jié)果,發(fā)現(xiàn)公司的回復(fù)在低資產(chǎn)和中低市值的分組中作用顯著。和上述結(jié)果類(lèi)似,說(shuō)明以上公司需在平時(shí)多關(guān)注投資者的問(wèn)題,及時(shí)進(jìn)行回復(fù)和披露,以增強(qiáng)本公司在股票市場(chǎng)的競(jìng)爭(zhēng)力。

另外,本文換用總市值和總市值加權(quán)平均法的日市場(chǎng)回報(bào)率作為股價(jià)效應(yīng)的衡量指標(biāo),并對(duì)前文結(jié)論進(jìn)行了重新檢驗(yàn)。結(jié)果顯示,并未對(duì)前文結(jié)論的穩(wěn)健性產(chǎn)生影響。

整體來(lái)說(shuō),公司回復(fù)對(duì)于股票收益率和交易量的作用均通過(guò)了穩(wěn)健性檢驗(yàn),證明了“互動(dòng)易”平臺(tái)確實(shí)在減少信息不對(duì)稱,提高投資者和公司互動(dòng)效率方面起到了積極的作用。

五、結(jié)論

本文通過(guò)對(duì)“互動(dòng)易”平臺(tái)上的公司回復(fù)進(jìn)行分析,發(fā)現(xiàn)公司回復(fù)確實(shí)對(duì)股票收益率和交易量產(chǎn)生了正向影響,從而肯定了“互動(dòng)易”平臺(tái)作為新媒體的披露方式在股票市場(chǎng)中所起的積極作用。對(duì)于投資者而言,“互動(dòng)易”平臺(tái)提供了獲取上市公司一手信息的渠道,要善于利用這部分信息,但是利用其進(jìn)行投資獲利,其實(shí)踐意義比較有限。對(duì)于公司而言,投資者的問(wèn)題往往是關(guān)系公司發(fā)展的根本問(wèn)題,如果一味漠視其心聲,將導(dǎo)致一些不必要的后果。公司需要增加自己的透明度,提高回復(fù)的效率,和投資者進(jìn)行有效的溝通。對(duì)于監(jiān)管機(jī)構(gòu)而言,需要在日后加強(qiáng)對(duì)上市公司的監(jiān)管,特別是鼓勵(lì)資產(chǎn)和市值規(guī)模比較小的公司積極⒂牖ザ。雖然“互動(dòng)易”平臺(tái)起到了維護(hù)證券市場(chǎng)公開(kāi)公平公正的積極作用,但是其時(shí)效性和影響力有待加強(qiáng),證券市場(chǎng)的參與方都應(yīng)參與其中,共同致力于打造一個(gè)有效率、公平的證券市場(chǎng)。

本文的創(chuàng)新點(diǎn)在于首次對(duì)“互動(dòng)易”平臺(tái)上的公司回復(fù)進(jìn)行挖掘,分析其對(duì)股票市場(chǎng)的作用,證明了及時(shí)的公司回復(fù)是有效的,對(duì)于股票收益率和成交量呈正向促進(jìn)作用。結(jié)合公司在“互動(dòng)易”平臺(tái)上回復(fù)的特點(diǎn),本文設(shè)計(jì)了一種適用于非定期報(bào)告的信息披露質(zhì)量指標(biāo),在類(lèi)似的互動(dòng)平臺(tái)均具有較好的推廣性。

當(dāng)然本文還存在如下不足:首先,并未對(duì)公司回復(fù)的文本進(jìn)行進(jìn)一步的分析和挖掘,公司的回復(fù)可能包含了一些重要的信息,比如研發(fā)、發(fā)展戰(zhàn)略等,下一步的研究可以在文本理解這個(gè)角度進(jìn)行深入挖掘。此外,本文只關(guān)注了公司回復(fù)這個(gè)角色,然而“互動(dòng)易”這個(gè)平臺(tái)上不僅有公司的回復(fù),更重要的還有投資者的參與,對(duì)于公司和投資者互動(dòng)的作用也是日后研究的重點(diǎn)之一。

【參考文獻(xiàn)】

[1] BOLLEN J, MAO H, ZENG X. Twitter mood predicts the stock market[J]. Journal of Computational Science, 2011,2(1):1-8.

[2] SAXTON G D. New media and external accounting information: A critical review[J]. Australian Accounting Review, 2012,22(3):286-302.

[3] 文雄. 新媒體對(duì)財(cái)務(wù)信息披露的影響[J]. 會(huì)計(jì)師, 2014(12):15-17.

[4] LEE L F, et al. The role of social media in the capital market: evidence from consumer product recalls[J]. Journal of Accounting Research,2015,53(2):367-404.

[5] 譚松濤,闞鑠,崔小勇.互聯(lián)網(wǎng)溝通能夠改善市場(chǎng)信息效率嗎?――基于深交所“互動(dòng)易”網(wǎng)絡(luò)平臺(tái)的研究[J].金融研究,2016(3):174-188.

[6] 曾穎,陸正飛.信息披露質(zhì)量與股權(quán)融資成本[J]. 經(jīng)濟(jì)研究,2006(2):69-79.

[7] 李明毅,惠曉峰.上市公司信息披露與資本成本:來(lái)自中國(guó)證券市場(chǎng)的經(jīng)驗(yàn)證據(jù)[J].管理學(xué)報(bào),2008,5(1): 88-127.

[8] HEALY P M, et al. Stock performance and intermediation changes surrounding sustained increases in disclosure[J]. Contemporary Accounting Research,1999,16(3):485-520.

[9] VERRECCHIA R E. Information quality and discretionary disclosure[J]. Journal of Accounting and Economics,1990,12(4):365-380.

[10] HEALY P M, PALEPU K G. Information asymmetry,corporate disclosure, and the capital markets: A review of the empirical disclosure literature[J]. Journal of Accounting and Economics,2001,31(1-3):405-440.

[11] 何玉,張?zhí)煳?信息披露,信息不對(duì)稱和資本成本:研究綜述[J].會(huì)計(jì)研究,2006(6):80-86.

[12] 孫光國(guó),楊金鳳.財(cái)務(wù)報(bào)告質(zhì)量評(píng)價(jià)研究:文獻(xiàn)回顧、述評(píng)與未來(lái)展望[J].會(huì)計(jì)研究,2012(3):31-38.

[13] WYSOCKI P D. Cheap talk on the web: The determinants of postings on stock message boards[D]. University of Michigan Business School Working Paper,1998.

[14] ANTWEILER W, FRANK M Z. Is all that talk just noise? The information content of internet stock message boards[J]. The Journal of Finance,2004,59(3):1259-1294.

[15] 張永杰,張維,金曦,等.互聯(lián)網(wǎng)知道的更多么?――網(wǎng)絡(luò)開(kāi)源信息對(duì)資產(chǎn)定價(jià)的影響[J]. 系統(tǒng)工程理論與實(shí)踐,2011,31(4):577-586.

[16] 金雪軍,祝宇,楊曉蘭.網(wǎng)絡(luò)媒體對(duì)股票市場(chǎng)的影響――以東方財(cái)富網(wǎng)股吧為例的實(shí)證研究[J].新聞與傳播研究,2013(12):36-51.

[17] 程琬|,林杰.社交媒體的投資者漲跌情緒與證券市場(chǎng)指數(shù)[J].管理科學(xué),2013,26(5):111-119.

[18] CHEN H, et al. Wisdom of crowds: The value of stock opinions transmitted through social media[J]. Review of Financial Studies, 2014,27(5):1367-1403.

[19] TETLOCK P C. Giving content to investor sentiment: The role of media in the stock market[J]. The Journal of Finance, 2007,62(3):1139-1168.

[20] NADER J. A rose by any other name[J]. Bar news:The Journal of the NSW Bar Association,2013,Autumn:5-6.

[21] LEUZ C,VERRECCHIA R E. The Economic Consequences of Increased Disclosure (Digest Summary)[J]. Journal of Accounting Research,2000,38(5):91-124.

[22] FAMA E F, FRENCH K R. Common risk factors in the returns on stocks and bonds[J]. Journal of Financial Economics, 1993,33(1):3-56.

第7篇:社交媒體文本分析范文

與即時(shí)通訊類(lèi)的網(wǎng)絡(luò)應(yīng)用不同,博客、個(gè)人空間、微博都具有一定的公共性質(zhì),并被統(tǒng)稱為自媒體。自媒體的興盛,使其成為熱點(diǎn)輿情形成的重要推動(dòng)者,而網(wǎng)絡(luò)輿情也成為社會(huì)輿情的重要組成部分。

自媒體幾乎沒(méi)有準(zhǔn)入門(mén)檻,同時(shí)又具有匿名性,使用者的媒介素養(yǎng)良莠不齊,很容易產(chǎn)生各種失范現(xiàn)象;自媒體也不像傳統(tǒng)媒體那樣容易監(jiān)督,對(duì)于失范現(xiàn)象難以追溯源頭,同時(shí)給各方主體帶來(lái)影響輿論、把控輿論走向的機(jī)會(huì),使得網(wǎng)絡(luò)輿情處于更加復(fù)雜的環(huán)境中。自媒體的網(wǎng)狀結(jié)構(gòu)又決定了網(wǎng)絡(luò)輿情可以快速發(fā)酵,甚至在短時(shí)間內(nèi)多次轉(zhuǎn)向,因此更加難以監(jiān)控和把握。

而對(duì)自媒體勃興之后網(wǎng)絡(luò)輿情的監(jiān)測(cè),傳統(tǒng)的現(xiàn)場(chǎng)調(diào)查、訪問(wèn)調(diào)查、問(wèn)卷調(diào)查等方式收效不佳,早期曾經(jīng)廣泛使用的網(wǎng)絡(luò)輿情監(jiān)測(cè)手段也暴露出了越來(lái)越多的問(wèn)題。早期的網(wǎng)絡(luò)輿情監(jiān)測(cè),主要是針對(duì)Web1.0設(shè)計(jì)的?;ヂ?lián)網(wǎng)發(fā)展至今經(jīng)歷了兩個(gè)階段:Web1.0和Web2.0。兩者的主要區(qū)別并不在于技術(shù)規(guī)范或物理設(shè)備,而是用戶之間以及用戶和網(wǎng)絡(luò)應(yīng)用之間的交互方式。

在Web1.0時(shí)代,互聯(lián)網(wǎng)內(nèi)容主要由各大網(wǎng)站生產(chǎn),用戶和網(wǎng)站的交互主要體現(xiàn)為尋找和接受相應(yīng)的內(nèi)容,用戶之間也只能通過(guò)有限的方式進(jìn)行散落聯(lián)系。早期的網(wǎng)絡(luò)輿情監(jiān)測(cè),就是針對(duì)這樣層次的交互而設(shè)計(jì)。流程大致是:一、通過(guò)相關(guān)樣本庫(kù),把需要監(jiān)測(cè)的網(wǎng)頁(yè)進(jìn)行模板匹配,并設(shè)定為監(jiān)測(cè)數(shù)據(jù)源;二、應(yīng)用爬蟲(chóng)程序抓取數(shù)據(jù),存儲(chǔ)到本地,再進(jìn)行數(shù)據(jù)的凈化和簡(jiǎn)略的分析;三、利用簡(jiǎn)單的圖表模板和文字描述,呈現(xiàn)監(jiān)測(cè)和分析的結(jié)果。

早期的網(wǎng)絡(luò)輿情監(jiān)測(cè)方式有一些原生的問(wèn)題,譬如:一、由于處理能力有限,只能抽取部分樣本進(jìn)行監(jiān)測(cè),無(wú)法避免偶然誤差;二、文本分析算法的準(zhǔn)確度、監(jiān)測(cè)對(duì)象和系統(tǒng)模板匹配的程度、對(duì)數(shù)據(jù)的凈化,以及分析的算法等因素對(duì)于最后監(jiān)測(cè)結(jié)果的準(zhǔn)確度都有決定性的影響,無(wú)法避免系統(tǒng)誤差;三、將監(jiān)測(cè)的對(duì)象簡(jiǎn)化為獨(dú)立的信息元,欠缺分析網(wǎng)絡(luò)內(nèi)容之間聯(lián)系的能力和預(yù)測(cè)能力。

早期的網(wǎng)絡(luò)輿情監(jiān)測(cè)方式,盡管有很多問(wèn)題,對(duì)Web1.0時(shí)代的離散的網(wǎng)絡(luò)內(nèi)容和單向的交互方式來(lái)說(shuō)還可以適用。隨著互聯(lián)網(wǎng)發(fā)展到了Web2.0時(shí)代,早期網(wǎng)絡(luò)輿情監(jiān)測(cè)方式的局限性表現(xiàn)得日漸明顯,其監(jiān)測(cè)功能已經(jīng)弱化而無(wú)法適應(yīng)新的輿論環(huán)境。

二、大數(shù)據(jù)技術(shù)下的網(wǎng)絡(luò)輿情監(jiān)測(cè)

Web2.0時(shí)代最突出的特征就是更緊密的網(wǎng)狀結(jié)構(gòu)。用戶自主生成內(nèi)容使網(wǎng)絡(luò)內(nèi)容生產(chǎn)者數(shù)量呈幾何級(jí)增長(zhǎng),用戶與網(wǎng)站之間雙向交互,用戶與用戶之間也在進(jìn)行多渠道、多層次的立體的交互。Web2.0的網(wǎng)絡(luò)內(nèi)容不再是離散的,具有強(qiáng)烈的“關(guān)系”屬性。這種基于各種強(qiáng)弱關(guān)系的網(wǎng)狀結(jié)構(gòu),也直接使網(wǎng)絡(luò)輿情能夠快速成型、發(fā)酵,短時(shí)間內(nèi)可以多次轉(zhuǎn)向。Web2.0時(shí)代的輿情監(jiān)測(cè),更關(guān)注“關(guān)系”,能夠更快速、更準(zhǔn)確地跟蹤輿情變化。這正是早期網(wǎng)絡(luò)輿情監(jiān)測(cè)的缺陷。

新的輿論環(huán)境,需要加強(qiáng)網(wǎng)絡(luò)輿情的監(jiān)測(cè),而新的網(wǎng)絡(luò)輿情,需要新的監(jiān)測(cè)方式。大數(shù)據(jù)技術(shù)下的網(wǎng)絡(luò)輿情監(jiān)測(cè),就是這樣一種新的方式。

自1980年以來(lái),全球的數(shù)據(jù)存儲(chǔ)能力每40個(gè)月就翻一倍。不斷進(jìn)行量級(jí)上的增加的龐大數(shù)據(jù)量和數(shù)據(jù)背后蘊(yùn)藏的信息,帶來(lái)了大數(shù)據(jù)時(shí)代。

大數(shù)據(jù)通常指的是龐大、復(fù)雜,難以用傳統(tǒng)的軟件工具來(lái)分析處理的數(shù)據(jù)集。對(duì)大數(shù)據(jù)的處理,又牽涉到從數(shù)據(jù)抓取、整理、分析、共享、可視化到存儲(chǔ)、傳輸?shù)纫幌盗袉?wèn)題。大數(shù)據(jù)集合常常來(lái)源于日常生活,與人的行動(dòng)、交往有一定的同構(gòu)性,部分條目直接附加了時(shí)間、地理等信息??梢哉f(shuō),在大數(shù)據(jù)的數(shù)據(jù)集合中天然蘊(yùn)含著各種關(guān)系。因此,大數(shù)據(jù)集合能提供同數(shù)據(jù)量的若干小數(shù)據(jù)集合無(wú)法帶來(lái)的新信息。人們可以通過(guò)數(shù)據(jù)挖掘?qū)ふ覕?shù)據(jù)之間的聯(lián)系,確立數(shù)據(jù)之間相關(guān)關(guān)系的規(guī)律,進(jìn)而提供多方面的預(yù)測(cè)。

顯而易見(jiàn),大數(shù)據(jù)處理技術(shù)的優(yōu)勢(shì),正契合了Web2.0時(shí)代的特點(diǎn)。正因?yàn)榇髷?shù)據(jù)在挖掘數(shù)據(jù)之間的關(guān)系、進(jìn)行發(fā)展趨勢(shì)預(yù)測(cè)方面的能力,已經(jīng)有很多機(jī)構(gòu)借助其進(jìn)行輿情監(jiān)測(cè)和呈現(xiàn),并取得了不俗的成績(jī)。譬如在新聞業(yè),就有不少國(guó)際傳媒機(jī)構(gòu)已經(jīng)在各種項(xiàng)目中采用了大數(shù)據(jù)分析和數(shù)據(jù)可視化技術(shù),如BBC以及《衛(wèi)報(bào)》《華盛頓郵報(bào)》《紐約時(shí)報(bào)》等。

三、大數(shù)據(jù)帶來(lái)輿情預(yù)測(cè)的新可能

“預(yù)測(cè)”本身就是大數(shù)據(jù)的一個(gè)重要應(yīng)用。針對(duì)同一主題的海量數(shù)據(jù)進(jìn)行分析,經(jīng)過(guò)數(shù)據(jù)挖掘和建模后,可以得到相應(yīng)的預(yù)測(cè)模型,進(jìn)而預(yù)測(cè)將來(lái)的發(fā)展趨勢(shì)。譬如奧巴馬競(jìng)選團(tuán)隊(duì),就在2012年競(jìng)選的多個(gè)環(huán)節(jié)運(yùn)用了大數(shù)據(jù)技術(shù),特別是在實(shí)時(shí)監(jiān)測(cè)選民意向、預(yù)測(cè)投票情況方面。競(jìng)選團(tuán)隊(duì)每晚都會(huì)使用特制的模擬大選的模型,根據(jù)實(shí)時(shí)監(jiān)測(cè)的選民意向模擬大選,并在第二天上午根據(jù)模擬結(jié)果對(duì)各州重新分配競(jìng)選資源。這種對(duì)輿情的實(shí)時(shí)監(jiān)控和預(yù)測(cè)對(duì)奧巴馬2012年總統(tǒng)連任起到了重要作用。

麻省理工學(xué)院博士?jī)?nèi)森·凱樂(lè)斯的一項(xiàng)以2013年埃及爆發(fā)的民眾抗議活動(dòng)的大數(shù)據(jù)預(yù)測(cè)為主要案例的研究,獲取了全球范圍主流媒體新聞、政府出版物、社交媒體、博客等各種類(lèi)型超過(guò)三百萬(wàn)個(gè)數(shù)據(jù)源的目標(biāo)數(shù)據(jù)。其證明可以通過(guò)大數(shù)據(jù)技術(shù)和特定模型來(lái)發(fā)掘公眾的情緒、態(tài)度變化,并最終預(yù)測(cè)以大型抗議活動(dòng)為代表的大型公共事件的發(fā)生,包括事件即將發(fā)生的時(shí)間地點(diǎn)。

而這還僅僅是一個(gè)開(kāi)始。大數(shù)據(jù)有不同的來(lái)源,互聯(lián)網(wǎng)中以自媒體為代表的各種原創(chuàng)內(nèi)容持續(xù)爆炸式增長(zhǎng),各種移動(dòng)通訊設(shè)備、可穿戴設(shè)備也在不停地產(chǎn)生和存儲(chǔ)、傳遞各種數(shù)據(jù),除此之外的數(shù)據(jù)來(lái)源還有麥克風(fēng)、攝像頭記錄的音頻、視頻數(shù)據(jù),運(yùn)營(yíng)數(shù)據(jù),遙感數(shù)據(jù)等等。

按照來(lái)源不同,數(shù)據(jù)大致可以分為三類(lèi),即以自媒體內(nèi)容為代表的用戶原創(chuàng)數(shù)據(jù)、各種經(jīng)營(yíng)活動(dòng)中產(chǎn)生的運(yùn)營(yíng)數(shù)據(jù)(如銷(xiāo)售記錄、醫(yī)療記錄等)、感知數(shù)據(jù)(如各種可穿戴設(shè)備獲取的數(shù)據(jù))。其中用戶原創(chuàng)數(shù)據(jù)對(duì)輿情監(jiān)測(cè)的重要性已經(jīng)顯現(xiàn),而對(duì)其他數(shù)據(jù)來(lái)源的大數(shù)據(jù)分析、不同數(shù)據(jù)來(lái)源的融合分析,也蘊(yùn)含著巨大的輿情預(yù)測(cè)潛力。

第8篇:社交媒體文本分析范文

近年來(lái), 一點(diǎn)資訊巧妙運(yùn)用強(qiáng)迫癥的廣告形式,意圖目標(biāo)明確,不彎不繞。在信息多元時(shí)代,用戶記憶每天反復(fù)被大量冗雜信息覆蓋,這種通俗式的廣告往往奪人眼球,令人記憶深刻繼而引發(fā)關(guān)注和討論,毫無(wú)疑問(wèn),一點(diǎn)資訊在此次文案上有效抓住了移動(dòng)資訊時(shí)代趨勢(shì)的命脈,能夠有利于自身品牌知名度提升,有策略地引導(dǎo)用戶。

全球首創(chuàng)“興趣引擎”,新一代門(mén)戶誕生

一點(diǎn)資訊是融合關(guān)鍵字搜索、訂閱和個(gè)性化推薦的咨詢聚合產(chǎn)品,用獨(dú)創(chuàng)的興趣引擎技術(shù),將搜索整合到資訊APP中,推薦與用戶搜索關(guān)鍵字、瀏覽軌跡相匹配的資訊,并在過(guò)程中幫助用戶更好地發(fā)現(xiàn)、表達(dá)、獲取和管理有價(jià)值的內(nèi)容。

“興趣引擎”是一點(diǎn)資訊獨(dú)創(chuàng)的專利技術(shù),他是在底層技術(shù)架構(gòu)上把搜索引擎和推薦引擎有機(jī)交融,提取了搜索引擎的數(shù)據(jù)爬取、文本分析等技術(shù)優(yōu)勢(shì),結(jié)合了推薦引擎利用個(gè)人畫(huà)像推送內(nèi)容的形式,可智能分析用戶興趣愛(ài)好,從而用戶精準(zhǔn)推薦他們真正感興趣的內(nèi)容。一點(diǎn)資訊在全網(wǎng)內(nèi)容抓取,覆蓋圖文、視頻及音頻,日更新量50萬(wàn),收錄超過(guò)300萬(wàn)個(gè)頻道,并有針對(duì)時(shí)尚、養(yǎng)生、科技等垂直領(lǐng)域的一點(diǎn)X系列資訊應(yīng)用,滿足各種興趣,實(shí)現(xiàn)私人定制的精準(zhǔn)分發(fā),

另外一項(xiàng)優(yōu)勢(shì)便是精準(zhǔn)的算法,像現(xiàn)在傳統(tǒng)的APP根據(jù)點(diǎn)擊的情況來(lái)推送你感興趣的內(nèi)容,再加上一部分正常媒體的推廣,比如說(shuō)我感興趣旅游的東西,傳統(tǒng)APP慢慢地就只會(huì)推送這些給我,這個(gè)范圍就會(huì)越來(lái)越窄,而一點(diǎn)的搜索引擎會(huì)對(duì)同興趣同年齡喜歡范圍內(nèi)的我們都會(huì)推送給你,這樣你的興趣圈子就擴(kuò)大了,了解度也會(huì)更多。

以此為出發(fā)點(diǎn),一點(diǎn)資訊不斷創(chuàng)新,近日先后推出“興趣夾”、“興趣身份”等創(chuàng)新功能,據(jù)了解,以后還將推出“興趣社交”,以興趣為引找到志同道合的朋友,以及“興趣廣告”,最大化商業(yè)價(jià)值。

多年沉淀后,引來(lái)厚積薄發(fā)的時(shí)代

一點(diǎn)資訊多年來(lái)一直只做自己的產(chǎn)品、完善自己的客戶端,直到2013年在中國(guó)正式開(kāi)始運(yùn)營(yíng)APP,短短兩三年的時(shí)間就參與了兩屆廣告節(jié),并在業(yè)界有不小知名度。在嶄露頭角后,和以往的推廣不同,這次一點(diǎn)資訊在全國(guó)范圍內(nèi)統(tǒng)一時(shí)間投放,不論是地鐵公交還是線上,都進(jìn)行了相應(yīng)位置的宣傳,從近日線上多家媒體平臺(tái)的幾番預(yù)熱,到《新京報(bào)》、《重慶晨報(bào)》、《每日新報(bào)》、《今晚報(bào)》4家紙媒頭版醒目登場(chǎng),至北、上、廣、深、武漢、??诘热珖?guó)一二線主要城市全覆蓋的地鐵、公交站牌、機(jī)場(chǎng)、公交車(chē)身、戶外大屏等線下場(chǎng)所的集中“轟炸”,再到與杜蕾斯、IMAX、樂(lè)視、神州專車(chē)等80余家國(guó)內(nèi)外重量級(jí)企業(yè)的“魔性打碼”微博互動(dòng),“一點(diǎn)藍(lán)”打碼品牌投放可謂真正實(shí)現(xiàn)了“線上線下”營(yíng)銷(xiāo)的有機(jī)打通。多家營(yíng)銷(xiāo)界專業(yè)媒體紛紛對(duì)一點(diǎn)資訊此次品牌推廣贊譽(yù)有加,并稱贊其或許是近年來(lái)在移動(dòng)資訊行業(yè)中最優(yōu)秀的內(nèi)容營(yíng)銷(xiāo)案例。

而這一次在全國(guó)范圍內(nèi)大規(guī)模廣告投放,引發(fā)了公眾的強(qiáng)烈關(guān)注,海口也在其范圍之內(nèi),一點(diǎn)資訊選擇在??谶M(jìn)行宣傳也正是因?yàn)榭粗泻D献鳛閲?guó)際旅游島能帶來(lái)大量的人流量。通過(guò)這次廣告節(jié)一點(diǎn)資訊拿到了很多海南本地的廣告合作需求。

現(xiàn)代廣告宣傳的方式進(jìn)入新時(shí)代

20世紀(jì)以來(lái),世界上一些發(fā)達(dá)國(guó)家的消費(fèi)者已逐步形成對(duì)廣告的依賴性。這是因?yàn)閺V告可以不斷地向廣大消費(fèi)者提供許多有關(guān)生活的信息,為消費(fèi)者進(jìn)行消費(fèi)活動(dòng)創(chuàng)造便利,從而豐富了消費(fèi)者的生活,增長(zhǎng)了消費(fèi)者的知識(shí),開(kāi)闊了消費(fèi)者的視野,尤其是借助技術(shù),大數(shù)據(jù)驅(qū)動(dòng)的創(chuàng)意廣告,再通^精準(zhǔn)分發(fā)給需要的人群?,F(xiàn)在來(lái)說(shuō)廣告不是打擾,而是有價(jià)值的信息。

近年來(lái)廣告業(yè)的發(fā)展,已經(jīng)由傳統(tǒng)的模式進(jìn)入到科技新時(shí)代,互聯(lián)網(wǎng)移動(dòng)也從一個(gè)簡(jiǎn)單的信息推廣平臺(tái),變成了人與人之間、人與物之間、人與品牌之間的鏈接載體,通過(guò)互聯(lián)網(wǎng),消費(fèi)者可以迅速的、便捷的獲取全面廣泛的信息,現(xiàn)代廣告比以前更加精準(zhǔn),有效轉(zhuǎn)化率更高(您看到廣告以后是否能夠引起您對(duì)他的興趣,轉(zhuǎn)換成消費(fèi),這個(gè)就叫做有效轉(zhuǎn)化。)精準(zhǔn)推廣,這個(gè)是傳統(tǒng)廣告做不到的。

未來(lái)產(chǎn)業(yè)鏈將繼續(xù)細(xì)分,媒體將集中創(chuàng)造內(nèi)容,因?yàn)槊襟w的真正價(jià)值是內(nèi)容的生產(chǎn),這個(gè)價(jià)值是技術(shù)、人工智能永遠(yuǎn)無(wú)法取代的。而一點(diǎn)資訊可以以最高效地把內(nèi)容傳遞給用戶,讓他們最后能夠有所收獲。

一點(diǎn)資訊,實(shí)現(xiàn)人與資訊的高效連接

第23屆中國(guó)國(guó)際廣告節(jié)作為全球廣告行業(yè)的一大盛事,來(lái)自國(guó)內(nèi)外的多家知名廣告主、領(lǐng)軍企業(yè)、主流媒體和業(yè)內(nèi)專家匯集于此。在品牌營(yíng)銷(xiāo)創(chuàng)意方面,一點(diǎn)資訊以“1.”進(jìn)行打碼的方式引爆全國(guó)大中小城市,從而提高品牌與用戶的互動(dòng)性。現(xiàn)代青年記者對(duì)一點(diǎn)資訊商業(yè)化部經(jīng)理雷磊進(jìn)行了采訪。

現(xiàn)代青年:近段時(shí)間在各大城市公交車(chē)站的打碼廣告引起了很大的關(guān)注,這個(gè)創(chuàng)意方式從何而來(lái)?

雷磊:首先說(shuō)說(shuō)公交站牌的廣告,因?yàn)榇蠹以诠徽就A舻臅r(shí)間很短,由于廣告載體的限制,決定了這個(gè)廣告的載體只能做廣告推廣,為了加強(qiáng)大眾對(duì)我們的品牌印象,我們選擇了強(qiáng)迫癥的方式,旨在引起大眾的好奇心和興趣,這也是我們的本原。但總的來(lái)說(shuō),我們強(qiáng)項(xiàng)是在內(nèi)容策劃上。

現(xiàn)代青年:據(jù)了解此次是你們第二次參加廣告節(jié),本次廣告節(jié)有何收獲和感受?

雷磊:這屆廣告節(jié)一點(diǎn)資訊獲得了37個(gè)大獎(jiǎng),其中最有含金量的是長(zhǎng)城獎(jiǎng)。通過(guò)這次廣告節(jié)而言,收獲就是我們發(fā)現(xiàn)廣告的推廣,做內(nèi)容的話對(duì)品牌還是很有效果的,同時(shí)要做一些相關(guān)的活動(dòng),要全方位組合推廣。

現(xiàn)代青年:一點(diǎn)咨詢最大的優(yōu)勢(shì)在哪里?

雷磊:像現(xiàn)在傳統(tǒng)的APP根據(jù)您點(diǎn)擊的情況來(lái)推送你感興趣的內(nèi)容,再加上一部分正常媒體的推廣,比如說(shuō),我感興趣旅游的東西,傳統(tǒng)APP就限定的只推送旅游咨詢,而我們的搜索引擎,會(huì)將同興趣愛(ài)好的人還感興趣的事情,或同興趣同年齡喜歡的內(nèi)容也會(huì)推送給你,這樣你的興趣圈子就擴(kuò)大了,了解度也會(huì)更多,不會(huì)越來(lái)越窄,我們還可以創(chuàng)建自己興趣愛(ài)好的關(guān)鍵詞,可以在APP里建立自己的文件夾,這個(gè)不限制專用的詞匯。

現(xiàn)代青年:傳統(tǒng)的廣告宣傳方式與現(xiàn)在的有何不同?

雷磊:現(xiàn)在比以前更精準(zhǔn),轉(zhuǎn)化率更高,當(dāng)您看到廣告以后是否能夠引起您對(duì)他的興趣,轉(zhuǎn)換成消費(fèi),這個(gè)就叫做有效轉(zhuǎn)化。可以做到精準(zhǔn)推廣,這個(gè)是傳統(tǒng)廣告做不到的。

第9篇:社交媒體文本分析范文

[關(guān)鍵詞]目的論;廣告;廣告翻譯

經(jīng)濟(jì)全球化深深影響著翻譯界。隨著國(guó)際化經(jīng)濟(jì)交往的日益增加,廣告翻譯也以驚人的速度增長(zhǎng)。傳播媒體越來(lái)越多樣化,如報(bào)紙、廣播、電視、國(guó)際互聯(lián)網(wǎng)等,而他們的生存都要依靠廣告。翻譯者發(fā)現(xiàn)自己無(wú)時(shí)無(wú)刻不在進(jìn)行跨文化交際。

一、功能派翻譯理論的目的論

什么樣的譯文才是好譯文?大部分人都認(rèn)為譯文應(yīng)該準(zhǔn)確清楚地表達(dá)原文的意思。確實(shí),傳統(tǒng)上許多語(yǔ)言學(xué)家都認(rèn)為譯文應(yīng)該從文體以及其他語(yǔ)言學(xué)特征上與原文相同。然而20世紀(jì)60年代以來(lái),在翻譯理論和實(shí)踐上出現(xiàn)了一種熱潮,人們認(rèn)為應(yīng)該讓譯文和原文在語(yǔ)言的功能上對(duì)等,而不是在語(yǔ)言的形式上對(duì)應(yīng),即看讀者是否能獲得和原文一樣的心理反應(yīng)。

Nida認(rèn)為功能對(duì)等就是要讓譯文和原文在語(yǔ)言的功能上對(duì)等,是讀者心理反應(yīng)的對(duì)等,而不是在語(yǔ)言的形式上對(duì)應(yīng)。對(duì)等不能只局限在文字本身,他把判斷對(duì)等與否的大權(quán)交給了讀者的心理反應(yīng)[1]。在Nida看來(lái),翻譯就是要在目的語(yǔ)中以最自然的方式重現(xiàn)原文中的信息,首先是重現(xiàn)意義,然后是風(fēng)格。最好的譯文讀起來(lái)應(yīng)該不像譯文。要讓原文和譯文對(duì)等就必須使譯文自然,使譯文在譯文讀者心中的反應(yīng)和原文在原文讀者心中的反應(yīng)相似。

Vermeer的目的性理論(skopostheories)就很好地解決了這個(gè)問(wèn)題。目的論是功能翻譯理論中最重要的理論,最早是由德國(guó)學(xué)者費(fèi)米爾(VemeerHansJ)于1978年在《普通翻譯理論框架》一書(shū)中首次提出的,是功能派翻譯理論中最重要的理論。德國(guó)的功能翻譯派理論始于20世紀(jì)70年代。其代表人物是卡塔琳娜萊斯(KatharinaReiss),費(fèi)米爾(HansJ.Vermeer)和克里斯蒂安諾德(ChristianeNord)。諾德進(jìn)一步完善了目的論。諾德給翻譯下的定義為:“翻譯是創(chuàng)作使其發(fā)揮某種功能的譯語(yǔ)文本。它與其原語(yǔ)文本保持的聯(lián)系將根據(jù)譯文預(yù)期或所要求的功能得以具體化。翻譯使由于客觀存在的語(yǔ)言文化障礙而無(wú)法進(jìn)行的交際行為得以順利進(jìn)行?!保?]諾德以譯文的目的為準(zhǔn)則,為譯文的改譯和增刪提供了標(biāo)準(zhǔn)。根據(jù)目的論,翻譯遵循的首要法則就是目的,即一切翻譯行為所要達(dá)到的目的決定整個(gè)翻譯行為的過(guò)程(Theendjustifiesthemeans)(Nord,2001)。諾德將翻譯的目的分為三種:譯者的目的(如賺錢(qián)),譯文在譯語(yǔ)文化中的交際目的(如傳遞信息)以及使用特定的翻譯策略或手段所要達(dá)到的目的(如使用直譯以體現(xiàn)源語(yǔ)的語(yǔ)言結(jié)構(gòu))。通常情況下,“目的”是指譯文的交際目的。那么目的從何而來(lái)呢?目的論認(rèn)為,翻譯過(guò)程的發(fā)起者(initiator)決定譯文的交際目的,但當(dāng)發(fā)起者因?qū)I(yè)知識(shí)不足或其他原因?qū)ψg文目的不甚明了的時(shí)候,譯者可以與發(fā)起者協(xié)商,從特殊的翻譯情況中得出譯文目的[3]。目的性原則要求譯者在整個(gè)翻譯過(guò)程中的參照系不應(yīng)是對(duì)等翻譯理論所強(qiáng)調(diào)的原文和功能,而應(yīng)是譯文在譯語(yǔ)文化環(huán)境中所要達(dá)到的一種或幾種交際功能,即應(yīng)以實(shí)現(xiàn)譯文在譯語(yǔ)文化中的預(yù)期功能為首要原則[4]。

功能派創(chuàng)造性地提出的目的性原則,突破了對(duì)等理論的限制,修正了傳統(tǒng)的“忠實(shí)”標(biāo)準(zhǔn),擴(kuò)展了可譯性范圍,并增加了翻譯策略,要求翻譯活動(dòng)必須依據(jù)翻譯目的,以文本目的為翻譯過(guò)程的第一準(zhǔn)則使得翻譯更貼近實(shí)際,對(duì)廣告翻譯工作具有重要的指導(dǎo)意義。

二、廣告翻譯的目的性和特征

目的論認(rèn)為,譯文的預(yù)期目的和功能決定翻譯的方法。英國(guó)翻譯理論家紐馬克(PeterNewmark,1981)在他的《翻譯方法》(ApproachestoTranslation)一書(shū)中,根據(jù)文本不同的內(nèi)容、文體和功能,把文本分成三種類(lèi)型:信息文本、表達(dá)文本、呼喚性文本。廣告被列入呼喚性文本[5]。不同類(lèi)別的文體有不同的目的和功能,因而對(duì)翻譯的要求和翻譯策略的選擇也各有不同。要做好廣告翻譯,首先要弄清廣告文本的目的和功能。

著名的美國(guó)市場(chǎng)營(yíng)銷(xiāo)協(xié)會(huì)(AmericanMarketingAssociationAMA)給廣告下了這樣的定義:Advertisingisthenonpersonalcommunicationofinformationusuallypaidforandusuallypersuasiveinnatureaboutproducts,servicesorideasbyidentifiedsponsorsthroughthevariousmedia.(廣告是由特定的廣告主通常以付費(fèi)的方式,通過(guò)各種傳播媒體對(duì)產(chǎn)品、勞務(wù)或觀念等信息的非人員介紹及推廣)。另外有種說(shuō)法是“廣告是個(gè)人或組織通過(guò)有償取得的媒介,向一定的社會(huì)群體宣傳其商品、服務(wù)或觀念,并勸說(shuō)他們購(gòu)買(mǎi)或采取相應(yīng)行為的活動(dòng)”。據(jù)此可知,廣告作為一種競(jìng)爭(zhēng)性的商業(yè)行為,其目的是爭(zhēng)取消費(fèi)者,因而必然是以消費(fèi)者為中心,投消費(fèi)者之所好,供消費(fèi)者之所需,以打動(dòng)他們的心弦,促成其購(gòu)買(mǎi)活動(dòng)。這是商業(yè)廣告的唯一目的,也是商業(yè)廣告翻譯的唯一目的。

一般來(lái)說(shuō),廣告須遵循KISS原則,即“Keepitshortandsweet”。廣告應(yīng)力求簡(jiǎn)潔,一方面為商家節(jié)約投資,另一方面利于消費(fèi)者的接受。不同文化的消費(fèi)者有不同的價(jià)值取向,因此,廣告文體風(fēng)格也會(huì)因地域和文化背景而有所不同。在翻譯廣告時(shí),譯者要特別注意去了解目的語(yǔ)文化的廣告規(guī)范,使譯文風(fēng)格符合譯語(yǔ)讀者的品味。也就是說(shuō),廣告翻譯要遵循譯入語(yǔ)的廣告語(yǔ)體風(fēng)格,要尊重譯語(yǔ)文化,注重譯文讀者的反映。只有這樣,才能確保廣告翻譯實(shí)現(xiàn)它的預(yù)期功能,有效地把產(chǎn)品介紹給譯入語(yǔ)消費(fèi)者,并促其購(gòu)買(mǎi)產(chǎn)品。

目的論在廣告翻譯中的運(yùn)用

三、目的論在廣告翻譯中的應(yīng)用

目的性法則決定了譯者在廣告翻譯中應(yīng)考慮以下三個(gè)因素:譯文語(yǔ)體、讀者反映和譯語(yǔ)文化。廣告翻譯方法的選擇要由具體語(yǔ)篇的目的或功能來(lái)決定。也就是說(shuō),翻譯行為所要達(dá)到的目的決定整個(gè)翻譯行為的過(guò)程。

(一)廣告翻譯要符合譯語(yǔ)廣告文體的語(yǔ)言風(fēng)格

由于地理環(huán)境、社會(huì)環(huán)境、生活方式的不同,中西民族形成了不同的審美習(xí)慣。中國(guó)美學(xué)強(qiáng)調(diào)中和之美、含蓄之美,重主觀印象。這種美學(xué)標(biāo)準(zhǔn)表現(xiàn)出注重平衡、協(xié)調(diào)、融和的審美特征。表現(xiàn)在語(yǔ)言上就是講求音韻和諧,形式對(duì)稱,用詞空泛含蓄,具有強(qiáng)烈的主觀色彩。西方哲學(xué)強(qiáng)調(diào)分析型抽象理性思維,重理性,重形式,強(qiáng)調(diào)主客體分明。這種審美觀表現(xiàn)在語(yǔ)言形式上就形成了用詞平實(shí)明快,句式結(jié)構(gòu)嚴(yán)謹(jǐn),修辭重簡(jiǎn)潔的特點(diǎn)。這種思維審美心理上的差別表現(xiàn)在廣告語(yǔ)言上就是英語(yǔ)廣告常使用一些簡(jiǎn)單樸實(shí)的詞句,體現(xiàn)為一種簡(jiǎn)潔明快的美;而漢語(yǔ)廣告常常辭藻華麗,成語(yǔ)迭用,體現(xiàn)出一種華麗的美[6]。如:

嶗山,林木蒼翠,繁花似錦,到處生機(jī)盎然,春天綠芽紅花,夏天濃蔭蔽日,秋天遍谷金黃,冬天玉樹(shù)瓊花。其中更不乏古樹(shù)名木。景區(qū)內(nèi),古樹(shù)名木有近300株,50%以上為國(guó)家一類(lèi)保護(hù)植物,著名的有銀杏、檜柏等。

這則介紹嶗山的漢語(yǔ)廣告采用了中國(guó)人喜愛(ài)的四言八句式,形式對(duì)稱、辭藻華美,讀起來(lái)音韻和諧,迎合中國(guó)人的審美心理,很容易獲得預(yù)期的效果。但譯成英語(yǔ)時(shí),就需要考慮社交語(yǔ)境的審美心理,刪去無(wú)意義的信息,再現(xiàn)原文的內(nèi)涵意義,突出信息傳遞的客觀性和可靠性。因此可譯如下:

LaoshanScenicAreaisthicklycoveredwithtreesofmanyspecies,whichaddcreditforitsscenery.Amongthemover300areconsideredrareandprecious,halfofwhichareunderStatetop-levelprotection.Themostfamousspeciesincludegingkoandcypress.

又如我們通常會(huì)碰到這樣的廣告:“XX已獲得國(guó)際和國(guó)內(nèi)大獎(jiǎng)”、“省優(yōu)部?jī)?yōu)”等等,這主要與中國(guó)人較相信權(quán)威有關(guān),但在提倡“個(gè)性”的西方國(guó)家,人們可能更注重個(gè)人的品位,不大在意官方的評(píng)論,這樣的廣告對(duì)西方人來(lái)說(shuō)是晦澀難懂。我們更多地應(yīng)該以實(shí)驗(yàn)數(shù)據(jù)、客觀事實(shí)來(lái)說(shuō)話,以符合西方文化觀念和習(xí)用語(yǔ)言結(jié)構(gòu)模式,達(dá)到刺激購(gòu)買(mǎi)欲望的目的。

(二)廣告翻譯應(yīng)注重譯文讀者的感受

目的性法則決定了廣告翻譯應(yīng)注重譯文讀者的感受,迎合消費(fèi)者心理。由于宣傳對(duì)象在政治、經(jīng)濟(jì)、文化等方面的不同背景,為了投其所好、避其所忌,同一條廣告的翻譯,針對(duì)不同的宣傳對(duì)象會(huì)有不同的版本。為了達(dá)到商業(yè)目的,譯者甚至可以不顧原文而再造一條廣告。

例如Whisper衛(wèi)生巾漢語(yǔ)音譯為“護(hù)舒寶”?!癢hisper”的英文意思是耳語(yǔ)、密談,其意富含女性用品的形象性和女性味。而翻譯為中文時(shí),則傳達(dá)給中國(guó)女性消費(fèi)者該產(chǎn)品的功能和優(yōu)良品質(zhì)。寶潔公司的洗發(fā)用品Head&Shoulder漢譯為“海飛絲”也是一個(gè)佳例。如果僅根據(jù)原文直譯為頭和肩或像臺(tái)灣翻譯為“海倫仙杜絲”,消費(fèi)者聽(tīng)到或讀到都茫然不知所謂。而譯為“海飛絲”,詞義的高雅文體和語(yǔ)用特征很容易就使人們聯(lián)想起洗發(fā)類(lèi)產(chǎn)品。電視廣告配以青春少女飄逸柔順的秀發(fā)隨風(fēng)飛揚(yáng)的畫(huà)面,在消費(fèi)者中自然會(huì)激發(fā)強(qiáng)烈的購(gòu)買(mǎi)欲望。又如舉世聞名的“CocaCola”的中文譯名“可口可樂(lè)”。Coca乃南美產(chǎn)的藥用植物,Cola則為非洲產(chǎn)的硬殼果樹(shù)木。這兩個(gè)詞除了表示兩種植物的名稱,似無(wú)其他的含義。它的中譯不僅雙聲(可、口)疊韻(可、樂(lè)以國(guó)語(yǔ)為準(zhǔn))順口,還可口,還可樂(lè),符合中國(guó)的消費(fèi)者的傳統(tǒng)觀念,也就是凡事圖喜慶,可以說(shuō)這種譯名對(duì)此汽水在中國(guó)的風(fēng)行有著巨大的影響。

(三)廣告翻譯應(yīng)尊重譯語(yǔ)文化

從目的論上看,翻譯要求由目的語(yǔ)文化決定,原文只是起提供信息的作用,譯者只有綜合考慮了廣告的翻譯要求才能在翻譯中更好實(shí)現(xiàn)廣告目的,最有效的翻譯不一定是忠實(shí)地再現(xiàn)原文。因此在廣告翻譯中,必須避免由于過(guò)分強(qiáng)調(diào)忠實(shí)而忽略翻譯目的,忽略目的文化環(huán)境而導(dǎo)致的翻譯失敗。一種出口干電池的商標(biāo)叫“白象”,英譯成“WhiteElephant”。象在中國(guó)是吉祥的象征,可是awhiteelephant在英語(yǔ)中意為“沉重的負(fù)擔(dān)”(aburdensomepossession)或“無(wú)用而累贅的東西”(useless)。這樣的翻譯顯然是失敗的。再如,“鴛鴦?wù)怼痹谥袊?guó)文化中象征夫妻恩愛(ài),但如果譯成“MandarinDucksPillowcase”,其語(yǔ)用效果就會(huì)大打折扣,難以實(shí)現(xiàn)廣告翻譯的目的,不妨將其譯為“LovebirdsPillowacse”更符合西方消費(fèi)者的審美心理,并促成其購(gòu)買(mǎi)行動(dòng)的實(shí)現(xiàn)。又如:

在四川西部,有一美妙去處,它背依岷山主峰雪寶頂,樹(shù)木蒼翠,花香襲人,鳥(niǎo)聲婉轉(zhuǎn),流水潺潺,它就是松潘縣的黃龍。

OneofSichuan''''sfinestspotsisHuanglong,whichliesinSongpanjustbeneathXuebao,themainpeakoftheMinshanMoutain.Ithaslushgreenforestsfilledwithfragrantflowers,bubblingstreamsandsingingbirds.

翻譯這段旅游廣告時(shí),譯者注意到了中西方的文化差異,沒(méi)有把黃龍譯成“YellowDragon”,而是根據(jù)譯文的文化語(yǔ)境譯為“Huanglong”。在多元化的世界里,因各民族制度、信仰、道德觀和價(jià)值觀千差萬(wàn)別,人們往往對(duì)同一事物有著不同的聯(lián)想、看法和理解。語(yǔ)言是文化的一部分,但語(yǔ)言像一面鏡子反映著民族的全部文化。語(yǔ)言禁忌反映了風(fēng)俗的不同。文化差異影響著廣告譯文預(yù)期目的的實(shí)現(xiàn)。因此,一個(gè)成功的廣告翻譯需要譯者巧妙處理廣告所要傳達(dá)的信息及不同國(guó)家間的語(yǔ)言文化差異。譯者不能僅僅局限于原文,還必須注意原廣告中的文化意義,甚至還要根據(jù)受眾國(guó)的情況表現(xiàn)和豐富原文中沒(méi)有的文化內(nèi)涵,使廣告中的民族和傳統(tǒng)文化更好地表達(dá)出來(lái),從而達(dá)到宣傳產(chǎn)品,促進(jìn)銷(xiāo)售的目的。廣告翻譯中文化意義的有效轉(zhuǎn)換不僅能產(chǎn)生經(jīng)濟(jì)效益,還能產(chǎn)生良好的社會(huì)效益。

四、結(jié)語(yǔ)

翻譯是一項(xiàng)有目的的活動(dòng),應(yīng)以實(shí)現(xiàn)譯文的預(yù)期功能為首要原則,即遵循譯文的目的性原則。廣告是一種功能性很強(qiáng)的實(shí)用文體,廣告翻譯也應(yīng)遵循譯文的目的性原則,使廣告功能在譯語(yǔ)文化中順利再現(xiàn)。為此,廣告翻譯應(yīng)從譯文語(yǔ)體、讀者反應(yīng)以及譯語(yǔ)文化三個(gè)方面著手,采取各種靈活的譯法,最終確保譯文功能的順利實(shí)現(xiàn)。

[參考文獻(xiàn)]

[1]NidaEA.TowardaScienceofTranslating[M].Leiden:Brill,1964:23-25.

[2]NordChristiane.TextAnalysisinTranslation[M].Amsterdam-Atlanta:GA,1991:28.

[3]仲偉合,鐘鈺.德國(guó)的功能派翻譯理論[J].中國(guó)翻譯,1999(3):49.

[4]陳小慰.翻譯功能理論的啟示[J].中國(guó)翻譯,2000,(4):9-12.

相關(guān)熱門(mén)標(biāo)簽