黃志敏:數(shù)據(jù)可視化是大數(shù)據(jù)分析的重要手段
2015-03-27 12:38:00 來(lái)源:央廣網(wǎng)

央廣網(wǎng)北京3月27日消息 3月27日,由中央人民廣播電臺(tái)新媒體宣傳中心、河北大學(xué)新聞傳播學(xué)院、中國(guó)社會(huì)科學(xué)院世界傳媒研究中心、中國(guó)科技新聞學(xué)會(huì)網(wǎng)絡(luò)媒體專業(yè)委員會(huì)共同主辦的“首屆大數(shù)據(jù)時(shí)代創(chuàng)新與媒體變革研討會(huì)”在京舉行,本次研討會(huì)以“時(shí)代創(chuàng)新 媒介變革”為主題,圍繞大數(shù)據(jù)時(shí)代全球網(wǎng)絡(luò)文化發(fā)展趨勢(shì),探討全球媒介創(chuàng)新發(fā)展未來(lái)。網(wǎng)絡(luò)文化建設(shè)和管理部門、科研院校、國(guó)家核心學(xué)術(shù)期刊負(fù)責(zé)人、專家、學(xué)者共200人出席會(huì)議。
財(cái)新傳媒首席技術(shù)官、財(cái)新數(shù)據(jù)可視化實(shí)驗(yàn)室負(fù)責(zé)人黃志敏在研討會(huì)上作主旨報(bào)告。他表示,數(shù)據(jù)可視化其實(shí)有很多不同的描述和定義?梢暬且粋(gè)計(jì)算機(jī)科學(xué)方面的,或者圖形學(xué)方面的概念,可以分為三塊。其中第一塊叫科學(xué)可視化,例如地圖、醫(yī)院的CT、鐘表都是科學(xué)可視化。第二塊是信息可視化,例如路邊拍違反交規(guī)就是很典型的標(biāo)識(shí)。第三塊是可視化分析,例如K線交易,一個(gè)曲線體現(xiàn)成交量,最高價(jià)最低價(jià)等等。當(dāng)把可視化用在新聞?lì)I(lǐng)域的話,就成了數(shù)據(jù)新聞。所以數(shù)據(jù)新聞是可視化在新聞?lì)I(lǐng)域的一個(gè)應(yīng)用。
黃志敏表示,數(shù)據(jù)新聞分為兩種,一個(gè)是信息圖,一個(gè)叫互動(dòng)圖表。如果說信息圖靠做設(shè)計(jì)的人就可以做出來(lái),那么互動(dòng)圖表還要寫代碼,比如手機(jī)地圖、手機(jī)信號(hào)、wifi、電量等。當(dāng)?shù)貓D上劃了一條紅線時(shí),就代表這個(gè)方向現(xiàn)在堵車厲害,如果畫一條綠線說明很暢通,但實(shí)際上我們?cè)诼飞峡床坏竭@樣的線的。
數(shù)據(jù)可視化是做大數(shù)據(jù)分析的一個(gè)很重要的手段。這也是導(dǎo)致很多人很容易把數(shù)據(jù)可視化跟大數(shù)據(jù)混在一起的原因。他舉例說,數(shù)據(jù)新聞是把可視化的手段用在新聞?lì)I(lǐng)域,而大數(shù)據(jù)新聞意味著這個(gè)資料的來(lái)源、結(jié)論是從這個(gè)大數(shù)據(jù)那里來(lái)的,大數(shù)據(jù)新聞跟數(shù)據(jù)不是一回事,大數(shù)據(jù)和數(shù)據(jù)可靠也不是一回事。
以下為文字實(shí)錄:
當(dāng)大家都還在討論傳統(tǒng)媒體要不要轉(zhuǎn)型的時(shí)候,其實(shí)我們?cè)缫呀?jīng)走在媒體轉(zhuǎn)型的路上,現(xiàn)在其實(shí)像財(cái)新傳媒我們是主要有一個(gè)網(wǎng)站和四個(gè)雜志。那么所謂網(wǎng)站的話其他還包含了很多種的方式,包括有PC的網(wǎng)站,包括有手機(jī)的網(wǎng)站,包括工號(hào),包括APP等有5個(gè)呈現(xiàn)的渠道。
雜志的話包括一個(gè)財(cái)新周刊,其他的還有雜志還有一些英文刊,F(xiàn)在我們?cè)谛侣劙l(fā)布方面每天實(shí)際上有80%的內(nèi)容是發(fā)表在網(wǎng)絡(luò)上的。只有20%的原創(chuàng)內(nèi)容是發(fā)表在紙媒上。我們平時(shí)有做足夠的準(zhǔn)備工作,我們有我們的數(shù)據(jù)庫(kù),所以當(dāng)一旦緊急事件、重大事件發(fā)生的時(shí)候我們能夠迅速的從數(shù)據(jù)庫(kù)里頭把相關(guān)的資料調(diào)取出來(lái)然后迅速的組成稿件,所以我覺得這個(gè)就是我們?cè)诎褦?shù)據(jù)在我們的工作里頭的一個(gè)小的一個(gè)應(yīng)用方面吧。
5個(gè)APP都是我們自己的團(tuán)隊(duì)開發(fā)的,財(cái)新300多人,我們有30、40個(gè)人的技術(shù)隊(duì),是有比較強(qiáng)的研發(fā)實(shí)力的。部門分為移動(dòng)部、網(wǎng)站部、創(chuàng)意部還有一個(gè)數(shù)據(jù)可視化實(shí)驗(yàn)室。投了10多個(gè)人的人手在移動(dòng)方面,又投了10多個(gè)人在網(wǎng)站方面,去做這樣一件事情。數(shù)據(jù)可視化其實(shí)有很多不同的描述和定義,其實(shí)可視化是一個(gè)計(jì)算機(jī)科學(xué)方面的,或者說圖形學(xué)方面的一個(gè)概念,那么它可以分為三塊,其中的話第一塊叫科學(xué)可視化,例如地圖就科學(xué)可視化, CT也是科學(xué)可視化,包括鐘表都是科學(xué)可視化。第二個(gè)叫信息可視化,信息可視化其實(shí)也都非常常見,例如路邊拍誰(shuí)禁止停車這個(gè)就是很典型的信息可視化的一個(gè)標(biāo)識(shí)。第三個(gè)叫可視化分析,可視化分析很典型例如說K線交易,我們把它整合到一起變成一個(gè)曲線體現(xiàn)成交量,最高價(jià)最低價(jià)等等,有經(jīng)驗(yàn)的股民一看K線圖對(duì)當(dāng)天的股票的交易情況就已經(jīng)有了很深刻的體會(huì)。所以這個(gè)其實(shí)K線圖是可視化分析的一個(gè)很典型的一個(gè)例子。我們把這個(gè)可視化用在新聞?lì)I(lǐng)域的話,那么它就成了數(shù)據(jù)新聞。所以數(shù)據(jù)新聞是可視化在新聞?lì)I(lǐng)域的一個(gè)應(yīng)用。
數(shù)據(jù)新聞我們又分為兩種,一個(gè)是信息圖,一個(gè)叫互動(dòng)圖表。信息圖也很常見,過往我們?cè)陔s志、評(píng)媒里頭其實(shí)見的是非常多的,包括我們?cè)谶@個(gè)微博和手機(jī)上經(jīng)?吹揭粡垐D“給你講清楚**”,這個(gè)其實(shí)都是信息圖。信息圖有一百多年的歷史了。再有一個(gè)分類就是互動(dòng)圖表也是我今天要講的重點(diǎn)。用計(jì)算機(jī)代碼來(lái)用數(shù)據(jù)轉(zhuǎn)換成一個(gè)圖形來(lái)幫助大家更方便的去理解,那么這個(gè)就是所謂的互動(dòng)圖表。信息圖靠做設(shè)計(jì)的人就可以做出來(lái),而互動(dòng)圖表還要寫代碼,這是兩個(gè)最大的區(qū)別。做互動(dòng)圖表必須有三種人組成,編輯、設(shè)計(jì)師和程序員。我們來(lái)看一個(gè)例子,當(dāng)我們掏出一個(gè)手機(jī)的時(shí)候,打開一個(gè)地圖的APP,這上面有多少數(shù)據(jù)可視化的東西呢?手機(jī)的信號(hào)有幾格,wi-fi信號(hào)有幾格,電池電量還有多少?這些都是數(shù)據(jù)可視化。包括整個(gè)地圖本身也都數(shù)據(jù)可視化,其實(shí)我們每天沒有意識(shí)到用了那么多數(shù)據(jù)可視化。比如地圖上我們一看就知道,如果它劃了一條紅線就代表這個(gè)方向現(xiàn)在堵的厲害,如果畫一條綠線說明很暢通,但實(shí)際上我們?cè)诼飞峡床坏竭@樣的線的,但是就因?yàn)槲覀兘?jīng)?吹竭@樣的電子導(dǎo)航地圖,已經(jīng)變成我們的概念之意了。
數(shù)據(jù)可視化是做大數(shù)據(jù)分析的一個(gè)很重要的手段。這也是導(dǎo)致很多人很容易把數(shù)據(jù)可視化跟大數(shù)據(jù)混在一起的原因。例如說大家有些時(shí)候會(huì)把大數(shù)據(jù)新聞跟數(shù)據(jù)新聞兩個(gè)詞混在一起,但實(shí)際上它不是一回事,數(shù)據(jù)新聞是把可視化的手段用在新聞的領(lǐng)域,而大數(shù)據(jù)新聞意味著你的這個(gè)資料的來(lái)源,你的這個(gè)結(jié)論是從這個(gè)大數(shù)據(jù)那里來(lái)的,所以它不是一回事,大數(shù)據(jù)新聞跟數(shù)據(jù)不是一回事,大數(shù)據(jù)和數(shù)據(jù)可靠也不是一回事。那么我們?cè)?/span>2013年的時(shí)候我們看數(shù)據(jù)新聞這個(gè)領(lǐng)域,然后我們?cè)?/span>2013年的10月份是組建了這個(gè)數(shù)據(jù)可視化實(shí)驗(yàn)室,這個(gè)數(shù)據(jù)話實(shí)驗(yàn)室有十個(gè)人左右,這十個(gè)人是跨部門的,是虛擬的實(shí)驗(yàn)室不是一個(gè)準(zhǔn)確的行政劃分,根據(jù)需要我們會(huì)去做不同的合作。
這個(gè)實(shí)驗(yàn)室包括三種人,第一種是記者和編輯就做處理稿件的人。第二個(gè)是美術(shù)設(shè)計(jì)師,第三種是程序員,三種人組成了這個(gè)。那么做數(shù)據(jù)新聞的話其實(shí)對(duì)我們過往的整個(gè)新聞生產(chǎn)流程是有一個(gè)非常大的變化。什么樣的變化呢?過往的新聞生產(chǎn)其實(shí)從文案到設(shè)計(jì)到技術(shù)其實(shí)是個(gè)上下游的關(guān)系。基本上稿子是誰(shuí)定的,稿子是記者跟編輯定的,那么其他的人員設(shè)計(jì)師也好,技術(shù)也好在這個(gè)里面起的是什么,是支撐的作用,稿子出來(lái)了由美編去幫助配圖再有技術(shù)人員把這個(gè)稿子發(fā)出去,它是一個(gè)上下游的關(guān)系,所以在這種情況之下其實(shí)你會(huì)發(fā)現(xiàn)說設(shè)計(jì)師也好,設(shè)計(jì)師的參與感就比較差,而程序員的參與感就更差,他們根本不知道說我在這里面有什么價(jià)值,我就給人打下手的。導(dǎo)致了另外一件事情就是說在一個(gè)媒體機(jī)構(gòu)里頭,技術(shù)人其實(shí)定位是很低的,技術(shù)人員說實(shí)話過往在很多的傳統(tǒng)媒體里面技術(shù)部門就干嘛的?就修電腦的、修網(wǎng)絡(luò)的,刻光盤,所以沒有成就感沒有參與感,然后收入又不高,那我為什么還要呆在這兒呢?所以長(zhǎng)期以往導(dǎo)致的情況就是什么呢?我們傳統(tǒng)媒體的技術(shù)人員的水平特別低,很普遍的情況。然后真的等到你想干點(diǎn)什么事情的時(shí)候,你左想右想發(fā)現(xiàn)靠自己內(nèi)部人根本實(shí)現(xiàn)不了,因?yàn)樽霾坏。最后進(jìn)入了一個(gè)死循環(huán),每個(gè)人干不出來(lái)事情,就涉及到這種情況。
做數(shù)據(jù)新聞就不一樣了,數(shù)據(jù)新聞?wù)麄(gè)生產(chǎn)流程要變?yōu)槭裁茨??dāng)我做數(shù)據(jù)新聞的時(shí)候一個(gè)選題定下來(lái),第一個(gè)要看它有沒有足夠的數(shù)據(jù),如果說沒有數(shù)據(jù)的話這事沒法干。第一個(gè)有數(shù)據(jù)以后大家三伙人坐在一塊商量說,我們這個(gè)數(shù)據(jù)新聞?dòng)檬裁礃拥男蝿?shì)去表現(xiàn)會(huì)比較好看。然后大家都覺得好看,這個(gè)時(shí)候程序員就得跑出來(lái)那如果比較好看的話,這個(gè)我開發(fā)看能不能實(shí)現(xiàn),成本高不高,時(shí)間趕不趕得急。如果發(fā)現(xiàn)說開發(fā)上不可承受的話,我們還得倒回去,修改這個(gè)設(shè)計(jì)方案。那么它本身就是一個(gè)互動(dòng)的過程,等到這個(gè)方案確定了,等確定以后我們可能反過來(lái)我們得去倒推,推回去得跟記者說不行,數(shù)據(jù)不夠,你再給我補(bǔ)些數(shù)據(jù)過來(lái)。做數(shù)據(jù)新聞跟原來(lái)我們做,我一般寫稿件為例跟稿件是不一樣的。像處理稿件的話,因?yàn)樗昧似南拗,題材的限制,所以有些時(shí)候只需要抽取一些典型的例子。所以做數(shù)據(jù)新聞的話反過來(lái)有些時(shí)候不能被動(dòng)的等著記者去提供,反過來(lái)我要要求記者和編輯去提供更多的內(nèi)容,這個(gè)是我們做數(shù)據(jù)新聞的情況。
比如,像6萬(wàn)字的報(bào)道非常好,有很多人非常耐心的看。但是它的閱讀量從前往后是遞減的,因?yàn)楝F(xiàn)在有很多人他沒有很多耐心很這么多,也不一定了解這件事情。一下就有一個(gè)很直觀的感受,所以這個(gè)就是數(shù)據(jù)新聞的魅力和價(jià)值。按那么講到這里的話,我還要講渠道的問題。我們現(xiàn)在傳統(tǒng)媒體,其實(shí)出現(xiàn)的問問題是什么?出現(xiàn)了一個(gè)最大的問題是你的渠道丟了,你的門戶沒了。其實(shí)傳統(tǒng)媒體的這個(gè)渠道是一直在丟失的,所以當(dāng)我們要做新聞的時(shí)候,現(xiàn)在不可避免你要考慮渠道推廣的問題。舉個(gè)例子來(lái)講,以這個(gè)為例,我們做內(nèi)容怎么做呢?我是個(gè)文字稿件,閱讀量上去,影響上去了,但是好處我都丟了。我這個(gè)項(xiàng)目跟新浪、跟網(wǎng)易都有很好的合作,我跟網(wǎng)易怎么合作呢?我把授權(quán)給他,放在他的網(wǎng)頁(yè)上。但是我也跟他講,放在你這里但是上面會(huì)有我的LOGO,在上面介紹的時(shí)候會(huì)有我的名字和域名。同時(shí)在底下的回連都會(huì)回連到財(cái)新網(wǎng)上,這是一個(gè)非常公平的合作。所以最后我們看了統(tǒng)計(jì)數(shù)據(jù)平均每個(gè)用戶在這個(gè)上面花了半個(gè)小時(shí),這半個(gè)小時(shí)的時(shí)間都是歸網(wǎng)易的,他獲得了這個(gè)注意力,獲得了其他附帶的好處,我們從這里我們獲得了品牌的推廣,同時(shí)在這底下回鏈回去的差不多20%。我們覺得這個(gè)是一個(gè)非常好的合作案例,對(duì)大家都有好處。
有時(shí)候大家也會(huì)有人問我這么一個(gè)問題,你們做數(shù)據(jù)可視化,你們做數(shù)據(jù)新聞怎么掙錢呢?這個(gè)當(dāng)然是我們要考慮的事情,你做這個(gè)事你要掙錢。我做數(shù)據(jù)新聞我是有把握的東西,第一,你不要做太大投入。那么在國(guó)外,做數(shù)據(jù)新聞?wù)l做得最好?《紐約時(shí)報(bào)》,然后接下來(lái)是英國(guó)是《衛(wèi)報(bào)》,還有布隆博格等等都做得非常棒,有那么幾家,還有美國(guó)的NPR,紐約時(shí)報(bào)的水平是最高的,成本也是最高的。因?yàn)檫@么一個(gè)事情,你要做一個(gè)新事物,然后你還要做大投入,你還看不到回報(bào),最大的可能就是過不了半年就被砍掉了,我們要考慮一個(gè)發(fā)展的問題,這是第一個(gè),所以我們要控制成本。那么像我這個(gè)團(tuán)隊(duì)大概十個(gè)人,其實(shí)其中只有大概四個(gè)人專門干這件事情,其他的人還在兼顧干著其他事情。
那么所以你可以認(rèn)為說,我在這方面的投入主要是這四個(gè)人的工資,這四個(gè)人很優(yōu)秀,里頭我有的同事是又能寫代碼,又能做設(shè)計(jì),包含有這樣的人,這是控制成本。第二個(gè)的話,你要給企業(yè)回報(bào)。第一就是名,我們希望我們做的作品去評(píng)選評(píng)獎(jiǎng),一方面來(lái)講如果得了獎(jiǎng),那么我們會(huì)有成就感、榮譽(yù)感,使得大家也會(huì)更努力。另外一個(gè)方面的話,你比如說我們?cè)趪?guó)內(nèi)能拿第一,拿到國(guó)際上只能入圍或者拿優(yōu)秀獎(jiǎng),這樣會(huì)給自己構(gòu)成很大的壓力和動(dòng)力,逼你去進(jìn)步。另外拿獎(jiǎng)也是為企業(yè)在市場(chǎng)上做一個(gè)提升,也算是給企業(yè)一個(gè)回報(bào)。不白拿公司的錢。再有就是我們現(xiàn)在也幫一些其他的企業(yè)或者媒體等等,我們做一些可視化的外包,把我們的技術(shù)輸出出去。在這個(gè)過程中,我們把自己看成是一個(gè)技術(shù)服務(wù)公司,我去做這件事情,也能給企業(yè)帶來(lái)一定的回報(bào),通過這樣的事情,這樣才能有可持續(xù)的發(fā)展。
我們從去年年底到現(xiàn)在,我們做了很多的案例,這些案例的話,包括有支付寶的,有天貓的,有淘寶的,還有唯品會(huì)的,平安銀行的等等,基本上來(lái)講還有例如說之前的有一個(gè)市場(chǎng)調(diào)研公司,基本上來(lái)講,或者是跨國(guó)公司或者上市公司,那么他們希望說用嘗試更多的手段來(lái)展示他們的內(nèi)容。像我們剛才為大家演示的產(chǎn)品,兩天之內(nèi)獲得了二十萬(wàn)的訪問量,作為一個(gè)市場(chǎng)回報(bào)來(lái)講,這是非常劃算的。
這里是我們作品集的一個(gè)演示,我們所有手機(jī)類的作品都會(huì)放在這里。接下來(lái)的話,我會(huì)給大家分享一些我們?cè)谶@以外做的其他一些工作。去年年底以來(lái),我是跑了十多所高校,在許多高校做將多。主要以新聞傳播學(xué)院為主,去介紹數(shù)據(jù)新聞的東西。我看到就是說,有一些高,F(xiàn)在已經(jīng)非常的重視這個(gè)事情,那么他們是例如傳媒大學(xué)、復(fù)旦大學(xué)等等,現(xiàn)在我都看到他們是在課堂上系統(tǒng)的教授這個(gè)數(shù)據(jù)新聞。那么我在做這件事情的過程中,我就會(huì)發(fā)現(xiàn),我們太需要這種又懂新聞、又懂設(shè)計(jì)、又會(huì)寫代碼的復(fù)合型人才,但是我在國(guó)內(nèi)一個(gè)都沒有找到,在國(guó)外有,國(guó)內(nèi)一個(gè)都沒有,國(guó)內(nèi)最好的情況是你能掌握其中的兩門,而在國(guó)外的話,現(xiàn)在他們叫有意思名字叫哥倫比亞大學(xué),他們都會(huì)開設(shè)的課是計(jì)算機(jī)和新聞的雙學(xué)位,密蘇里新聞學(xué)院也是,他們也會(huì)有意識(shí)的教授計(jì)算機(jī)。所以我認(rèn)為這個(gè)是需要我們,業(yè)界和學(xué)界一起做這個(gè)事情,我也認(rèn)為說現(xiàn)在在高校,新聞學(xué)院里頭等等,就是你不培養(yǎng)復(fù)合型人才,你不培養(yǎng)將來(lái)要做記者的人,你不讓他學(xué)寫一些代碼這是不夠的。給大家介紹一下這三個(gè)網(wǎng)站,一個(gè)是我們自己的,這個(gè)叫數(shù)字說的網(wǎng)站,我們所有的數(shù)據(jù)都放在上面,叫財(cái)新數(shù)字說。第二個(gè)是叫財(cái)新數(shù)據(jù)可視化實(shí)驗(yàn)室,這個(gè)是實(shí)驗(yàn)室的網(wǎng)站,那么上面除了財(cái)新的作品以外,那么我們還放置我們分享一些體會(huì)、心得,那么上面也會(huì)有其他家的作品,以及我們平時(shí)搜集的很多案例分享還有一些活動(dòng)信息等等,我們會(huì)放在實(shí)驗(yàn)室的網(wǎng)站上面。
第三個(gè)是數(shù)據(jù)新聞網(wǎng),數(shù)據(jù)新聞網(wǎng)主要是在境外讀書的年輕人,他們很喜歡讀新聞,他們用業(yè)余的時(shí)間搭建了這樣一個(gè)網(wǎng)站,搜集了很多數(shù)據(jù)新聞方面的信息。
最后的話,是我的聯(lián)系方式。如果大家會(huì)后有什么問題的話,歡迎通過這個(gè)聯(lián)系方式來(lái)跟我聯(lián)系,這個(gè)維碼只要你們一掃就把所有的聯(lián)系方式存進(jìn)去了,也歡迎大家加我微信,加微信的時(shí)候麻煩把你的實(shí)名和單位一塊報(bào)出,這樣方便我做記錄,這個(gè)就是我今天要跟大家分享的內(nèi)容。謝謝大家!
編輯:王天怡
關(guān)鍵詞:大數(shù)據(jù);研討會(huì)
2015-03-27 17:15:00
2015-03-27 17:06:00
2015-03-27 16:53:00
參與討論
我想說
央廣網(wǎng)官方微信
手機(jī)央廣網(wǎng)
