百度嚴(yán)審?fù)茝V資質(zhì):技術(shù)人工雙管齊下 屏蔽38億條有害鏈接
2016-01-29 15:47:00 來(lái)源:光明網(wǎng)
搜索引擎是網(wǎng)民們最依賴的互聯(lián)網(wǎng)應(yīng)用之一,但也有一些虛假信息常年以各種低價(jià)、方便等由頭誘騙用戶上當(dāng)。
日前,谷歌發(fā)布了一組數(shù)據(jù)稱,2015年谷歌共去除了7.8億條違反其政策的廣告,比2014年的5.24億條增長(zhǎng)了近50%。百度也不例外,數(shù)據(jù)顯示,百度已屏蔽有害鏈接38億條,站點(diǎn)級(jí)別已超1億個(gè)。為此,百度花大精力構(gòu)建了完整的預(yù)防、監(jiān)控、處理流程體系,每天都在與違規(guī)推廣“斗智斗勇”。
好在這些工作不都是由人工完成,技術(shù)基因濃厚的百度通過(guò)機(jī)器深度計(jì)算、大數(shù)據(jù)技術(shù)甄別和人工篩選審核的綜合運(yùn)作,形成一套完整的預(yù)防、監(jiān)控、處理流程體系,其中大數(shù)據(jù)審查技術(shù)更堪稱“黑科技”。
記者了解到,百度搜索每天要響應(yīng)將近60億次搜索請(qǐng)求,海量需求吸引了大量推廣信息,所以百度要實(shí)時(shí)對(duì)無(wú)數(shù)推廣信息進(jìn)行客戶資質(zhì)審核、物料信息審核等全面核查。目前百度廣告系統(tǒng)平均每天送審的文字廣告為4.7億條,相當(dāng)于每秒鐘就有5000條廣告需要過(guò)審。
面對(duì)如此巨大的審核量,人工遠(yuǎn)遠(yuǎn)不能滿足,為此百度開(kāi)發(fā)了一套“雷達(dá)系統(tǒng)”,用大數(shù)據(jù)來(lái)進(jìn)行審查。目前,百度能做到機(jī)器自動(dòng)審核率達(dá)到95%,同時(shí)機(jī)器還能將平均每天30萬(wàn)條的圖片廣告過(guò)審核處理一半以上。
同時(shí),百度的大數(shù)據(jù)審查技術(shù)體系也在不斷升級(jí)。如此前一些不法廣告主利用新興技術(shù),在Flash廣告中嵌入第三方外鏈或php腳本內(nèi)容,控制作弊Flash物料根據(jù)IP、時(shí)間、設(shè)備等不同狀態(tài)因素進(jìn)行跳轉(zhuǎn)。簡(jiǎn)單來(lái)說(shuō),在審核時(shí)看到的是鋼材的廣告,到了晚上或者坐仨小時(shí)火車,在相同的網(wǎng)頁(yè)相同的地方就會(huì)看到低俗廣告。
為此,百度成立了專項(xiàng)組,通過(guò)升級(jí)Flash物料的代碼解析模塊,讓機(jī)器主動(dòng)發(fā)現(xiàn)其中“不應(yīng)出現(xiàn)”的外鏈或php腳本內(nèi)容,整體上從低俗、虛假、欺詐、高危信息等多個(gè)維度進(jìn)行層層把關(guān)。據(jù)悉,截至目前百度共封禁Flash賬戶超1.5萬(wàn)個(gè),涉及Flash物料數(shù)超570萬(wàn)條,其中機(jī)器拒絕違規(guī)Flash物料通過(guò)共近60萬(wàn)條。
此外,雖然百度通過(guò)大數(shù)據(jù)“黑科技”屏蔽了絕大部分違規(guī)推廣信息,但人工干預(yù)審查也成為攔截有害信息的最終屏障,換句話說(shuō),當(dāng)系統(tǒng)對(duì)于某條廣告是否惡意難以判斷時(shí),將轉(zhuǎn)至人工來(lái)判斷!叭斯彶檫@一步仍然必不可少,因?yàn)橛泻π畔⒌膫鞑ピ词侨嗽诓倏,所以仍?huì)有少量信息逃過(guò)機(jī)器審查,目前百度仍然在加大人工審查的力度!卑俣认嚓P(guān)負(fù)責(zé)人稱。
據(jù)記者了解,百度大約有5%的物料審核還需要人工進(jìn)行操作,為此百度擁有一個(gè)數(shù)千人的審核團(tuán)隊(duì)每天倒班工作。為了加大力度打擊各種作弊行為,在原有的機(jī)器+人工審核基礎(chǔ)上,近期百度新增了近60人的審查團(tuán)隊(duì),互換3班24小時(shí)不間斷審核,并且在原有的機(jī)器與人工審核兩道流程之上,又增加了一次人工審查作為“第三層保險(xiǎn)”,確保非法廣告被及時(shí)下架。
數(shù)據(jù)顯示,在剛剛過(guò)去的2015年,百度拒絕不良賬戶438300個(gè),判罰的違規(guī)消費(fèi)金額達(dá)到了4.67億元,此外百度還給公安機(jī)關(guān)提報(bào)了不少造假售假線索。
百度商業(yè)生態(tài)事業(yè)部總經(jīng)理崔聿泓表示:“接下來(lái),百度將充分利用百度在技術(shù)和數(shù)據(jù)上的能力和優(yōu)勢(shì),更加智能地對(duì)物料全方位的核查,提升物料審核的準(zhǔn)確率和效率!
另?yè)?jù)了解,百度還通過(guò)信譽(yù)V網(wǎng)站評(píng)級(jí)體系,從源頭上遏制惡意推廣信息。目前百度已為數(shù)百萬(wàn)企業(yè)提供了實(shí)名認(rèn)證、加V服務(wù),為網(wǎng)民提供“有V有保障”、受損先行賠付等服務(wù)。同時(shí),評(píng)價(jià)體系也與大數(shù)據(jù)審查一起發(fā)揮雙重作用,廣告主一旦出現(xiàn)違規(guī)情況,將面臨下線、撤V、判罰等后果。
編輯:殷雨婷
關(guān)鍵詞:谷歌;倒班工作;屏蔽;有害信息;人工干預(yù)
一款名為AlphaGo的人工智能軟件,在沒(méi)有任何讓子的情況下以5∶0完勝歐洲冠軍。
2016-01-29 09:04:00
一款名為AlphaGo的人工智能軟件,在沒(méi)有任何讓子的情況下以5∶0完勝歐洲冠軍。
2016-01-29 09:04:00
1月29日消息,據(jù)國(guó)外媒體報(bào)道,由于Oculus Rift、PlayStation VR和HTC Vive將于未來(lái)數(shù)月上市銷售,今年將成為虛擬現(xiàn)實(shí)技術(shù)快速普及的一年。盡管庫(kù)克沒(méi)有明確承認(rèn)“我們?cè)陂_(kāi)發(fā)虛擬現(xiàn)實(shí)頭盔”,但上述評(píng)論仍然使得眾多科技博客當(dāng)作一個(gè)令人激動(dòng)的聲明。
2016-01-29 08:31:00
參與討論
我想說(shuō)
央廣網(wǎng)官方微信
手機(jī)央廣網(wǎng)
