本期話題:揭開數(shù)據(jù)大算法的“面紗”。從“大數(shù)據(jù)殺熟”到“外賣員困在系統(tǒng)里”,大數(shù)據(jù)算法愈發(fā)受到關(guān)注。從手機(jī)購物的“千人千面”,到金融放貸的“用戶畫像”,“算法”究竟是什么?它是如何影響人的?從網(wǎng)絡(luò)安全法,到個(gè)人信息保護(hù)法、數(shù)據(jù)安全法,法規(guī)能否有效控制算法的“濫用”?如何讓算法更好地服務(wù)人,而不是侵犯人?未來,自然人和算法究竟是怎樣的關(guān)系?
如今,大數(shù)據(jù)算法已深入每個(gè)人的生活:無論是電商平臺(tái),還是新聞客戶端和短視頻平臺(tái),大數(shù)據(jù)都能根據(jù)每個(gè)人的特點(diǎn)實(shí)現(xiàn)“千人千面”推送;在一些金融平臺(tái),科技金融公司也會(huì)用安全系統(tǒng)對(duì)用戶進(jìn)行“數(shù)字畫像”,以此確定放款額度和利息。
但有時(shí),大數(shù)據(jù)也讓人有“被監(jiān)視”的感覺,手機(jī)放在身邊,剛和朋友說幾句話,APP就會(huì)推送相應(yīng)的內(nèi)容,讓人不寒而栗。此外,“大數(shù)據(jù)殺熟”也一直是備受爭議和詬病的問題。
幾年來,從網(wǎng)絡(luò)安全法到時(shí)下備受矚目的個(gè)人信息保護(hù)法草案、數(shù)據(jù)安全法草案,關(guān)于信息安全的立法進(jìn)程不斷完善和推進(jìn),數(shù)據(jù)算法的合理使用會(huì)服務(wù)人、更懂人,但是濫用則會(huì)侵犯人和控制人。算法到底是什么?怎樣平衡安全和服務(wù)的邊界?個(gè)人信息保護(hù)法又將怎樣保護(hù)公民?

主持人:王思遠(yuǎn) 總臺(tái)央廣經(jīng)濟(jì)之聲【遠(yuǎn)見】欄目制作人

對(duì)話嘉賓:余弦 資深安全技術(shù)專家、白帽黑客、慢霧科技創(chuàng)始人
數(shù)據(jù)安全法,明確“數(shù)字主權(quán)”,剎住數(shù)據(jù)越權(quán)亂象
思遠(yuǎn):關(guān)于大數(shù)據(jù)的話題屢見不鮮,但很多時(shí)候是偏負(fù)面的,比如打車、住酒店時(shí)的“大數(shù)據(jù)殺熟”;外賣小哥被“困在系統(tǒng)里”。這些讓算法變得很神秘和冰冷,作為從業(yè)者,你怎么用最通俗的理解去解釋算法?
余弦:簡單說,“算法”就是用很多機(jī)器、服務(wù)器去盡可能模擬人類的思維、行為。大家會(huì)把算法簡單理解為“人工智能”,但跟人類的思維和行為比,還有非常大差距。在長遠(yuǎn)的未來看,算法會(huì)讓我們有更精準(zhǔn)的感知和更好的應(yīng)用場景;但當(dāng)下還是早期,有時(shí)算法會(huì)比較“粗暴”。
思遠(yuǎn):算法有時(shí)會(huì)給人兩個(gè)極端的感覺。一面像是AlphaGo,特定的領(lǐng)域和規(guī)則下,表現(xiàn)遠(yuǎn)遠(yuǎn)優(yōu)于人類;另一面,它又缺少人類的溫度和感情。
余弦:技術(shù)的應(yīng)用一定要看場景,比如AlphaGo下棋非常厲害,但只局限于此,下棋只是非常小的場景。單一場景內(nèi),模型的搭建是很簡單的,在特定領(lǐng)域有小維度邊界時(shí),算法還能做到速度、儲(chǔ)存量、運(yùn)算能力上超過人類,但真的能夠像人類似的萬事俱通,在不同的領(lǐng)域都有自己的一套智慧和解決問題的方式,算法還差得非常遠(yuǎn)。
思遠(yuǎn):2020年10月21日開始,個(gè)人信息保護(hù)法草案正式進(jìn)入審議——千呼萬喚始出來,無論是行業(yè)還是用戶,都很需要。從業(yè)者需要知道數(shù)據(jù)使用和隱私保護(hù)的邊界,用戶希望技術(shù)服務(wù)人而不是侵犯人。個(gè)人信息保護(hù)法,整體從哪些方面保護(hù)人的權(quán)利?
余弦:作為從業(yè)者,我非常關(guān)注這個(gè)法律的進(jìn)展,因?yàn)槲磥韽臉I(yè)者會(huì)有據(jù)可循。特別是關(guān)于“數(shù)據(jù)主權(quán)”的話題,你上述提到邊界,很多行為準(zhǔn)則需要去探討研究和遵守。數(shù)據(jù)主權(quán),話題可大可小——作為用戶,擁有數(shù)據(jù)使用的知情權(quán),知道拿他的數(shù)據(jù)去做什么——這是個(gè)人主權(quán)問題;往大了說,數(shù)據(jù)主權(quán)可以涵蓋到企業(yè)、行業(yè),甚至國家。
現(xiàn)在的大數(shù)據(jù)亂象是伴隨新事物而誕生,法律不能盲目制定,有一個(gè)過程。2017年6月1日起,網(wǎng)絡(luò)安全法實(shí)施,其對(duì)網(wǎng)絡(luò)個(gè)人數(shù)據(jù)已經(jīng)有了一些定義;像民法總則、民法典等,也有關(guān)于個(gè)人信息、數(shù)據(jù)安全的規(guī)定。從國家層面,立法過程中也參考了海外,包括像歐盟通用的數(shù)據(jù)保護(hù)條例。無論是已經(jīng)頒布的,還是探討中的草案,我們都該重視它。
作為服務(wù)者,也要弄清自己的責(zé)任,比如數(shù)據(jù)儲(chǔ)存在服務(wù)器里,但如果因?yàn)榉⻊?wù)器漏洞被入侵的“黑客”偷走了,怎么界定責(zé)任?互聯(lián)網(wǎng)廠商承不承擔(dān)責(zé)任?法律上關(guān)于這種界定會(huì)越來越多,當(dāng)下不能說法律很完善,但至少有了這幾部法律的幫助,是很好的促進(jìn)。
“爬蟲學(xué)得好,牢飯吃到飽”?——論技術(shù)的價(jià)值觀
思遠(yuǎn):如果說算法是底層的邏輯和系統(tǒng),那么大數(shù)據(jù)就是養(yǎng)料和細(xì)胞。從PC時(shí)代,到移動(dòng)時(shí)代,再到物聯(lián)網(wǎng)時(shí)代,算法都離不開“爬蟲技術(shù)”,簡單說就是通過網(wǎng)絡(luò)勾連,實(shí)現(xiàn)數(shù)據(jù)的收集、分析和再組合,實(shí)現(xiàn)特定的目的。但“爬蟲”經(jīng)常會(huì)爬到隱私,聽說圈里有一句話叫“爬蟲學(xué)得好,牢飯吃到飽”?
余弦:在安全行業(yè),尤其是前兩年做“爬蟲”生意的一些企業(yè),都因此而觸碰了法律被制裁!芭老x”技術(shù)本身沒有好與壞的說法,就像菜刀可以做菜,也可以犯罪。
思遠(yuǎn):技術(shù)是中立的,但取決于人的價(jià)值觀。
余弦:“爬蟲”分為兩種場景。第一種是專門做“爬蟲”,故意去爬服務(wù)器的敏感數(shù)據(jù),就是主觀作惡。另一種是不小心把數(shù)據(jù)拿了回來。比如把個(gè)人的社保醫(yī)療隱私不小心爬回來了,但看到這個(gè)信息還挺有價(jià)值的,可能會(huì)二次利用。同時(shí),這些社保醫(yī)療機(jī)構(gòu)網(wǎng)站有漏洞,有沒有責(zé)任呢?這就像是主動(dòng)入室盜竊和主人沒鎖好門導(dǎo)致誤闖民宅。不同情況,有不同的認(rèn)定和處理,這是法律需要界定的。
場景1:金融風(fēng)控,哪些“大數(shù)據(jù)畫像”侵犯隱私?
思遠(yuǎn):我們來聊聊算法的應(yīng)用場景。生活中最常見的是金融風(fēng)控——金融數(shù)據(jù)中的算法是怎樣的邏輯?
余弦:核心是通過各類用戶數(shù)據(jù)采集,進(jìn)行用戶畫像。讓業(yè)務(wù)決策者更好地理解目標(biāo)群體,數(shù)據(jù)越準(zhǔn)確、豐滿,就越有利于特定的場景去做針對(duì)性的事情。
思遠(yuǎn):比如給金融借貸,根據(jù)征信和消費(fèi)行為等數(shù)據(jù),判斷優(yōu)質(zhì)客戶,給出更好的還款周期和價(jià)格,用更低的價(jià)格、更高的額度做長線生意;對(duì)風(fēng)險(xiǎn)大的客戶,拒絕放款。
以前有個(gè)FINTECH公司的CEO給我介紹了一個(gè)案例:拿到了客戶A的所有行動(dòng)軌跡,發(fā)現(xiàn)每天的活動(dòng)線路兩點(diǎn)一線,時(shí)間相對(duì)固定,消費(fèi)能力、還款記錄良好,就定義為“白領(lǐng)上班族優(yōu)質(zhì)客戶”;客戶B每天的活動(dòng)軌跡和時(shí)間非常不規(guī)律,就認(rèn)為是自由職業(yè)者,謹(jǐn)慎放款。類似例子還有很多,比如借了消費(fèi)貸還不上的人,催收公司會(huì)一夜之間將其通訊錄中的電話打個(gè)遍。問題是,這些數(shù)據(jù)都使用,是不是非法和侵犯隱私呢?
余弦:這個(gè)現(xiàn)象確實(shí)非常普遍。很多時(shí)候,普通人高估了算法,在我們看來,很多技術(shù)真的非常粗暴,就如用戶借貸的錢還不上,暴力催收公司通過非法采集用戶數(shù)據(jù),用灰色方式催債。
所以,圍繞相關(guān)法律,比如個(gè)人信息保護(hù)法、數(shù)據(jù)安全法等,未來這些會(huì)得到比較好的凈化。因?yàn)檫@個(gè)產(chǎn)業(yè)從業(yè)人員太多了,而且不同于實(shí)體的物理世界。
思遠(yuǎn):很多信息的獲取就是一瞬間,交易速度非?,這對(duì)發(fā)現(xiàn)違法行為、固定證據(jù)會(huì)有很大麻煩。真正執(zhí)法,要靠企業(yè)自律或相互監(jiān)督、舉報(bào)等,還是什么?
余弦:從操作角度來講,這些法律是絕對(duì)可行的。這里面可能會(huì)涉及到具體敏感的話題,這里暫時(shí)不展開談。但首先我們都得有法,才能去操作。未來的執(zhí)法過程,一方面,數(shù)據(jù)的濫用,行業(yè)內(nèi)確實(shí)有不少的外露特征,明面上能看到;執(zhí)法肯定由公安進(jìn)行——比如網(wǎng)安、網(wǎng)絡(luò)警察。
場景2:大數(shù)據(jù)營銷愈發(fā)精準(zhǔn),我們是否被“監(jiān)視偷聽”?
思遠(yuǎn):另一個(gè)典型場景是“營銷”,F(xiàn)在大家經(jīng)常在網(wǎng)上“買買買”。打開手機(jī),發(fā)現(xiàn)系統(tǒng)給每個(gè)人推送的情況都不一樣;打開新聞客戶端,總會(huì)推你想看的內(nèi)容,甚至有時(shí)剛跟朋友聊到什么,商品信息和廣告就來了。這種技術(shù)怎么做到的?人真的被“監(jiān)視”了么?
余弦:如果單方面來看,感覺會(huì)很驚悚,當(dāng)然,實(shí)際上這是“幸存者偏差”,并不是非常普遍的事件,跟算法也沒什么特別的關(guān)系——它可能是一種概率,碰巧遇到了,會(huì)放大這個(gè)事情。營銷數(shù)據(jù)專門有做營銷產(chǎn)業(yè)鏈的,通過各方面去采集數(shù)據(jù),包括可能有非法的一些交易,能夠盡量做到精準(zhǔn)推廣。
無論是個(gè)人信息保護(hù)法草案,還是數(shù)據(jù)安全法、網(wǎng)絡(luò)安全法、民法典等,多少都有圍繞隱私的關(guān)于數(shù)據(jù)的定義或說法。數(shù)據(jù)活動(dòng)指的是,數(shù)據(jù)在收集、存儲(chǔ)、加工、使用、提供、交易、公開等行為;數(shù)據(jù)安全是指通過采取必要的措施,保障數(shù)據(jù)得到有效保護(hù)和合法利用,并持續(xù)處于安全狀態(tài)的能力。
思遠(yuǎn):你說了兩點(diǎn)。第一,有時(shí)大家過于敏感,陷入了“幸存者偏差”;第二,算法、大數(shù)據(jù)的合法性,包括大數(shù)據(jù)應(yīng)該去脫敏的信息點(diǎn),需要法律規(guī)范;氐剿惴ū旧,有句話說,“未來世界,只有兩種人,一種是控制和決定算法的人,一種是被算法控制的人”。好像很有道理,以往人會(huì)自己去探索信息,有更多發(fā)展的可能性;現(xiàn)在算法會(huì)困住人,越來越懂你的同時(shí),推薦的信息就越來越局限,會(huì)圍繞著現(xiàn)有的水平、認(rèn)知和圈層。你怎么看這個(gè)問題?
余弦:我贊同行業(yè)內(nèi)這個(gè)說法。算法是機(jī)器輸出來的,通過人類反應(yīng)的信息,按照概率計(jì)算,反向給出推薦信息和服務(wù),又讓人形成新的依賴感,手機(jī)成了人的器官,人掉入了數(shù)據(jù)的舒適區(qū),沉浸在這種數(shù)字體驗(yàn)中。我也會(huì)這樣。
但另一方面,我懂技術(shù),某些層面上我也控制算法,盡量讓算法能為周邊的人提供價(jià)值。所以我們才會(huì)討論關(guān)于算法的法律紅線,否則算法肯定會(huì)失控,要更規(guī)范,肯定要有法可依。某種程度上,算法和人是相互依存的關(guān)系,沒有人的行為就沒有數(shù)據(jù),沒有數(shù)據(jù)就沒有了算法。
但同時(shí)我們也看到說,算法本身以技術(shù)的形式去存在,技術(shù)上,其實(shí)張一鳴曾在幾年前拋出一個(gè)言論,大家也討論得非常熱烈,就是說,技術(shù)其實(shí)本來是工具,工具只分好用和不好用之分,技術(shù)高和技術(shù)低,我覺得這句話本身沒有錯(cuò)。
因此,綜合到算法上來說,無論是這個(gè)產(chǎn)業(yè)環(huán)境還是我們的生活,算法上有沒有價(jià)值觀,其實(shí)先放在一邊,但是研究算法的人、使用算法的人必須有價(jià)值觀,必須有法可依,算法才能更加值得人去信賴。




