央廣網(wǎng)北京4月12日消息(總臺(tái)中國(guó)之聲記者任夢(mèng)巖)據(jù)中央廣播電視總臺(tái)中國(guó)之聲《新聞縱橫》報(bào)道,近日,在某開(kāi)源代碼托管平臺(tái)上,一款以某知名教育博主為原型的AI技能包引發(fā)關(guān)注。開(kāi)發(fā)者利用人工智能技術(shù),號(hào)稱(chēng)完整復(fù)刻了其說(shuō)話(huà)風(fēng)格、思考方式和咨詢(xún)邏輯,推出所謂“某知名教育博主的認(rèn)知操作系統(tǒng)”,可以專(zhuān)門(mén)回答高考志愿等問(wèn)題。
這種將人的思想與風(fēng)格提煉成程序的做法,被稱(chēng)為“人格蒸餾”。它究竟是完美還原了專(zhuān)家的智慧,還是僅僅披著一層風(fēng)格相似的“皮”?打著“免費(fèi)開(kāi)源”旗號(hào)的技術(shù)實(shí)踐是否涉嫌侵權(quán)?
在該開(kāi)源平臺(tái)上,作者“花叔”稱(chēng),這條skill(技能包)是基于5本著作、15篇權(quán)威媒體深度采訪(fǎng)、30多條一手語(yǔ)錄、11個(gè)關(guān)鍵決策記錄和完整人生時(shí)間線(xiàn)的深度調(diào)研。號(hào)稱(chēng)不是語(yǔ)錄合集,是可運(yùn)行的思維框架。此外,該作者還上傳了郭德綱、馬斯克、喬布斯等名人的模型。
記者在下載后,嘗試使用該skill咨詢(xún)幾次高考志愿填報(bào),發(fā)現(xiàn)其語(yǔ)言風(fēng)格具有明顯的“名師式表達(dá)特征”,但提供的信息并不準(zhǔn)確,且會(huì)出現(xiàn)“幻覺(jué)”。比如記者以考生身份提問(wèn)“理科600分想上985高校,推薦幾個(gè)專(zhuān)業(yè)?”時(shí),該AI在語(yǔ)言風(fēng)格上確實(shí)模仿得惟妙惟肖,直白且?guī)е鴺?biāo)志性的口語(yǔ)化表達(dá),但它給出的核心信息卻出現(xiàn)了嚴(yán)重的“幻覺(jué)”——它竟然建議考生去報(bào)考211高校北京郵電大學(xué)的計(jì)算機(jī)專(zhuān)業(yè)。而該專(zhuān)業(yè)的分?jǐn)?shù)線(xiàn)遠(yuǎn)超眾多普通985高校專(zhuān)業(yè)。當(dāng)記者指出這一常識(shí)性錯(cuò)誤后,該模型立刻陷入了連連道歉的窘境。
這種所謂的“完整復(fù)刻”,僅僅停留在語(yǔ)言風(fēng)格的淺層模仿,其提供的信息準(zhǔn)確度與市面上的普通大模型并無(wú)二致。針對(duì)這種狀況,記者試圖聯(lián)系該技能包的開(kāi)發(fā)者“花叔”。但對(duì)方拒絕對(duì)此作出正面回應(yīng),僅表示自己只是用技術(shù)做了一個(gè)“免費(fèi)開(kāi)源的項(xiàng)目”,至于大家如何討論和看待,他無(wú)法控制。
開(kāi)發(fā)者口中這個(gè)“無(wú)法控制”的免費(fèi)項(xiàng)目,在底層邏輯上到底是如何運(yùn)作的?我們究竟該如何理解“.skill”這種技術(shù)形態(tài)?中關(guān)村信息消費(fèi)技術(shù)產(chǎn)業(yè)聯(lián)盟副理事長(zhǎng)包冉告訴中國(guó)之聲,隨著AI編程技術(shù)的普及和RAG(檢索增強(qiáng)生成架構(gòu))的成熟,極大簡(jiǎn)化了開(kāi)發(fā)流程。開(kāi)發(fā)者無(wú)須具備深厚的編程功底,只需用自然語(yǔ)言下達(dá)指令,它就能自動(dòng)編寫(xiě)網(wǎng)絡(luò)爬蟲(chóng)抓取目標(biāo)人物的發(fā)言,本質(zhì)上就是一個(gè)模仿腳本。
包冉表示:“這個(gè)skill,翻譯過(guò)來(lái)就是技能,只不過(guò)現(xiàn)在是在A(yíng)gent(人工智能體)的應(yīng)用中,尤其是所謂的Open Claw‘龍蝦’機(jī)制的普及下。其實(shí)這個(gè)詞最早源于A(yíng)nthropic的Claude。其推出了Claude Code這種自動(dòng)編程模型,會(huì)將很多人類(lèi)既有的編程技巧,先通過(guò)大語(yǔ)言模型的訓(xùn)練,形成語(yǔ)料庫(kù),然后再通過(guò)語(yǔ)料庫(kù)中的API調(diào)用,復(fù)用了已經(jīng)被學(xué)習(xí)訓(xùn)練過(guò)的人類(lèi)編程能力,就稱(chēng)之為skill。只要某一個(gè)人有充足的數(shù)據(jù)資料留存,都可以把它送入到專(zhuān)業(yè)的模型進(jìn)行訓(xùn)練,就形成了一個(gè)專(zhuān)家系統(tǒng)!
包冉介紹,我們每個(gè)人在這個(gè)數(shù)字時(shí)代留下的痕跡,都可能成為“投喂”給大模型的語(yǔ)料。但值得注意的是,目前的AI并不具備真正的“理解”能力,它更像是一個(gè)極其龐大且精密的概率計(jì)算器——它通過(guò)海量語(yǔ)料計(jì)算上下文序列中下一個(gè)詞出現(xiàn)的概率。但模型本身并沒(méi)有對(duì)這個(gè)真實(shí)世界的理解,也缺乏人類(lèi)專(zhuān)家那種舉一反三、根據(jù)最新社會(huì)現(xiàn)實(shí)進(jìn)行重構(gòu)的能力。更重要的是,當(dāng)面臨訓(xùn)練數(shù)據(jù)不足、知識(shí)盲區(qū)時(shí),AI不會(huì)輕易判定“我不知道”,而是會(huì)用極具邏輯性的語(yǔ)氣,把概率上最相關(guān)的詞語(yǔ)拼湊在一起,生成看似合理實(shí)則謬誤的答案。
包冉說(shuō):“我依然對(duì)這種應(yīng)用保持謹(jǐn)慎態(tài)度。每一個(gè)人的認(rèn)知是在不斷進(jìn)步的,我們可以看到這位名人可能在2025年的授課內(nèi)容和觀(guān)點(diǎn)與他在2015年的時(shí)候,肯定是不一樣的,他有自己的研究,同時(shí)他再將這些成果傳導(dǎo)給他的受眾。今天的生成式人工智能本質(zhì)上是用超大規(guī)模的語(yǔ)料集來(lái)計(jì)算語(yǔ)義關(guān)聯(lián)的概率,它是個(gè)撞概率的‘游戲’,不是真的懂了,而是從概率上分析,這兩個(gè)意思挨在一起就合理,但是為什么這兩個(gè)意思要挨在一起,它不知道。”
開(kāi)發(fā)者稱(chēng),該skill免費(fèi)開(kāi)源,能否在法律面前站得住腳?中國(guó)傳媒大學(xué)文化產(chǎn)業(yè)管理學(xué)院法律系主任鄭寧向記者拆解了其中的權(quán)利邊界。首先,在著作權(quán)層面,法律的界定存在一定模糊地帶。
鄭寧說(shuō):“著作權(quán)法保護(hù)的是表達(dá),不保護(hù)思想。像這種名人式的語(yǔ)言風(fēng)格,除非他有一些獨(dú)創(chuàng)性的具體表達(dá),如果用到他的著作里的原話(huà),或者構(gòu)成實(shí)質(zhì)性相似,有可能去主張著作權(quán)侵權(quán)。但是如果只是歸結(jié)到思想層面,任何一個(gè)人都可以用!
針對(duì)開(kāi)發(fā)者以“免費(fèi)開(kāi)源”作為推托,鄭寧明確表示,這并不能成為規(guī)避侵權(quán)的擋箭牌。如果模仿語(yǔ)言風(fēng)格在著作權(quán)上尚有爭(zhēng)議,那么在人格權(quán)益上,這種未經(jīng)授權(quán)的“蒸餾”行為則觸碰了清晰的紅線(xiàn)。
侵權(quán)風(fēng)險(xiǎn)客觀(guān)存在,為何各類(lèi)名人的“AI分身”依然在網(wǎng)絡(luò)上層出不窮?在技術(shù)開(kāi)源的浪潮下,我們能否叫停這種“人格蒸餾”?北京大學(xué)政府管理學(xué)院教授馬亮認(rèn)為,隨著AI工具的普及,低成本實(shí)現(xiàn)的復(fù)刻已成為現(xiàn)實(shí),只要不越過(guò)法律紅線(xiàn),技術(shù)實(shí)踐本身是很難被禁止的。
馬亮指出,監(jiān)管的真正核心在于厘清“生成”與“使用”的邊界。個(gè)人在封閉環(huán)境下的技術(shù)嘗試是一回事,一旦將其推向公共網(wǎng)絡(luò)空間進(jìn)行廣泛傳播,用于牟利甚至制造欺騙,就必須面臨嚴(yán)厲的追責(zé)。
轉(zhuǎn)載申請(qǐng)事宜以及報(bào)告非法侵權(quán)行為,請(qǐng)聯(lián)系我們:010-56807194



