當(dāng)前位置:首頁 >  科技 >  IT業(yè)界 >  正文

GAITC專題論壇丨金兼斌:虛假科學(xué)信息治理依靠社會民智,AI是整合關(guān)鍵

 2020-07-29 12:06  來源: 互聯(lián)網(wǎng)   我來投稿 撤稿糾錯

  域名預(yù)訂/競價(jià),好“米”不錯過

7月26日,由中國人工智能學(xué)會主辦、新浪新聞聯(lián)合浙江大學(xué)承辦的2020全球人工智能技術(shù)大會(2020GAITC)“AI時(shí)代下的新媒體與社交娛樂”專題論壇拉開帷幕,新浪集團(tuán)首席信息官、新浪AI媒體研究院院長王巍,浙江大學(xué)特聘教授、悉尼科技大學(xué)教授、百度研究院訪問教授楊易共同擔(dān)任論壇主席。

清華大學(xué)大學(xué)新聞與傳播學(xué)院學(xué)術(shù)委員會主任、教授金兼斌在本次專題論壇上,與來自業(yè)界、學(xué)術(shù)界的嘉賓們分享了《人工智能助力虛假科學(xué)信息的監(jiān)測》。

圖注:清華大學(xué)大學(xué)新聞與傳播學(xué)院學(xué)術(shù)委員會主任、教授金兼斌作主題演講。

金兼斌認(rèn)為,社會化媒體時(shí)代,虛假科學(xué)信息的治理,必須充分依靠對分散在社會各個(gè)平臺上的民智的整合,而人工智能則是實(shí)現(xiàn)這種有效整合的關(guān)鍵。

關(guān)于應(yīng)對虛假科學(xué)信息,利用人工智能技術(shù)進(jìn)行更好的監(jiān)測,他提到,基于虛假科學(xué)信息的語言特征、內(nèi)容特征和對象特征,“表示學(xué)習(xí)”、“知識圖譜”、“信息挖掘”是三種有針對性的解決思路。

以下為金兼斌演講實(shí)錄,內(nèi)容經(jīng)編輯略有刪減:

各位嘉賓好,首先非常榮幸受新浪新聞和浙江大學(xué)的邀請來參加這一論壇。剛才聽前面幾位專家分享的時(shí)候,頗感心有戚戚。諸多內(nèi)容和觀點(diǎn),嘉賓之間并未事先溝通過,但卻遙相呼應(yīng)。

今天我將主要談?wù)勌摷倏茖W(xué)信息的監(jiān)測問題。借用剛才Amy Bruckman女士的話,知識本質(zhì)上是一種共識的社會建構(gòu)。尼采有類似的表述,即世界上沒有所謂的事實(shí),只有解讀。

在日常的內(nèi)容消費(fèi)中,很多時(shí)候我們面臨這樣的場景:有一定共同認(rèn)可的事實(shí)基礎(chǔ)的現(xiàn)象或事件,不同人對事件的性質(zhì)以及可能的社會后果,可以有截然不同的解讀和判斷。諸多人與人之間、群體與群體之間、國家與國家之間的矛盾、爭執(zhí)乃至交惡、撕裂,由此而生。

7月24號,也就是兩天前,《科學(xué)》雜志上發(fā)表了一篇中科院武漢病毒研究所研究員石正麗回答《科學(xué)》的18問專訪的文章,文章題目以“特朗普欠我們一個(gè)道歉”這一來自石正麗的引語開始。提問者對所提18個(gè)問題做了精心的準(zhǔn)備,涉及到武漢病毒所和此次新冠疫情之間有無關(guān)聯(lián)的大量專業(yè)問答,雖然字里行間不乏春秋筆法,但總體上問答雙方都十分克制,只講事實(shí),沒有任何情緒化的表達(dá)。這是很難得的。因?yàn)樵谌藗內(nèi)粘K姷拇罅可婕翱茖W(xué)事實(shí)的各種網(wǎng)上內(nèi)容表述中,“后真相”時(shí)代觀點(diǎn)先行、事實(shí)成為“任人打扮的小姑娘”,已經(jīng)是見怪不怪的現(xiàn)象。這正是我今天給大家分享的這個(gè)主題的時(shí)代和信息傳播環(huán)境之大背景。

今天,科學(xué)已經(jīng)成為我們當(dāng)代社會文明中的亮麗底色。另一方面,科學(xué)不光是科學(xué),它還關(guān)乎政治,國際上圍繞疫情起源的爭議和污名化就是明證。而對普通民眾而言,科學(xué)關(guān)乎日常生活質(zhì)量和對現(xiàn)代文明帶來的福祉的享用。如何確保確保民眾日常生活接觸到的科學(xué)性信息的質(zhì)量,可謂茲事體大。

我將要介紹的內(nèi)容,是由我們團(tuán)隊(duì)的博士后陳慧敏和碩士生朱澤宇與我一起準(zhǔn)備完成的。

今天的主題是AI時(shí)代下的新媒體與社交娛樂。剛才王巍總講到內(nèi)容生產(chǎn)從PGC到UGC再到現(xiàn)在TGC的多元化趨勢。我們身處信息生產(chǎn)的社會化、大眾化乃至萬物生生不息的時(shí)代。另一方面,人作為信息消費(fèi)者,又有其永遠(yuǎn)無法逾越的一些邊界條件,比如一天只有24小時(shí),信息消費(fèi)的時(shí)間和其他活動包括睡眠所占的時(shí)間,是一種此消彼長的零和游戲。今天,社會的發(fā)展已經(jīng)從規(guī)模發(fā)展轉(zhuǎn)變到高質(zhì)量發(fā)展階段,其實(shí)信息的生產(chǎn)和消費(fèi),也必然面臨這樣的轉(zhuǎn)變。我們不缺內(nèi)容,缺的是高質(zhì)量的內(nèi)容,特別是缺由消費(fèi)者特定場景所定義的高質(zhì)量內(nèi)容,包括事關(guān)國計(jì)民生的優(yōu)質(zhì)科學(xué)性內(nèi)容。

剛才Bruckman教授講到,知識本質(zhì)上是一種社會建構(gòu)。其實(shí)各種各樣的虛假科學(xué)信息背后,常常也涉及到了很多不同的價(jià)值觀和社會力量之間的話語權(quán)角逐和爭斗。諸如病毒起源、戴口罩的必要性等問題,不僅是科學(xué)性問題,當(dāng)中所涉及的話語權(quán)和定義權(quán),還關(guān)乎大國博弈、防疫政策和責(zé)任歸因的選擇和感知。因?yàn)槲覀儗κ澜绲恼J(rèn)知,歸根到底是受各種所消費(fèi)內(nèi)容的涵化和型塑的。

也正如此,提升民眾的科學(xué)素養(yǎng),讓民眾對事關(guān)其生活質(zhì)量的各種科學(xué)性信息具有基本的鑒別能力或解惑途徑,在大力推進(jìn)科技創(chuàng)新的同時(shí),同步推進(jìn)科學(xué)普及,是一體兩面的重要舉措。面對海量的信息的觸手可及,真正有用的高質(zhì)量信息如何為民所用,需要有可落地的方案。而有效監(jiān)測民眾每日接觸到的內(nèi)容中的虛假科學(xué)信息并及時(shí)加以提醒、清除、糾錯糾偏,是社會良治中信息治理的題中之義。

無論是科學(xué)信息的生產(chǎn)還是虛假科學(xué)信息的監(jiān)測,社會化協(xié)同都是核心機(jī)制。就科學(xué)信息的生產(chǎn)而言,不同機(jī)構(gòu)、領(lǐng)域的專家或科技工作者通過專業(yè)發(fā)表和圈層日常交流,把科學(xué)信息源源不斷輸出到整個(gè)社會的信息傳播系統(tǒng)中。另一方面,科學(xué)信息在通過媒體特別是社會化媒體的多層、多級傳播過程中,大量民眾既作為內(nèi)容的消費(fèi)者又作為內(nèi)容的傳播者參與生產(chǎn),這一過程降低了科學(xué)信息的生產(chǎn)和傳播的門檻。這是我們進(jìn)行虛假科學(xué)信息監(jiān)測所面對的信息生態(tài)環(huán)境。

下面我們首先把虛假科學(xué)信息的信息特征做一個(gè)簡單的梳理。我們從三個(gè)方面進(jìn)行總結(jié),包括語言特征、內(nèi)容特征和對象特征。

首先是語言特征。虛假科學(xué)信息常常有一些明顯的語言表達(dá)方式上的特征,比如“長期服用降壓藥會致死”這類說法,其陳述中通常特別強(qiáng)調(diào)致死、致癌、致殘這一類嚴(yán)重后果。從傳播學(xué)的角度來看,這樣的傳播策略叫訴諸恐懼。這類信息在涉及有關(guān)可能風(fēng)險(xiǎn)時(shí),常??浯笃湓~,或者斷章取義,典型如離開劑量談毒性。事實(shí)上,鑒別社會化媒體上司空見慣的各種食藥品風(fēng)險(xiǎn)內(nèi)容,一定要和具體人群和應(yīng)用場景結(jié)合起來,才有意義。

還有一種常見的表述,是對某類疾病或危害的簡單歸因,即科學(xué)方法論上所說的還原論謬誤。這種表述常常有意無意混淆可能性和必然性之間的差異,把多種原因?qū)е碌默F(xiàn)象,簡單歸咎于某一特定因素。比如“常吃米飯會誘發(fā)糖尿病”這類聳人聽聞的說法,背后就是一種還原論邏輯。

第二是內(nèi)容特征。虛假科學(xué)信息的內(nèi)容,不同于一般的虛假信息之處在于,其所關(guān)涉的事實(shí)是否準(zhǔn)確,涉及到科學(xué)性和專業(yè)性知識或邏輯判斷問題,而在這方面,虛假科學(xué)信息可以巧妙地布下很多認(rèn)知陷阱,在似是而非間,混淆是非,誤導(dǎo)人們的認(rèn)知和行為。如“食鹽含亞鐵*,不可食用”的說法,首先是有意引導(dǎo)民眾把亞鐵*和*進(jìn)行聯(lián)想置換,產(chǎn)生恐懼。亞鐵*跟*是不一樣。其次,食鹽中只含有的極為微量的亞鐵*,一般人每天食用的食鹽量里面包含的亞鐵*,完全不會對人體構(gòu)成健康危險(xiǎn)。但這些相對專業(yè)的知識和邏輯,可能并不為普通民眾所熟悉和了解。

第三是對象特征。很多虛假科學(xué)信息或者科學(xué)謠言的描述對象,常常是一些新興事物,如“量子波動速讀”“5G基站可致癌”“雙黃連可防新冠病毒”等流言或謠言,其中涉及的事物都比較新,超出大部分民眾的知識儲備。媒體或民眾對其真?zhèn)谓柚延兄R難以辨識,于是就會有寧可信其有不可信其無的心理,導(dǎo)致以訛傳訛。

如何進(jìn)行虛假信息的鑒別或監(jiān)測?基本上有兩種思路,即人工鑒別和機(jī)器鑒別。當(dāng)然在辟謠實(shí)踐中,常常是兩種方法結(jié)合起來的,即機(jī)器快速從海量、動態(tài)的信息中定位到一些可疑內(nèi)容,然后通過一系列知識體系、專家系統(tǒng)和人工方法,來判定有關(guān)信息的真?zhèn)?。值得指出的是,兩種方式各有優(yōu)劣。機(jī)器識別效率高,但難以精準(zhǔn)識別專業(yè)性較高的前沿科技內(nèi)容,所以有時(shí)仍需要依賴人工;人工識別包括專家解讀的優(yōu)勢在于,可以判別一些現(xiàn)有文獻(xiàn)和知識庫中尚未有明確論述的一些新興科學(xué)性內(nèi)容表述的真?zhèn)?,如新冠病毒爆發(fā)以來,伴隨病毒傳播的還有諸多虛假科學(xué)信息。由于人們對新冠病毒的性質(zhì)的認(rèn)知也有一個(gè)過程,因此,當(dāng)有關(guān)新冠病毒特性的一些科學(xué)流言和謠言出現(xiàn)時(shí),依賴已有的知識體系來進(jìn)行機(jī)器識別,注定是不可靠的,而是需要仰仗一線醫(yī)務(wù)工作者和科學(xué)家的最新研究發(fā)現(xiàn)和臨床經(jīng)驗(yàn)才能判斷真?zhèn)?。?dāng)然人工鑒別的缺點(diǎn)是效率低。因此,兩者需要有機(jī)結(jié)合。

下面是我針對我們前面對虛假科學(xué)信息三個(gè)方面特征的總結(jié)梳理,談?wù)勅斯ぶ悄苤μ摷倏茖W(xué)信息監(jiān)測的解決思路。

基于虛假科學(xué)信息的語言特征,我們可以采用表示學(xué)習(xí)技術(shù),來對海量動態(tài)的內(nèi)容中的虛假科學(xué)信息進(jìn)行快速的初步定位和識別。通過表示學(xué)習(xí),把待判別文本轉(zhuǎn)化為低維度向量,隨后利用深度神經(jīng)網(wǎng)絡(luò),學(xué)習(xí)這些向量表示中的信息,達(dá)到快速進(jìn)行語義分析的目的?;谡Z言特征進(jìn)行的語義分析技術(shù),目前相對來說已經(jīng)比較成熟。這是進(jìn)一步對有關(guān)內(nèi)容科學(xué)性進(jìn)行判別的前提,即我們首先需要讓機(jī)器知道有關(guān)內(nèi)容的主題和觀點(diǎn)具體是什么。

基于內(nèi)容特征,我們可以借助知識圖譜作為破解虛假科學(xué)信息的途徑。知識圖譜是人類已有知識的精華,是人類構(gòu)建的知識網(wǎng)絡(luò),網(wǎng)絡(luò)里的每個(gè)節(jié)點(diǎn)就代表了某一個(gè)概念,而節(jié)點(diǎn)之間的連邊,就代表了這些概念之間的關(guān)聯(lián)。我們可以將知識圖譜和神經(jīng)網(wǎng)絡(luò)結(jié)合,識別虛假科學(xué)信息,即從待判別文本中,抽取出重要的概念以及概念之間的關(guān)聯(lián),并與知識圖譜中這兩個(gè)概念對應(yīng)的實(shí)體節(jié)點(diǎn)之間的關(guān)聯(lián)路徑進(jìn)行對比,看看待判別文本中概念之間的關(guān)聯(lián)性(如“轉(zhuǎn)基因食品”引發(fā)“癌癥”這一表述)的真?zhèn)位虼嬖诘目赡苄?。在科學(xué)謠言的判別中,大部分謠言內(nèi)容的破解,利用知識圖譜能夠高效地進(jìn)行。

基于虛假科學(xué)信息的對象特征,即有關(guān)話題對象或主題通常較新,科學(xué)性和專業(yè)性較強(qiáng),我們提出多層次信息挖掘這樣一個(gè)思路和對策。

所謂多層次,根據(jù)廣義上的“知識圖譜”之“知識”的成熟度,我們區(qū)分了正式出版的文獻(xiàn)、預(yù)印本平臺內(nèi)容、以及各種知識問答類眾包平臺。典型的出版文獻(xiàn)通常是經(jīng)過同行評審的,其包含的概念和知識體系相對比較成熟、自洽,大致和上述通常意義上的“知識圖譜”中的來源知識對應(yīng);鑒于正式出版的審稿、修改周期通常比較長,而諸如新冠疫情這樣的公共衛(wèi)生問題又人命關(guān)天十分緊急,因此,近年來興起一種預(yù)印本發(fā)布制度,讓很多前沿研究成果可以第一時(shí)間可以為同行甚至媒體知曉和參考,雖然其中的內(nèi)容和結(jié)論可能存在出錯風(fēng)險(xiǎn),但在對有關(guān)新問題、新挑戰(zhàn)缺乏更好認(rèn)知和對策的情況下,聊勝于無,預(yù)印本平臺上看似不一定“成熟”的內(nèi)容,對于有關(guān)新興科學(xué)主題的信息真?zhèn)蔚恼鐒e,仍可能起到極有價(jià)值的參考作用。最后就是知識問答類眾包平臺,以及廣義上存在于各種論壇、圈層上針對有關(guān)新興、前沿問題的專業(yè)內(nèi)容探討和分享,理論上,這部分內(nèi)容也應(yīng)該作為一個(gè)社會知識生產(chǎn)的一種機(jī)制,納入到虛假科學(xué)信息鑒別可資參考和依賴的來源中。我們可以想象,在未來的某一天,我們的人工智能發(fā)展到這樣一種理想的水平,即每一個(gè)用戶在其生活場景中遇到的每一個(gè)不知真?zhèn)蔚目茖W(xué)問題,都可以第一時(shí)間通過諸如語音搜索引擎這種方式,向全網(wǎng)或全社會詢問或求助;而全網(wǎng)或全社會也能在第一時(shí)間,把對這個(gè)問題的最新、最優(yōu)、最權(quán)威認(rèn)知,以提問者所能理解的方式回應(yīng)給他,實(shí)現(xiàn)無縫交互。借助于無所不在的像神經(jīng)網(wǎng)絡(luò)一樣的社會信息傳播系統(tǒng),一個(gè)社會通過人工智能,最終得以把整個(gè)社會的民智進(jìn)行有效的萃取整合。由此,整個(gè)社會的知識和智慧,真正成為每一個(gè)個(gè)體予求予取的外腦般的不竭源泉。到那個(gè)時(shí)候,無論虛假信息如何千變?nèi)f化深藏不露,都將被人們輕易鑒別。

顯然,我們離這一天還比較遙遠(yuǎn)。要實(shí)現(xiàn)這樣的一幅理想圖景,我們不僅需要整合知識,還需要協(xié)調(diào)社會不同民眾的價(jià)值觀,即對事實(shí)的解讀。不僅涉及到對知識的整合,還涉及到對一個(gè)社會倫理價(jià)值道德觀念的整合,體現(xiàn)一個(gè)社會的集體理性和智慧。因此,從根本意義上言,這種多層次信息挖掘和綜合研判,是對全社會智慧的有效整合。

總結(jié)而言,我們提出了這樣一套基于人工智能進(jìn)行虛假科學(xué)信息監(jiān)測的框架和思路。基于語言特征,機(jī)器學(xué)習(xí)和語義分析可以幫助我們識別海量內(nèi)容中科學(xué)性方面可疑的信息,這方面的人工智能技術(shù)現(xiàn)在已經(jīng)比較成熟?;趦?nèi)容特征的檢測,利用已有的知識圖譜,可以比較高效的解決大量的虛假科學(xué)信息的識別問題,但是它可能不能解決層出不窮的新興話題的真?zhèn)闻袛鄦栴}?;趯ο筇卣鞯亩鄬哟涡畔⑼诰?,通過對分散在社會不同系統(tǒng)和平臺上的知識體系和認(rèn)知主體的智慧集成,理論上,我們可以對各種各樣的虛假科學(xué)信息的鑒別需求作出快速回應(yīng)。

值得強(qiáng)調(diào)的是,這個(gè)過程不僅涉及知識鑒別,還涉及到社會層面的組織和協(xié)同。事實(shí)上,大數(shù)據(jù)和社會化媒體的發(fā)展,一方面具有對普通民眾和整個(gè)社會進(jìn)行賦能的潛力;另一方面,大量虛假、不實(shí)信息充斥其中,也使得有效信息的甄別和利用成為新的挑戰(zhàn),賦能不當(dāng),可能徒耗民眾的精力、時(shí)間和資源,變成耗能。這不是一個(gè)小問題。如我一開始所言,科學(xué)信息不光是科學(xué),它還可能關(guān)涉到政治和經(jīng)濟(jì),關(guān)乎大國之間的博弈和競爭,涉及到普通人的日常生活,因此,如何進(jìn)行一個(gè)社會的信息良治,值得我們投入更多的關(guān)注。

申請創(chuàng)業(yè)報(bào)道,分享創(chuàng)業(yè)好點(diǎn)子。點(diǎn)擊此處,共同探討創(chuàng)業(yè)新機(jī)遇!

相關(guān)文章

  • 盤古大模型,不一樣的「煙火氣」

    文/八真出品/節(jié)點(diǎn)商業(yè)組2023年已過半,但AI大模型依舊熱的發(fā)燙??萍疾啃乱淮斯ぶ悄馨l(fā)展研究中心的《中國人工智能大模型地圖研究報(bào)告》顯示,迄今為止,中國已發(fā)布79個(gè)10億參數(shù)規(guī)模以上的大模型。與此同時(shí),伴隨著越來越多的選手謀局落子和下場奪舍,把這場摧枯拉朽的科技盛典推向高潮,更多人開始思考,AI

    標(biāo)簽:
    ai技術(shù)
  • PRINS.AI榮獲2023SAIL之星

    PRINS平臺被世界人工智能大會授予2023年人工智能行業(yè)著名的SAIL之星。這證明了公司在AI人工智能方面所做的努力。PRINS(PRINSAITechnologyLtd)是一家專注于虛擬體驗(yàn)技術(shù)解決方案的技術(shù)公司,由人工智能研究人員和技術(shù)專家組成的核心團(tuán)隊(duì)創(chuàng)立。目前已獲得多家知名投資機(jī)構(gòu)的投資,

    標(biāo)簽:
    ai技術(shù)
  • AI+軟件,為什么可以看多用友?

    文/七公出品/節(jié)點(diǎn)商業(yè)組2023年,“ChatGPT”的問世讓人工智能(AI)空前興奮和繁盛。有人高呼這是“iPhone時(shí)刻”,有人振臂這是第四次工業(yè)革命,也有人驚嘆這是新一代的“火”和“電”??偠灾?,這場史無前例的大變革,正在復(fù)刻2015年前后的“互聯(lián)網(wǎng)+”行情,推動“AI+”成為未來十幾年的發(fā)

    標(biāo)簽:
    ai技術(shù)
  • 匯聚中國AI頂尖力量 云天勵飛參與華為AI大模型聯(lián)合創(chuàng)新

    2023年7月6日,第六屆世界人工智能大會(WAIC2023)在上海開幕,“人工智能大模型”是本屆大會的備受矚目的話題,據(jù)悉,在昇騰AI大模型的創(chuàng)新研發(fā)中,華為聯(lián)手26家行業(yè)領(lǐng)軍企業(yè),組建了一支協(xié)同創(chuàng)新的“AI明星隊(duì)”,云天勵飛作為中國人工智能企業(yè)的杰出代表,和互聯(lián)網(wǎng)大廠、運(yùn)營商、科研院所等優(yōu)秀團(tuán)隊(duì)

    標(biāo)簽:
    ai技術(shù)
  • 用友大易:邁入AI招聘2.0時(shí)代,讓人力資源回歸本質(zhì)

    這幾個(gè)月來,以ChatGPT為代表的生成式AI展現(xiàn)出的能力令世界驚嘆。自從2016年AlphaGo戰(zhàn)勝李世石掀起了一波AI浪潮后,AI仿佛已經(jīng)沉寂了很久,ChatGPT的橫空出世就如同一束耀眼的光芒,讓AI這個(gè)名詞重回C位。過去在AI1.0時(shí)代,主要通過訓(xùn)練模型來實(shí)現(xiàn)圖像識別、聲音識別、語言處理等特

    標(biāo)簽:
    ai技術(shù)

熱門排行

信息推薦