近年來,全球經濟增長持續(xù)放緩,國際社會風云變幻,大國之間摩擦不斷,貿易保護主義日趨抬頭,“逆全球化”現(xiàn)象更是頻繁顯現(xiàn)。與此同時,全球領域的科技創(chuàng)新發(fā)展也面臨著前所未有的挑戰(zhàn)。
科學技術是生產力中最為活躍的因素,科學變革與技術進步在造福人類的同時也帶來了一系列問題,甚至安全風險。比如當下人們關于人工智能的安全,可控,可靠和可解釋性等議題就爭議不斷。一方面是由于AI對經濟社會活動的影響日益深入,AI已經從生產環(huán)節(jié)優(yōu)化逐漸進入分配環(huán)節(jié)的決策。另一方面人們要為經濟增長變慢分配關系日益緊張的責任找到一個載體。
比如歐盟就在2018年5月25日正式實施了史上最嚴的個人數(shù)據保護條例GDPR(通用數(shù)據保護條例),而在2019年1月21日,谷歌公司就成為依據此法遭高額處罰的首家美國科技公司,被罰款5000萬歐元。
盡管有這樣的小插曲,但AI作為新一代技術革命,依然被認為是未來全球經濟增長的重要驅動力。根據Gartner最新發(fā)布的預測報告,2022年人工智能驅動的商業(yè)價值將高達3.9萬億美元。而在當下,面對復雜多變的國際政治環(huán)境和充滿斗爭的環(huán)境,人工智能產業(yè)最需要解決的是:如何找到一條新航道,實現(xiàn)針對GDPR這樣的法律法規(guī)合規(guī)的人工智能算法設計,和人工智能在數(shù)據層面的公平合作。
消除數(shù)據短缺,微眾銀行AI團隊開辟新航道
實際上,一些具有遠見的人工智能科學家以及人工智能團隊和企業(yè)早已開始行動。
就在最近,國際人工智能領域最為權威與重要的協(xié)會之一AAAI(Association for the Advancement of Artificial Intelligence)在美國舉辦AAAI 2019年會。一直推崇通過聯(lián)邦學習框架來解決數(shù)據安全、短缺等問題的,微眾銀行首席人工智能官(CAIO),國際人工智能學會理事長楊強教授作為特邀演講嘉賓,發(fā)表了主題為“GDPR、數(shù)據短缺和人工智能”的特邀演講(AAAI Invited Talk),全面講述“聯(lián)邦遷移學習”的安全的分布式建模原理和在數(shù)據合規(guī)上的意義。
(微眾銀行首席人工智能官(CAIO)楊強教授主題演講“GDPR、數(shù)據短缺和人工智能”現(xiàn)場)
楊強教授在演講中直指當前數(shù)據短缺的根本原因——“如今機器學習最薄弱的環(huán)節(jié)其實并非算法結構不夠豐富、準確率不夠高,而是在高質量大數(shù)據的可用性方面面臨著嚴峻的挑戰(zhàn)。在許多實際應用中,數(shù)據之間是相互孤立的。集成數(shù)據的工作越來越困難,其中一部分原因是對用戶隱私和數(shù)據安全的嚴重擔憂。嚴格的政府法規(guī),例如GDPR的實行讓許多大數(shù)據公司噤若寒蟬,不敢再互相交流數(shù)據了,這對于極度依賴數(shù)據的機器學習是一個巨大的挑戰(zhàn)。”
對此,楊強教授透露微眾銀行AI正在引領業(yè)界積極尋找正向的應對方法,思考如何把 GDPR 囊括在人工智能和機器學習框架之內。其中聯(lián)邦遷移學習Federated transfer learning作為重要范例,可實現(xiàn)在不共享各自數(shù)據的前提下,利用雙方的數(shù)據實現(xiàn)共享模型的性能增長。
實際上,微眾銀行這一技術設想早已經得到業(yè)界認可。2018年12月4日,電氣和電子工程師協(xié)會標準委員會(IEEE Standard Association)就批準了由微眾銀行發(fā)起的關于聯(lián)邦學習架構和應用規(guī)范的標準P3652.1(Guide for Architectural Framework and Application of Federated Machine Learning)立項。微眾銀行成為工作組的召集單位,工作組主席由楊強教授擔任。工作組將在聯(lián)邦學習的算法框架規(guī)范,使用模式和使用規(guī)范上推動相關國際標準的制定,以幫助和指導不同類別的企業(yè)在合作過程中合法合規(guī)的共同使用數(shù)據。而作為工作組主席,楊強教授還在會上介紹了IEEE聯(lián)盟標準的工作進展,引發(fā)廣泛關注,反響積極熱烈。
并且,在這次AAAI 2019年會上,微眾銀行AI團隊的展臺前,更是人頭攢動,眾多學者教授、工業(yè)專家、國內外學生都主動與微眾銀行現(xiàn)場工作人員,就微眾在AI方向的成果進行探討交流、以此加深了解,甚至尋求合作與人才引進。微眾銀行AI團隊也被邀請在AAAI大會上做了聯(lián)邦遷移學習的教程,系統(tǒng)講述了聯(lián)邦遷移學習的理論依據和實踐案例。
不難看出,無論是楊強教授受邀在人工智能領域殿堂級的年會上進行主旨演講,還是由電氣和電子工程師協(xié)會標準委員會被批準應用規(guī)范立項,還是展臺前的圍觀交流,都證明微眾銀行AI團隊的技術實力和前沿研究,已經得到國際學術業(yè)界的廣泛認可。
聯(lián)邦學習框架的優(yōu)勢到底是什么?
首先需要了解何為聯(lián)邦學習?實際上就是一種加密的分布式機器學習技術,參與各方可以在不披露底層數(shù)據和底層數(shù)據的加密(混淆)形態(tài)的前提下共建模型。
(聯(lián)邦學習基本框架)
而聯(lián)邦學習具有四大顯著優(yōu)勢。第一是數(shù)據隔離,數(shù)據不會泄露到外部,滿足用戶隱私保護和數(shù)據安全的需求;第二是能夠保證模型質量無損,不會出現(xiàn)負遷移,保證聯(lián)邦模型比割裂的獨立模型效果好。第三則是參與者地位對等,能夠實現(xiàn)公平合作;最后,則是能夠保證參與各方在保持獨立性的情況下,進行信息與模型參數(shù)的加密交換,并同時獲得成長。
總而言之,作為一個機器學習框架,聯(lián)邦學習能有效幫助多個機構在滿足用戶隱私保護、數(shù)據安全和政府法規(guī)的要求下,進行數(shù)據使用和建模。
而在聯(lián)邦學習的基礎上,遷移學習的能力也可以被搭建出來,做到舉一反三的效果。這個總的模型叫做「聯(lián)邦遷移學習」(Federated Transfer Learning)。
通俗的講,聯(lián)邦遷移學習不將數(shù)據以任何形式堆放在一起,而是像各自堆放成不同的高山,在每座高山的頂上安排一個機器人下山尋路,只同步機器人之間的步調而非數(shù)據本身。在此基礎上,不同機器人還可以實現(xiàn)遷移學習以提高對各自數(shù)據的理解能力。
舉個例子,假設有三個不同的企業(yè) A、B 和 C,每個企業(yè)都有不同數(shù)據。第一個企業(yè)A有一些用戶特征 數(shù)據;第二個企業(yè) B 有其他的一些用戶特征數(shù)據,同時也包括一些標注數(shù)據;第三個企業(yè) C 是一個銀行,可能有有關金融的特征和標注數(shù)據。那么,按照 GDPR 準則,這三家企業(yè)并不能粗暴地把三方數(shù)據加以合并,因為用戶并沒有同意。
但是,假設三方各自建立一個模型,而這個行為已經獲得各自用戶的認可。然后,通過加密機制下的參數(shù)交換方式, 在不違反法規(guī)情況下,建立一個虛擬的共有模型。這個虛擬模型將三方數(shù)據聚合在一起一樣,但是數(shù)據本身不移動, 也不泄露隱私,模型在各自的區(qū)域還是為本地的目標服務。這就在合法合規(guī)的情況下,實現(xiàn)了數(shù)據的流動。
在這樣一個全新的人工智能框架體系下,各個參與者的身份和地位相同,數(shù)據互相獨立,又融為一體,也就不會導致企業(yè)之間產生隔閡。對于現(xiàn)階段,解決企業(yè)之間在確保不侵犯用戶隱私、不違反法規(guī)和不損害企業(yè)之間合作關系的情況下,進行數(shù)據的流動和互通有無,無疑是一個極具遠見的創(chuàng)新思路,擁有積極的科技創(chuàng)新意義。
聯(lián)邦學習領域首個商用級開源項目誕生,誰將受益?
此外,在AAAI年會上,微眾銀行AI團隊還正式發(fā)布了聯(lián)盟AI生態(tài)系統(tǒng)(Federated AI Ecosystem),同時開源聯(lián)盟AI解決方案FATE(Federated AI Technology Enabler)。
作為聯(lián)邦學習領域第一個商用級開源項目,F(xiàn)ATE為開發(fā)者提供所必須的多方協(xié)同建模工作流管理、加密機器學習工具庫和并行計算基礎設施抽象三層能力,同時提供了很多開箱即用的聯(lián)邦學習算法和聯(lián)邦遷移學習算法供開發(fā)者參考,極大簡化了聯(lián)盟AI開發(fā)的流程并降低了部署難度。
事實上,早有合作企業(yè)已經加入聯(lián)盟AI生態(tài)。此前,全國連鎖租車品牌一嗨租車與微眾銀行共同宣布達成深度戰(zhàn)略合作關系,宣布雙方將在汽車出行、會員服務、金融保險、區(qū)塊鏈技術等方面展開多場景多維度創(chuàng)新合作。一嗨租車使用聯(lián)邦遷移學習,AI人臉認證技術、支付技術等金融科技,以優(yōu)化提升用戶體驗為目的深度融入租車服務流程,并將租車場景與銀行大數(shù)據風險控制體系相結合,從而為年輕一族及長租客戶提供新的出行生活方式。
不難預測,未來將有更多的企業(yè)可以享受這項科技創(chuàng)新紅利,借此來打造自己的AI數(shù)據模型,推動自身AI應用落地。而據了解,聯(lián)邦學習可應用于不同行業(yè)及其垂直領域,包括金融服務、物流、供應鏈、運營商、醫(yī)療健康等。
從制定行業(yè)標準到發(fā)布聯(lián)盟AI生態(tài)系統(tǒng),為何總是微眾銀行?
最后,一個疑問是,這樣一個影響AI行業(yè)發(fā)展的重大創(chuàng)新舉措,為何會是由微眾銀行AI部門這樣的中國團隊來引領呢?
首先,微眾銀行有一支豪華的AI團隊。其中,首席人工智能官楊強教授是人工智能領域的一個國際專業(yè)權威學者專家和領軍人物。其不僅是國際人工智能協(xié)會(AAAI)第一位華人院士,更是首位和至今為止唯一的AAAI華人執(zhí)委。此外,其還是國際人工智能聯(lián)合會(IJCAI,國際人工智能領域創(chuàng)立最早的頂級國際會議)理事會主席,同樣是第一位擔任IJCAI理事會主席的華人科學家。而其他團隊成員也多是在機器學習、聯(lián)邦學習,聯(lián)邦遷移學習以及這些人工智能技術方面具有豐富的經驗和深厚的積累。
更重要的是,楊強教授及其帶領的AI團隊擁有微眾銀行這樣一個強大的創(chuàng)新平臺。作為國內首家開業(yè)的互聯(lián)網民營銀行。不設線下網點的微眾銀行,所開創(chuàng)的事業(yè)也是國內首創(chuàng),因此創(chuàng)立之初便成功解決如何獲客以及與傳統(tǒng)銀行如何競爭共處等問題。
而微眾銀行的AI科技使其快速找到增長突破口。特別是基于聯(lián)邦遷移學習技術進行多方大數(shù)據安全利用,使得微眾銀行在包括風險評估、差異定價、精準營銷等多個金融場景進行成功實踐,助推微眾銀行實現(xiàn)業(yè)務創(chuàng)新,使得其金融服務覆蓋面不斷提升,社會價值貢獻進一步體現(xiàn)。
舉個例子,過去小微企業(yè)由于缺乏足夠的經營數(shù)據,難以進行信用風險評估,所以一直存在融資難融資貴的問題。而微眾銀行通過創(chuàng)新使用聯(lián)邦遷移學習技術建立合作生態(tài),在不侵犯企業(yè)用戶數(shù)據的情況下,連接了企業(yè)的財務、訂貨、能源等大數(shù)據,對小微企業(yè)經營狀況和信用能夠進行360度模型評估,大大拓展了可貸企業(yè)的范圍。
數(shù)據說明一切。根據微眾銀行披露的小微信貸客戶群數(shù)據顯示,68%的客戶在獲得授信時無任何企業(yè)類貸款記錄;38%的授信客戶在獲得授信時無任何個人經營性貸款記錄。足證,聯(lián)邦學習框架的科技創(chuàng)新意義。
總體而言,隨著微眾銀行在聯(lián)邦學習架構和應用規(guī)范的標準制定推行,以及對于聯(lián)盟AI生態(tài)系統(tǒng)的大量推廣建設,越來越多的企業(yè)加入到聯(lián)盟AI陣營,在合法合規(guī)和保證絕對安全的情況下,進行數(shù)據的互通有無,將大大消除當下企業(yè)與企業(yè)之間、組織與組織之間的數(shù)據隔閡,最終必將助推人工智能發(fā)展邁入新紀元。