1. 創(chuàng)業(yè)頭條
  2. 前沿領域
  3. 人工智能
  4. 正文

搜狗擊敗訊飛阿里,獲IWSLT國際口語機器翻譯評測大賽冠軍

 2018-10-31 10:40  來源:互聯(lián)網  我來投稿 撤稿糾錯

  域名預訂/競價,好“米”不錯過

近日,在剛剛落幕的IWSLT(International Workshop on Spoken Language Translation)國際頂級口語機器翻譯評測大賽上,搜狗擊敗訊飛、阿里巴巴, APPTEK(美國應用科技公司)、AFRL(美國空軍研究實驗室)以及KIT(德國卡爾斯魯厄理工學院)等國際國內多個強勁對手,一舉奪得了2018年IWSLT大賽Baseline Model(基線模型)賽道冠軍,代表中國向世界彰顯了AI領域的技術硬實力!

表1 IWSLT大賽Baseline Model賽道最終結果

--取自IWSLT官方公布結:https://workshop2018.iwslt.org/downloads/Proceedings_IWSLT_2018.pdf

這是搜狗繼WMT 2017機器翻譯頂級評測大賽奪冠之后,所摘得的又一翻譯領域的技術桂冠。短期內連續(xù)登頂世界第一的位置,充分證明了搜狗在翻譯行業(yè)特別是口語翻譯領域已位居領先地位。

IWSLT是什么比賽?

IWSLT是國際最具影響力的口語機器翻譯評測比賽,從2004年開始已經舉辦了15屆。每屆比賽都吸引了世界各地機器翻譯領域的知名企業(yè)和研究機構參與,本屆比賽吸引了訊飛、阿里巴巴等國內公司,愛爾蘭ADAPT中心,美國約翰霍普金斯大學,德國卡爾斯魯厄理工學院,芬蘭赫爾辛基大學,英國愛丁堡大學,美國AppTek公司等多家國際知名大學、研究機構和公司參加。

表2 IWSLT2018大賽參賽情況

--取自IWSLT官方公布結果:

:https://workshop2018.iwslt.org/downloads/Proceedings_IWSLT_2018.pdf

本屆IWSLT 2018的口語機器翻譯任務主要評測基于指定數據集從英語到德語的語音翻譯能力,共分為Baseline Model(基線模型賽道)和End-to-End(端到端賽道)兩個賽道,其中Baseline Model賽道主要評測語音翻譯的流水線方案,輸入語音先通過語音識別系統(tǒng)得到語音識別結果,之后將結果送入機器翻譯系統(tǒng)獲得譯文,這也是業(yè)內最主流、效果最好的語音翻譯解決方案,市場上商用機器同傳、翻譯機等語音翻譯類產品幾乎都采用了類似的方法;End-to-End則是本次評測新增設的賽道,主要鼓勵參賽方探索基于神經網絡的端到端語音翻譯解決方案,希望能夠輸入語音,基于深度神經網絡模型直接輸出譯文,這種方法目前仍處于早期研究階段,受制于語音-文本平行語料難以大規(guī)模采集、算法研究不成熟等因素的限制,距離商用仍存在較大距離。本次評測中,在訓練集、測試集相同的情況下,Baseline Model賽道最好的系統(tǒng)取得了28.09的BLEU(機器翻譯質量評價指標,值越大代表翻譯質量越好),而End-to-End賽道最好的系統(tǒng)僅取得了19.4的BLEU,較Baseline Model賽道相差8.69個BLEU,差距非常明顯,也證明了Baseline Model賽道評測的算法仍是目前最可行和實用的解決方案。

搜狗本次參加的是Baseline Model賽道的評測,并取得了第一名的好成績。評測任務面向TED演講和大會學術報告場景,測試集包括來自英國、歐洲、印度等各個國家的英語演講者,存在噪聲、口音、自由表達等復雜語音現象,同時語言中存在大量領域專有名詞和口語化的表達(如:大量語氣詞、錯誤語法表達等),具有極強的實戰(zhàn)意義和挑戰(zhàn)性。最終,搜狗提交的系統(tǒng)BLEU值達到28.09,領先排名第二的科大訊飛1.6個BLEU,證明了搜狗在口語機器翻譯領域強大的實力。

AI賽道中持續(xù)發(fā)力,搜狗領跑語音翻譯行業(yè)

搜狗的AI戰(zhàn)略藍圖之中,語言是最核心的重頭戲。一直以來,搜狗都堅持著“自然交互+知識計算”的人工智能核心方向,并持續(xù)深耕技術,推動技術向產品的快速轉化,2016年,搜狗發(fā)布了自有人機交互解決方案-知音引擎。擁有充足真實語料數據優(yōu)勢的搜狗,將語音識別與機器翻譯技術相結合,并在2016年推出了全球首款商用AI同傳系統(tǒng)-搜狗同傳,引領了語音翻譯技術的普及與應用。通過數百場的國際會議“實戰(zhàn)”,搜狗同傳獲得了無數媒體和觀眾的好評,成為當下炙手可熱的“AI字幕君”。

與此同時,搜狗也推出了一系列的智能硬件,將語音翻譯技術應用到了更廣闊的場景之中,幫助用戶打破了跨國交流時的語言困境。2018年3月,搜狗推出了搜狗旅行翻譯寶,具備離線翻譯功能與拍照翻譯功能,讓馬化騰都為之心動,在朋友圈里大打廣告。作為首款智能翻譯硬件,它支持42種語言對話翻譯,解決了旅游場景中用戶聽不懂、看不懂、不會說等真實痛點。該項產品在京東平臺首發(fā)當日即告售罄,首日銷售額破千萬。與此同時,搜狗還推出了錄音翻譯筆,提供錄音轉寫、對話翻譯、同聲傳譯等功能,把AI同傳落地到了消費級產品之中,開拓了語音翻譯的新航道。

眾所周知,人工智能是未來科技的風向標。通過這次在IWSLT比賽中的優(yōu)秀成績,可以看到以搜狗為代表的國產科技巨頭企業(yè),已表現出了引領行業(yè)的技術硬實力。

申請創(chuàng)業(yè)報道,分享創(chuàng)業(yè)好點子。點擊此處,共同探討創(chuàng)業(yè)新機遇!

相關標簽
搜狗翻譯
ai技術

相關文章

  • 匯聚中國AI頂尖力量 云天勵飛參與華為AI大模型聯(lián)合創(chuàng)新

    2023年7月6日,第六屆世界人工智能大會(WAIC2023)在上海開幕,“人工智能大模型”是本屆大會的備受矚目的話題,據悉,在昇騰AI大模型的創(chuàng)新研發(fā)中,華為聯(lián)手26家行業(yè)領軍企業(yè),組建了一支協(xié)同創(chuàng)新的“AI明星隊”,云天勵飛作為中國人工智能企業(yè)的杰出代表,和互聯(lián)網大廠、運營商、科研院所等優(yōu)秀團隊

    標簽:
    ai技術
  • 用友大易:邁入AI招聘2.0時代,讓人力資源回歸本質

    這幾個月來,以ChatGPT為代表的生成式AI展現出的能力令世界驚嘆。自從2016年AlphaGo戰(zhàn)勝李世石掀起了一波AI浪潮后,AI仿佛已經沉寂了很久,ChatGPT的橫空出世就如同一束耀眼的光芒,讓AI這個名詞重回C位。過去在AI1.0時代,主要通過訓練模型來實現圖像識別、聲音識別、語言處理等特

    標簽:
    ai技術
  • 新發(fā)布的PaaS2.0,能否助力涂鴉智能再起飛?

    文:互聯(lián)網江湖作者:志剛2023年的IoT需要一個新故事。6月29日,涂鴉智能在開發(fā)者大會上,發(fā)布了企業(yè)級戰(zhàn)略PaaS2.0,希望通過一個平臺+四大開發(fā)服務,建立起IoT生態(tài)。對于這場發(fā)布會,市場的態(tài)度是積極的。美東時間6月29日收盤,涂鴉智能美股股價上漲5.6%,來到1.87美元/股。近日股價穩(wěn)定

    標簽:
    ai技術
  • 大模型難掩AI制藥的悲傷:越過山丘,無人等候

    美團曾經的二號人物王慧文對標OpenAI的創(chuàng)業(yè)項目光年之外,以20億賣給美團,再度引發(fā)市場對大模型的熱議。

    標簽:
    ai技術
  • 拾起王慧文的AI夢,美團沖向“光年之外”?

    2020年底,王慧文在朋友圈寫下這句話時,外界本以為這位伴隨中國互聯(lián)網發(fā)展而持續(xù)創(chuàng)業(yè)20年的人物即將告別創(chuàng)業(yè)舞臺。但是,一個曾經多次創(chuàng)業(yè),正值壯年的互聯(lián)網老將心中的創(chuàng)業(yè)熱情是難以熄滅的。

    標簽:
    ai技術
  • “創(chuàng)造市場”與“算法進化”,中美AI競速的岔路口

    “人工智能的商業(yè)模式,是要創(chuàng)造一個市場,而非一個算法”。這是世界AI泰斗MichaelI.Jordan的觀點。而當前的全球AI市場,占據主導地位的中美雙方,卻也走出了兩條截然不同的技術路徑,前者執(zhí)著于前沿技術的探索,后者則發(fā)力應用優(yōu)化和商業(yè)化落地。南轅北轍的兩個方向,或許已經無法直接進行排位先后、優(yōu)

    標簽:
    ai智能
  • 智能體進化發(fā)展了一年,現在的RPA Agent迭代到什么程度了?

    智能體進化發(fā)展了一年,現在的RPAAgent迭代到什么程度了?從實在智能最新發(fā)布的實在Agent7.0,看RPAAgent的迭代升級抓取豆瓣信息、自己制作PPT,這款AIAgent真的實現了流程全自動化AIAgent構建到執(zhí)行全自動化,持續(xù)進化RPAAgent再次降低智能體應用門檻實在智能重磅發(fā)布實

  • 崔大寶:大模型降溫背后的難點、卡點、節(jié)點

    崔大寶|節(jié)點財經創(chuàng)始人進入2024年,大模型似乎有熄火之勢:資本市場,與之關聯(lián)的概念炒不動了,英偉達股價動輒暴跌重挫,引發(fā)“泡沫戳破”的擔憂;消費市場,BATH們的推新活動少了,產品更新迭代的速度慢了,民眾的關注度降了……熱鬧的大概只剩下兩場酣仗:自5月15日字節(jié)跳動宣布“以厘計費”,打響國內大模型

    標簽:
    大模型
  • 這一屆“出道”的數字人,已經拿捧上了“鐵飯碗”

    文|智能相對論作者|陳泊丞好消息!你心心念念的事業(yè)單位發(fā)錄取公告了!壞消息!他們沒錄你,錄了個數字人。圖片來源網絡隨著數字人技術的突破,越來越多的傳統(tǒng)企業(yè)和機構開始用上了“數字員工”。甚至很多中國人心心念念的“鐵飯碗”,也被這些數字人給捧上了。數字人捧上了“鐵飯碗”簡單翻看一下全國各地事業(yè)單位的“錄

    標簽:
    數字人
  • 來到IPO關口,地平線離“三分天下”還有多遠?

    黑芝麻智能敲鐘后,港交所門口又有一些智駕芯片企業(yè)引發(fā)關注。據悉,近日地平線已通過中國證監(jiān)會IPO備案,擬發(fā)行不超過11.5億股境外上市普通股并在香港聯(lián)合交易所上市,預計籌集約5億美元資金。從天眼查可以了解到,該公司成立于2015年,是一家乘用車高級輔助駕駛(ADAS)和高階自動駕駛(AD)解決方案供

  • 機器人大會引領產業(yè)動向,卓翼飛思繪制無人系統(tǒng)教科研新藍圖

    8月21日,萬眾矚目的2024世界機器人大會暨博覽會在北京亦創(chuàng)國際會展中心盛大開幕。這場為期5天,集“展覽”“論壇”“賽事”于一體的機器人盛會,反映了當下機器人領域的繁榮生態(tài)。據官方統(tǒng)計數據,今年現場逛展觀眾高達25萬人次,比去年增加25%。機器人行業(yè)有多火?看看2024世界機器人大會火爆程度便可知

  • 卓翼智能:超大載重高烈度環(huán)境特種智能系留無人平臺的應用與未來

    瞄準場景需求,打造國內領先的自主可控、高質量超大載重高烈度環(huán)境特種智能系留無人平臺。卓翼智能亮相HICOOL峰會以科技實力榮摘創(chuàng)業(yè)大賽一等獎這個比賽5年培育出16家“獨角獸”HICOOL2024全球創(chuàng)業(yè)者峰會暨創(chuàng)業(yè)大賽已于8月25日在北京圓滿落下帷幕,大賽共吸引了124個國家和地區(qū)的7406個創(chuàng)業(yè)項

  • 60萬獎金召喚AI創(chuàng)新者,2024無錫國際人工智能創(chuàng)新應用大賽火熱進行中!

    人工智能是新一輪科技革命和產業(yè)變革的重要驅動力量。無錫市作為中國的科技創(chuàng)新中心之一,正通過構建人工智能"算力+算法+數據"三要素齊備的產業(yè)生態(tài),為產業(yè)技術創(chuàng)新應用提供強大支撐,通過“AI+”行動推動人工智能與多個產業(yè)交叉融合,實現技術落地和產業(yè)化,加速形成新質生產力,打造具有國際競爭力的產業(yè)創(chuàng)新智造

  • “云+AI”驅動操作系統(tǒng)創(chuàng)新升級,龍蜥堅持可持續(xù)發(fā)展路線

    近日,2024龍蜥操作系統(tǒng)大會(OpenAnolisConference)在北京圓滿召開,此次大會由中國計算機學會開源發(fā)展委員會、中關村科學城委員會、海淀區(qū)委網信辦、中國開源軟件推進聯(lián)盟指導,龍蜥社區(qū)主辦,阿里云、浪潮信息、Intel、中興通訊、Arm、中科方德等24家理事單位共同承辦,主題為“進化

編輯推薦