當(dāng)前位置:首頁(yè) >  科技 >  互聯(lián)網(wǎng) >  正文

跨越語(yǔ)音日均請(qǐng)求10億次的山和大海,百度輸入法的“平凡之路”

 2020-03-13 10:33  來(lái)源: A5專欄   我來(lái)投稿 撤稿糾錯(cuò)

  域名預(yù)訂/競(jìng)價(jià),好“米”不錯(cuò)過(guò)

文 | 魏?jiǎn)P(yáng)

來(lái)源 | 智能相對(duì)論

2020年的春節(jié)假期因?yàn)樾鹿谝咔榻o所有人來(lái)了個(gè)措手不及,大量“云”服務(wù)被激活,作為在線溝通工具的輸入法首當(dāng)其沖,成為特殊時(shí)期接受考驗(yàn)的中堅(jiān)力量之一,特別是語(yǔ)音輸入能力,更是成為用戶評(píng)價(jià)輸入法是否好用的重要維度。

近日,百度輸入法公布,自1月25日春節(jié)假期以來(lái),百度輸入法日均語(yǔ)音請(qǐng)求量突破10億次大關(guān),再創(chuàng)行業(yè)歷史新高。

在很多人看來(lái),這只不過(guò)一個(gè)數(shù)字而已,但很多年后,我們?cè)賮?lái)回首,日均10億次的語(yǔ)音請(qǐng)求量或?qū)⒊蔀橥苿?dòng)輸入法形態(tài)和操作方式變革的一個(gè)標(biāo)志。

一、10億次,必然是高流量和高標(biāo)準(zhǔn)的雙重滿足

回到百度輸入法日均語(yǔ)音請(qǐng)求突破10億次事件本身,我們需要回答兩個(gè)問(wèn)題,為什么會(huì)產(chǎn)生如此高的數(shù)據(jù)流量?完成這樣的任務(wù)又需要具備哪些素質(zhì)?

第一個(gè)問(wèn)題很好回答,上文提到特殊時(shí)期各種“云”服務(wù)被激活,線上溝通需求呈指數(shù)級(jí)增加,輸入法的使用頻率由此被抬升,此時(shí)比傳統(tǒng)鍵盤打字更快,還不用動(dòng)手,更不用學(xué)習(xí)拼音、五筆這類輸入規(guī)則的語(yǔ)音輸入表現(xiàn)出非常大的優(yōu)勢(shì),輸入法語(yǔ)音請(qǐng)求量刷新歷史記錄也就不足為奇了。

只是在創(chuàng)造語(yǔ)音請(qǐng)求新紀(jì)錄之前,輸入法需要解決自己的流量承受能力,畢竟日均10億次的請(qǐng)求流量不是一個(gè)小數(shù)字,好在經(jīng)受過(guò)“春晚紅包”考驗(yàn)的百度是見過(guò)“世面”的,甚至還有很大余地接下更大的流量壓力。

第二個(gè)問(wèn)題的核心關(guān)鍵在于輸入法不但要能用、好用還需要用戶喜歡用。

首先,在技術(shù)層面,準(zhǔn)確率是無(wú)法繞開的基礎(chǔ)門檻。

作為一種輸入方式,讓用戶愿意使用,首要滿足條件是準(zhǔn)確率,即精準(zhǔn)理解用戶的意圖并將其表達(dá)出來(lái)。

鍵盤打字輸入能夠成為主流輸入方式,很大原因在于用戶的一字一句被完全復(fù)刻,輸入結(jié)果精準(zhǔn)且高效。

相比之下,語(yǔ)音輸入需要經(jīng)過(guò)機(jī)器“識(shí)別”到“翻譯”再到呈現(xiàn)的過(guò)程,輸入鏈條被拉長(zhǎng),如果技術(shù)不夠完善,不但不能完成實(shí)時(shí)語(yǔ)音交互任務(wù),而且只要其中任何一個(gè)環(huán)節(jié)出現(xiàn)問(wèn)題,都會(huì)影響到最終的輸入結(jié)果,準(zhǔn)確度難以保證。

百度去年發(fā)布的流式截?cái)喽鄬幼⒁饬#⊿MLTA),則實(shí)現(xiàn)了中文在線語(yǔ)音識(shí)別的兩大突破:世界上首次實(shí)現(xiàn)了局部注意力建模識(shí)別精度超過(guò)全局注意力模型;世界上第一次大規(guī)模部署在線語(yǔ)音交互注意力模型。

也正是憑借著這一技術(shù),百度解決了傳統(tǒng)Attention模型在識(shí)別中的時(shí)延性,以及因此導(dǎo)致的無(wú)法進(jìn)行大規(guī)模在線語(yǔ)音實(shí)時(shí)交互的問(wèn)題,將百度輸入法在線語(yǔ)音識(shí)別精度提升了15%,超越行業(yè)最高水平15%。同時(shí)在離線語(yǔ)音識(shí)別方面,即使用戶處于地鐵、電梯、隧道或者人流密集等離線場(chǎng)景中,百度輸入法依然可以提供準(zhǔn)確率超過(guò)98%的語(yǔ)音輸入服務(wù)。

其次,在用戶層面,“懂你”比“給你”更重要。

準(zhǔn)確率是滿足用戶需求的基礎(chǔ)門檻,但這也只是解決了“能用”的問(wèn)題,要想讓用戶愛用,并形成使用習(xí)慣,那就要求輸入法要“懂”用戶。

如何理解?

說(shuō)話時(shí)口語(yǔ)化怎么辦?說(shuō)話習(xí)慣中英夾雜怎么辦?說(shuō)話有方言口音又怎么辦?這些情況下,輸入法都能識(shí)別清楚嗎?

很明顯這類說(shuō)話習(xí)慣一旦養(yǎng)成,在短時(shí)間內(nèi)既難糾正,更難改變,特別是一些年長(zhǎng)用戶,讓他們改變幾十年來(lái)形成的口音,基本是一個(gè)不能完成任務(wù),這時(shí)就要求輸入法不能只是被動(dòng)的向用戶提供自己的輸入能力,而要主動(dòng)“遷就”用戶,“聽懂”用戶的意圖。

百度輸入法的“方言自由說(shuō)”和“中英自由說(shuō)”兩大功能就是這一產(chǎn)品設(shè)計(jì)思維下的產(chǎn)物。

前者是通過(guò)技術(shù)優(yōu)化,將普通話和六大方言融合成了一個(gè)語(yǔ)音識(shí)別模型,實(shí)現(xiàn)方言與方言、方言與普通話的混合語(yǔ)音輸入,這也使百度輸入法成為首個(gè)實(shí)現(xiàn)方言免切換語(yǔ)音輸入的輸入法產(chǎn)品。

后者可以在完全不影響中文語(yǔ)音輸入準(zhǔn)確率的情況下,實(shí)現(xiàn)高精準(zhǔn)中英文混合語(yǔ)音識(shí)別輸入。

在去年的百度AI開發(fā)者大會(huì)上,百度輸入法面對(duì)了一段高難度“Rap”識(shí)別挑戰(zhàn):“你的這個(gè)新model效果比baseline好多少,探索技術(shù)的depth和scope是我們的責(zé)任,我很喜歡barrier這個(gè)詞,AI的value其實(shí)就是break barrier”。

這段中英混雜的文字,即便讀出來(lái)也需在腦中回旋許久才能領(lǐng)會(huì)意思,但百度輸入法在現(xiàn)場(chǎng)卻零誤差的識(shí)別出來(lái)了,不但準(zhǔn)確理解還根據(jù)語(yǔ)義進(jìn)行了正確斷句,并且以非??斓乃俣壬掀脸尸F(xiàn)結(jié)果。

最后,在創(chuàng)新層面,總能給用戶帶來(lái)驚喜。

上文提到的無(wú)論是流式截?cái)喽鄬幼⒁饬#⊿MLTA),還是“方言自由說(shuō)”和“中英自由說(shuō)”兩大功能,都是百度輸入法的創(chuàng)新成果。很明顯,因?yàn)閯?chuàng)新給用戶帶來(lái)體驗(yàn)提升的同時(shí),也帶來(lái)了愉悅與驚喜,并因此完成了用戶的拉新與留存。

偶然使用過(guò)百度輸入法用戶,體驗(yàn)過(guò)創(chuàng)新功能后,由路轉(zhuǎn)粉;百度輸入法的老用戶,在經(jīng)歷了輸入法的持續(xù)迭代進(jìn)化,一直處于對(duì)下一次創(chuàng)新功能的期待中,進(jìn)而成為鐵粉。

目前我們看到的百度輸入法呈現(xiàn)在外好像只是單純的聲音到文字的轉(zhuǎn)換,但事實(shí)上,百度輸入法已經(jīng)成為軟硬一體、語(yǔ)音語(yǔ)言一體,識(shí)別和交互一體的復(fù)雜應(yīng)用。

綜上而言,達(dá)成10億次成就,除了有深厚的技術(shù)實(shí)力作為支撐和保障,還需有技術(shù)溫度,帶來(lái)“人情”,感知“冷暖”。

二、打開AI的魔盒,我們到底需要怎樣的輸入法?

我們注意到,隨著AI開始進(jìn)入工業(yè)大生產(chǎn)階段,輸入法的形態(tài)和模式也開始發(fā)生變化,從鍵盤打字輸入到語(yǔ)音輸入,我們看到的只是其中的一個(gè)表象,在AI的驅(qū)動(dòng)下,輸入法正由內(nèi)向外在更多維度發(fā)生著變化。

在討論輸入法形態(tài)變化之前,我們需要理解輸入法進(jìn)化的原因。

首先,用戶需求和場(chǎng)景倒逼,鍵盤打字輸入已經(jīng)out了。

在互聯(lián)網(wǎng)時(shí)代,輸入法只出現(xiàn)在PC端,使用場(chǎng)景單一,輸入法廠商只需保證輸入結(jié)果的準(zhǔn)確和快捷即可具備較強(qiáng)的競(jìng)爭(zhēng)力。

進(jìn)入移動(dòng)互聯(lián)網(wǎng)時(shí)代,用戶使用的智能終端變多,使用場(chǎng)景也更加豐富起來(lái),這就要求輸入法不光要適用不同終端的使用習(xí)慣,還需適應(yīng)不同場(chǎng)景的使用需求,因而在操作方式上不再局限于鍵盤打字輸入,語(yǔ)音輸入方式成為一個(gè)非常重要的能力被提煉出來(lái)。

像此次疫情,語(yǔ)音輸入方式除了場(chǎng)景倒逼之外,用戶希望更快、更便捷的輸入體驗(yàn)升級(jí),也推動(dòng)著傳統(tǒng)輸入法做出改變。

可以預(yù)測(cè),當(dāng)我們進(jìn)入物聯(lián)網(wǎng)時(shí)代后,還會(huì)有更多的輸入方式出現(xiàn)。

其次,擁有AI內(nèi)核的輸入法變得無(wú)處不在無(wú)所不能。

輸入法自身也一直在尋求進(jìn)化迭代,只是我們所說(shuō)的輸入技術(shù)并非只局限于提高輸入法準(zhǔn)確性的基礎(chǔ)能力,而是通過(guò)AI技術(shù)的賦能,創(chuàng)新輸入法產(chǎn)品形式,讓用戶獲得更好的使用體驗(yàn)。

像百度輸入法基于NLP、圖像識(shí)別、AR等技術(shù),推出了NLP整句預(yù)測(cè)、AI斗圖、神句配圖、皮膚主體C位識(shí)別等功能,成為業(yè)內(nèi)首家實(shí)現(xiàn)多場(chǎng)景整句智能預(yù)測(cè)的輸入法產(chǎn)品;去年發(fā)布的AI探索版,還創(chuàng)新性的推出全語(yǔ)音交互的產(chǎn)品新形態(tài)和凌空手寫等領(lǐng)先的AI功能。

用戶需求和使用場(chǎng)景的變化,任何一個(gè)輸入法產(chǎn)品都能掌握,但能否根據(jù)這些變化做出應(yīng)對(duì),則非??简?yàn)產(chǎn)品在“輸入”之外的能力。一為行業(yè)進(jìn)化趨勢(shì)的洞察力,一為支持產(chǎn)品迭代的技術(shù)儲(chǔ)備力。

三、踏上10億次臺(tái)階,百度開啟輸入法的生態(tài)空間

每天10億次語(yǔ)音請(qǐng)求交互是一個(gè)里程,也是一個(gè)臺(tái)階,一個(gè)邁向輸入法下個(gè)形態(tài)高度的臺(tái)階。對(duì)于百度輸入法來(lái)說(shuō),這個(gè)創(chuàng)造紀(jì)錄的數(shù)據(jù)則為其開啟生態(tài)空間的打法提供了基礎(chǔ)。

第一是用戶基礎(chǔ)。

在此之前,根據(jù)艾媒咨詢不久前發(fā)布的《2019中國(guó)第三方手機(jī)輸入法市場(chǎng)年度專題研究報(bào)告》顯示,百度輸入法去年全年月活增速處于行業(yè)第一,市場(chǎng)份額達(dá)43.1%,與搜狗幾近持平。

今年春節(jié)期間的語(yǔ)音請(qǐng)求交互流量的爆發(fā),百度輸入法在完成了對(duì)用戶語(yǔ)音輸入普及和教育的同時(shí),也因新型輸入方式帶來(lái)的體驗(yàn)升級(jí)進(jìn)一步提升了用戶的粘性。

第二是內(nèi)容基礎(chǔ)。

當(dāng)用戶的基數(shù)足夠大的時(shí)候,為滿足用戶的個(gè)性需求,輸入法的內(nèi)容承載形式也出現(xiàn)了創(chuàng)新。

百度輸入法不但與Cherry、FILCO、ROG等近20家外設(shè)頭部品牌建立了輸入法行業(yè)的獨(dú)家內(nèi)容生態(tài)聯(lián)盟,與這些外設(shè)品牌共同推出旗艦仿真鍵盤精品授權(quán)皮膚,還與Cherry合作打造仿真鍵盤,在華為Mate30 pro上高度還原Cherry實(shí)體機(jī)械鍵盤軸的觸感。

可鹽可甜,輸入內(nèi)容的豐富既是用戶體驗(yàn)的升級(jí),亦是產(chǎn)品技術(shù)的升級(jí)。

第三是硬件廠商的合作基礎(chǔ)。

百度輸入法龐大的用戶基礎(chǔ),也將順理成章的打通硬件廠商的預(yù)裝渠道,成為更多硬件終端的預(yù)裝應(yīng)用。

事實(shí)上,百度輸入法長(zhǎng)期以來(lái)都是華為的預(yù)裝合作輸入法,二者在機(jī)型適配、輸入體驗(yàn)的打造上已經(jīng)形成默契,很明顯,兩者的合作形成了雙贏的結(jié)局,這也給其他硬件廠商樹立了一個(gè)可以參照的典范。

可以想象,當(dāng)百度輸入法進(jìn)入越來(lái)越多的硬件終端時(shí),結(jié)合其巨大的用戶基礎(chǔ)和豐富內(nèi)容,將構(gòu)建起一個(gè)充滿活力的輸入法生態(tài)。

由生態(tài)對(duì)抗單一的輸入法應(yīng)用,你可以將其理解為“搶跑”,也可理解為“降維”競(jìng)爭(zhēng),在輸入法的戰(zhàn)略布局上,百度又走在了前面。

此內(nèi)容為【智能相對(duì)論】原創(chuàng),

僅代表個(gè)人觀點(diǎn),未經(jīng)授權(quán),任何人不得以任何方式使用,包括轉(zhuǎn)載、摘編、復(fù)制或建立鏡像。

部分圖片來(lái)自網(wǎng)絡(luò),且未核實(shí)版權(quán)歸屬,不作為商業(yè)用途,如有侵犯,請(qǐng)作者與我們聯(lián)系。

智能相對(duì)論:

•AI新媒體;

•今日頭條青云計(jì)劃獲獎(jiǎng)?wù)逿OP10;

•澎湃新聞科技榜單月度top5;

•文章長(zhǎng)期“霸占”鈦媒體熱門文章排行榜TOP10;

•著有《人工智能 十萬(wàn)個(gè)為什么》

•【重點(diǎn)關(guān)注領(lǐng)域】智能駕駛、AI+醫(yī)療、機(jī)器人、AI+硬件(含無(wú)人機(jī)、智能手機(jī)、電視)、物聯(lián)網(wǎng)、AI+金融、AI+教育、AR/VR、云計(jì)算、開發(fā)者以及背后的芯片、算法等。

申請(qǐng)創(chuàng)業(yè)報(bào)道,分享創(chuàng)業(yè)好點(diǎn)子。點(diǎn)擊此處,共同探討創(chuàng)業(yè)新機(jī)遇!

相關(guān)標(biāo)簽
百度輸入法

相關(guān)文章

熱門排行

信息推薦