當(dāng)前位置:首頁 >  科技 >  移動互聯(lián) >  正文

訊飛輸入法十年謀局:技術(shù)派跑贏了馬拉松

 2020-10-21 09:16  來源: A5專欄   我來投稿 撤稿糾錯

  域名預(yù)訂/競價,好“米”不錯過

對于我們這代人來說,輸入法注定是被定格的記憶。

習(xí)慣了將老式諾基亞藏在課桌抽屜里盲發(fā)信息的暢快,即使到了全觸屏的智能手機(jī)時代,照舊對九宮格念念不忘。以至于當(dāng)習(xí)慣全鍵盤輸入的00后們走上互聯(lián)網(wǎng)舞臺后,在江湖上掀起了一場輸入法的流派之爭。

作為移動互聯(lián)網(wǎng)時代的史詩級產(chǎn)品,輸入法見證了商業(yè)更迭的市場規(guī)律,承載了用戶行為的變遷軌跡,自身也在技術(shù)浪潮的推動下完成了一次次的躍遷:搜狗將輸入法從單機(jī)時代帶進(jìn)了互聯(lián)網(wǎng)時代,訊飛又為輸入法打開了人工智能的大門。

借著訊飛輸入法上線10周年的契機(jī),似乎有必要盤點下輸入法在上一個10年的歷程:站在人工智能時代的起點上,曾經(jīng)革新了移動互聯(lián)網(wǎng)交互方式的輸入法,還將對世界產(chǎn)生什么樣的影響?

01 “宣戰(zhàn)”自帶輸入法

2010年是必須被載入智能手機(jī)史冊的一年。

喬布斯老爺子在這一年推出了配得上“改變世界”稱號的iPhone 4,沉寂許久的手機(jī)行業(yè)開始暗流涌動。無數(shù)創(chuàng)業(yè)者陸續(xù)開始了智能手機(jī)的征程,原本獨立于硬件之外的野蠻人也紛紛加入戰(zhàn)場。

時間證明了這群聰明人賭對了風(fēng)口,2010年被視為智能手機(jī)普及的元年,塞班戰(zhàn)線徹底被擊垮,一大批踩準(zhǔn)了時間節(jié)點的安卓廠商成了最終的贏家。

其實在智能手機(jī)的正面戰(zhàn)場之外,還存在一條隱蔽的戰(zhàn)線:智能手機(jī)的出現(xiàn)改變了原有的產(chǎn)品形態(tài),傳統(tǒng)的物理鍵盤徹底消失,虛擬輸入法逐漸成為一種剛需,如何提升用戶的輸入效率,成了多方力量角逐的賽點。

在PC時代殺出一條血路的搜狗輸入法,隨即開始向手機(jī)市場傾斜,原本適用于PC的產(chǎn)品邏輯被復(fù)制到手機(jī)上;汲取了PC市場經(jīng)驗的手機(jī)廠商也開始行動,谷歌將自家的輸入法作為系統(tǒng)的默認(rèn)選項,主張封閉生態(tài)的蘋果牢牢掌控著輸入法的控制權(quán),直到2014年才開放了第三方輸入法的 API。

同樣是2010年,科大訊飛的一群工程師們也加入了手機(jī)輸入法的角逐賽,不過他們并沒有沿襲功能機(jī)時代的輸入理念,而是主打語音技術(shù),在既有輸入鍵盤上增加一個麥克風(fēng)圖標(biāo),用戶點擊后就能語音輸入。

訊飛輸入法的工程師們算了這樣一筆賬:普通人一分鐘打字的速度在60個左右,但一分鐘可以說180個以上,倘若可以用語音輸入替代手動打字,輸入效率將提升300%。何況彼時智能手機(jī)的屏幕尺寸還只有3.5寸上下,手指需要在狹小的屏幕上“做文章”,用戶體驗可想而知。

于是一群從用戶體驗視角出發(fā)的工程師們,向手機(jī)廠商和輸入法市場的老玩家們發(fā)起了挑戰(zhàn),試圖重塑輸入法的產(chǎn)品形態(tài)。

時間同樣驗證了訊飛輸入法的前瞻性,到了2012年的時候,搜狗輸入法和百度輸入法先后推出了語音輸入,2013年訊飛輸入法的激活用戶量正式破億……語音輸入逐漸衍生成為新的流派。

按照賽諾發(fā)布的《2019中國手機(jī)輸入法年終報告》顯示,訊飛、百度、搜狗占據(jù)了96.1%的市場份額,第三方輸入法將客場變成了主場。

02 為工具產(chǎn)品正名

第三方輸入法的崛起似乎并不讓人意外。

智能手機(jī)時代的降臨,催生的不只有造機(jī)潮,還有工具產(chǎn)品的爆發(fā):早期的原生操作系統(tǒng)體驗并不完善,桌面類、美顏類等工具類產(chǎn)品悄然崛起,第三方輸入法或多或少享受了特殊的紅利周期。

正如獵豹經(jīng)歷了谷歌大面積下架的風(fēng)波后,傅盛在接受媒體采訪時說的這樣一段話:“我知道工具會退潮,從2015年就知道。但我們從來沒有想到,變化會是斷崖式的。”工具類產(chǎn)品在2015年達(dá)到鼎盛,久邦、獵豹等企業(yè)先后上市。但在2016年就開始出現(xiàn)轉(zhuǎn)折,隨著原生操作系統(tǒng)的完善、人口紅利的衰減,大多數(shù)工具類產(chǎn)品未能及時轉(zhuǎn)型,在渾渾噩噩中走向了慢性死亡。

為何訊飛輸入法等玩家可以逃脫工具類產(chǎn)品的宿命?或許可以從2016年錘子手機(jī)M1的發(fā)布會上找到答案。

老羅在發(fā)布會現(xiàn)場用很快的語速說了相當(dāng)長的一段話,訊飛輸入法無時差同步輸出了文字版本,結(jié)果幾乎沒有任何偏差,發(fā)布會現(xiàn)場隨即一片歡呼。發(fā)布會結(jié)束的第二天,訊飛輸入法霸占了多家應(yīng)用商店的下載榜單。

訊飛輸入法的高光時刻至今仍時常被提及,外界忽略的是背后的技術(shù)深耕。

訊飛輸入法剛剛上線的2010年,行業(yè)內(nèi)還沒有中文語音識別的概念。訊飛輸入法團(tuán)隊首創(chuàng)了語音輸入的功能,一開始的識別準(zhǔn)確率還只有70%作用,團(tuán)隊使用大數(shù)據(jù)訓(xùn)練和深度學(xué)習(xí)技術(shù)后,語音識別的準(zhǔn)確率在2013年達(dá)到了92%,然后在2014年快速跨越到業(yè)內(nèi)領(lǐng)先的95%,在一定程度上超出了人耳。

其實訊飛輸入法的語音識別準(zhǔn)確率達(dá)到97%后,用戶規(guī)模已經(jīng)在不到兩年時間內(nèi)已經(jīng)翻了一番,羅永浩的示范不過是點燃引線的小火星。

相比于那些與用戶需求和行業(yè)生態(tài)脫節(jié)的工具類產(chǎn)品,訊飛輸入法為工具類產(chǎn)品正名的策略并不復(fù)雜,即通過技術(shù)的持續(xù)創(chuàng)新將工具類產(chǎn)品服務(wù)化,向用戶提供的不是工具,而是一種服務(wù)。

除了語音技術(shù)上的深耕,可以驗證的還有細(xì)節(jié)上的功力。比如在訊飛輸入法上,用戶想要從鍵盤切換打破手寫,無須點開特定的按鈕,可以直接在屏幕上寫字……工具的弱點是用戶粘性低、可替代性強(qiáng),但訊飛輸入法用技術(shù)創(chuàng)新和產(chǎn)品服務(wù)巧妙地讓短板變成了長板。

03 進(jìn)擊的“全能選手”

技術(shù)上的創(chuàng)新徹底改變了輸入法的進(jìn)化路徑。

從商業(yè)邏輯上看,輸入法避免了大多數(shù)工具類產(chǎn)品的覆轍,在工具產(chǎn)品退潮的時候,照舊坐擁了數(shù)億用戶規(guī)模;從產(chǎn)品策略上看,輸入法給出了超出預(yù)期的體驗,并且圍繞用戶需求進(jìn)化成了“全能選手”。

工具類產(chǎn)品之所以被詬病,本質(zhì)上還是產(chǎn)品價值的矮化,一旦在體驗上輸給了原生系統(tǒng),用戶需求也就無從談及,用戶的離開可以說是注定的結(jié)果。訊飛輸入法的特殊之處在于,一開始就選中了語音輸入的賽道,最終憑借在橫向和縱向的技術(shù)與業(yè)務(wù)布局,一次次拓寬了輸入法的想象空間。

紅杉資本的傳奇締造者邁克爾·莫里茨曾言:“一個公司的基因早在它最初的18個月就被決定了,此后公司不可能再有什么大的改變,如果DNA是對的,他就是一塊金子,如果不對,那基本就完了。”這樣的觀點一直存在不小的爭議,卻是解鎖訊飛輸入法產(chǎn)品進(jìn)化方向的一把鑰匙。

因為對語音輸入的執(zhí)著,訊飛輸入法團(tuán)隊在2011年遇到了一個難題,中國有太多人說的是方言,如果無法準(zhǔn)確進(jìn)行方言的識別,語音輸入終將淪為雞肋。

一番用戶調(diào)查和數(shù)據(jù)分析后,訊飛輸入法選擇需求排名最高的粵語、四川話和河南話入手,2012年的一次版本更新后上線了粵語語音輸入,成為首款支持粵語語音輸入的輸入法,緊接著上線了四川話和河南話的語音輸入。截止到目前,訊飛輸入法的粵語語音識別準(zhǔn)確率已經(jīng)超過95%,陸續(xù)上線了23種方言的語音識別。

因為對用戶輸入習(xí)慣的洞察,訊飛輸入法在2013年上線了英文語音輸入;2015年訊飛輸入法在語音輸入的基礎(chǔ)上首創(chuàng)了語音翻譯功能 “隨聲譯”,目前已經(jīng)支持英日韓俄等多種外語的面對面翻譯,輸入法開始進(jìn)化成為一種人際溝通工具。

除了語音識別技術(shù)上的縱向深挖,訊飛輸入法還積極在輸入場景上進(jìn)行橫向延伸,比如在傳統(tǒng)的手寫、鍵盤輸入外,加入了OCR掃描、智能預(yù)測等功能。輸入法角色的多元演變是顯而易見的,早已不再是打字的工具,而是用戶連接互聯(lián)網(wǎng)世界的貼心助手,無限拔高了輸入法產(chǎn)品的價值上限。

04 訊飛的語音戰(zhàn)事

輸入法的產(chǎn)品生命周期其實才剛剛開始。

訊飛輸入法上線的2010年,深度學(xué)習(xí)技術(shù)還方興未艾,人工智能還處于第二次浪潮后的靜默期。然而過了十個年頭后,等待語音技術(shù)的卻是全新的局面:阿爾法狗燃起了人工智能的第三波浪潮,深度學(xué)習(xí)等前沿技術(shù)加速了落地應(yīng)用的進(jìn)程,語音也從小眾一躍成為主流的人機(jī)交互方式之一。

至少透過訊飛輸入法等行業(yè)領(lǐng)跑者的動作,外界看到的并非是時間賦予的老邁,而是一無既往的探索和創(chuàng)新精神。

就在訊飛輸入法10周年的發(fā)布會上,知名相聲演員方清平上演了一場極限語速挑戰(zhàn)賽,用遠(yuǎn)超羅永浩當(dāng)年的語速讀了一段《木蘭辭》,以測試訊飛輸入法在極限快語速下的識別效果。結(jié)果讓人驚喜,方清平的語速快過了吉尼斯世界紀(jì)錄,訊飛輸入法照舊給出了100%的識別準(zhǔn)確率。

與四年前的有所不同的是,同樣是技術(shù)上的秀肌肉,對于“快”的詮釋有了新的注解。如果說訊飛輸入法當(dāng)年的一夜爆紅,某種程度上與大眾對語音輸入帶來的新鮮感有關(guān),這一次除了速度,還有溫度。

比如訊飛輸入法新近推出的10.0版本,通過唇形輔助輸入,進(jìn)一步優(yōu)化輸入效率,在近距離多人說話的復(fù)雜場景中,其他人的聲音不會干擾語音識別結(jié)果;再比如針對盲人群體輸入不便的情況,不斷無障礙模式,實現(xiàn)了輸入面板、菜單面板以及表情面板的屏幕隨選朗讀,用戶在視力不便的情況下也能無障礙輸入文字和表情。

至于其中的原因,似乎并不難理解。第三方輸入法上一個10年的主場是智能手機(jī),語音輸入并非是不可替代的方案,語音輸入的早期用戶多半以極客為主??呻S著5G與AIoT浪潮的來臨,智能家居、車載、可穿戴設(shè)備等新的場景和需求不斷增加,傳統(tǒng)的輸入方式越來越不友好,語音將是最核心最主流的輸入方式。

備戰(zhàn)了10年的訊飛輸入法,正在進(jìn)入一個全新的戰(zhàn)場,并在積極調(diào)整姿態(tài),除了外界所熟悉的技術(shù)牌,訊飛輸入法打出的還有同樣聚焦用戶體驗的溫情牌。畢竟當(dāng)語音作為人機(jī)交互的渠道時,不應(yīng)該是冰冷的一面,這場語音戰(zhàn)事的結(jié)果已經(jīng)可以預(yù)見。

05 尾記

10歲的訊飛輸入法,就像是互聯(lián)網(wǎng)世界里的時間行者。

原以為會是失去生機(jī)的前浪,卻是人工智能語境里名符其實的后浪。如果非要給訊飛輸入法的成長軌跡做有個注釋的話,本質(zhì)上在于技術(shù)派的工程師們對于語音輸入的執(zhí)著,用持續(xù)創(chuàng)新等來了屬于語音技術(shù)的春天。

如今語音技術(shù)正當(dāng)其時,訊飛輸入法的日語音交互次數(shù)已經(jīng)達(dá)到10億次,累計服務(wù)設(shè)備數(shù)超5億,語音用戶占比超70%。在人工智能時代的呼喚下,這位創(chuàng)新老炮兒正在以矯健的腳步邁向下一個10年。

申請創(chuàng)業(yè)報道,分享創(chuàng)業(yè)好點子。點擊此處,共同探討創(chuàng)業(yè)新機(jī)遇!

相關(guān)標(biāo)簽
訊飛輸入法

相關(guān)文章

熱門排行

信息推薦