當(dāng)前位置:首頁(yè) >  科技 >  IT業(yè)界 >  正文

深耕語(yǔ)音輸入12載:訊飛輸入法走向萬(wàn)物智能新世界

 2022-11-22 16:25  來(lái)源: A5專(zhuān)欄   我來(lái)投稿 撤稿糾錯(cuò)

  域名預(yù)訂/競(jìng)價(jià),好“米”不錯(cuò)過(guò)

科目二考試不慎掛科后,我爸在微信上向我抱怨道:

“整天都在說(shuō)人工智能,可人工智能到底在哪里呢,為什么到了2022年,自動(dòng)倒車(chē)入庫(kù)的功能都沒(méi)普及,導(dǎo)致科目二考試還是那么難。”除了文字上的抱怨,還特意加了張某自動(dòng)駕駛企業(yè)的宣傳圖。

我沒(méi)有正面回答我爸的疑問(wèn),而是問(wèn)了他另外一個(gè)問(wèn)題:“你連拼音都打不好,為什么能給我發(fā)這么長(zhǎng)的一段文字?”大約過(guò)了一分鐘后,我爸回復(fù)了這樣一段話(huà):“我用的是訊飛輸入法的語(yǔ)音輸入,直接對(duì)著手機(jī)說(shuō)話(huà)就能生成字。”

可能在很多人的認(rèn)知里,人工智能的價(jià)值在于顛覆性的改變,而選擇性忽略了生活中那些潛移默化的影響。

就像語(yǔ)音輸入的例子,我爸夾雜著普通話(huà)與河南方言的輸入習(xí)慣,五年前還是難以想象的場(chǎng)景,那時(shí)候語(yǔ)音輸入的準(zhǔn)確率已經(jīng)達(dá)到95%以上,但方言的識(shí)別準(zhǔn)確率讓人難以直視,普通話(huà)和方言混合輸入的話(huà),可能會(huì)直接讓系統(tǒng)“宕機(jī)”,如今語(yǔ)音輸入已經(jīng)成為許多人最常用的輸入方式。

同樣被忽略的是,在語(yǔ)音輸入這件“小事”上,訊飛輸入法已經(jīng)走了12年,創(chuàng)造了一個(gè)又一個(gè)里程碑。

01 被“語(yǔ)音”解放的長(zhǎng)輩們

大約從五年前開(kāi)始,“下沉市場(chǎng)”逐步成為外界討論的焦點(diǎn),不但延長(zhǎng)了人口紅利消失的時(shí)間周期,也為互聯(lián)網(wǎng)巨頭們找到了新的流量來(lái)源,甚至是說(shuō)在某種程度上左右了當(dāng)下的互聯(lián)網(wǎng)商業(yè)格局。

有人將其歸功于“華米OV”,因?yàn)橹悄苁謾C(jī)價(jià)格的下降和渠道的密集覆蓋,加速了智能手機(jī)在下沉市場(chǎng)的滲透;也有人認(rèn)為是微信、拼多多、抖音等殺手級(jí)應(yīng)用的功勞,以一種特殊的魔力喚醒了“五環(huán)外人群”的參與感。

應(yīng)該被銘記的還有語(yǔ)音輸入。

如果說(shuō)拼音輸入法是打開(kāi)中文互聯(lián)網(wǎng)的鑰匙,一度是PC時(shí)代最普及、調(diào)用頻次最高的產(chǎn)品;語(yǔ)音輸入就是移動(dòng)互聯(lián)網(wǎng)走向下沉市場(chǎng)的捷徑,原本被隔離在互聯(lián)網(wǎng)圍墻外的中老年人,正是靠“語(yǔ)音輸入”的流行,才打破了他們與互聯(lián)網(wǎng)之間的藩籬,所扮演的角色不亞于智能手機(jī)的普及。

故事聽(tīng)起來(lái)并不復(fù)雜,可想讓“語(yǔ)音輸入”被普通話(huà)都說(shuō)不利索的中老年人用起來(lái),并不是一件容易的事。就拿訊飛輸入法來(lái)說(shuō),為了提升語(yǔ)音輸入的效率和普適性,在技術(shù)上下了很大一番功夫。

比如訊飛輸入法12.0版本中推出的語(yǔ)種可控方言免切換系統(tǒng),無(wú)須手動(dòng)調(diào)整語(yǔ)音識(shí)別模式是普通話(huà)還是方言,就能實(shí)現(xiàn)普通話(huà)和23種方言的自由說(shuō)。像我爸這類(lèi)普通話(huà)中有著明顯的河南口音,時(shí)不時(shí)說(shuō)幾個(gè)方言詞匯的用戶(hù),語(yǔ)音輸入時(shí)不需要人為切換輸入方式,極大地提升了用戶(hù)體驗(yàn)。

再比如訊飛輸入法對(duì)離線(xiàn)方言語(yǔ)音輸入和復(fù)雜環(huán)境語(yǔ)音識(shí)別的優(yōu)化,不僅解決了高噪、遠(yuǎn)場(chǎng)混響等環(huán)境下的識(shí)別準(zhǔn)確率,即使是在離線(xiàn)的情況下,也能使用方言進(jìn)行語(yǔ)音輸入。語(yǔ)音輸入不再是一種新奇的體驗(yàn),而是滿(mǎn)足用戶(hù)全場(chǎng)景需求的通用輸入方式,正在無(wú)形中重構(gòu)人機(jī)交互的底層邏輯。

把視角再放大一些的話(huà),隨著語(yǔ)音輸入效率的升維,被訊飛輸入法“征服”的絕不只有中老年人。驅(qū)動(dòng)輸入法進(jìn)化的源動(dòng)力,始于“效率”二字,不管是拼音對(duì)五筆的替代,還是九宮格、手寫(xiě)等輸入方式的流行,都離不開(kāi)效率的提升。進(jìn)一步解放生產(chǎn)力的語(yǔ)音輸入,自然是所有群體都無(wú)法拒絕的選項(xiàng)。

可以佐證的是,訊飛輸入法的用戶(hù)畫(huà)像中,包含了Z世代游戲人群、效率人群、銀發(fā)人群以及視障人群,他們的需求各有不同,或是青睞于游戲語(yǔ)音鍵盤(pán)、或是鐘情跨屏輸入模式、或是看到了長(zhǎng)輩模式和無(wú)障礙模式的貼心……在語(yǔ)音輸入賽道上長(zhǎng)跑了12年的訊飛輸入法,早已成為“個(gè)性多元需求”的代名詞。

02 萬(wàn)物智能的輸入邏輯

當(dāng)互聯(lián)網(wǎng)的用戶(hù)規(guī)模逐漸飽和,萬(wàn)物智能被證實(shí)是下一個(gè)十年的核心命題,輸入法也需要與時(shí)俱進(jìn):所需要解決的不單單是人與人之間的溝通,還要為人與物的“對(duì)話(huà)”給出效率更高的解決方案。

在討論這個(gè)話(huà)題前,似乎有必要回答一個(gè)出現(xiàn)頻次很高的問(wèn)題,即在萬(wàn)物智能的秩序和規(guī)則里,輸入法是否屬于剛需產(chǎn)品?畢竟語(yǔ)音識(shí)別并不是輸入法的專(zhuān)屬,而作為“第三方”產(chǎn)品的輸入法,需要在萬(wàn)物智能中找到自己的生態(tài)位。

這也是訊飛輸入法想要回答的拷問(wèn)。剛剛結(jié)束的2022科大訊飛全球1024開(kāi)發(fā)者節(jié)上,科大訊飛的輸入法總經(jīng)理程坤在演講中多次提到“萬(wàn)物皆智能”的理念,并給出了訊飛輸入法的應(yīng)對(duì)之策。

首先是創(chuàng)新能力的輸出。正如前面提到的,訊飛輸入法針對(duì)語(yǔ)種免切換、離線(xiàn)方言、復(fù)雜場(chǎng)景下的語(yǔ)音識(shí)別等進(jìn)行了深度優(yōu)化,同樣的能力也適用于復(fù)雜多變的人機(jī)交互,用于解決人與機(jī)器之間的感知和表達(dá)難題。

一個(gè)直接的例子,當(dāng)前用戶(hù)的智能產(chǎn)品列表中,已經(jīng)出現(xiàn)了智能汽車(chē)、智能家居、穿戴式設(shè)備等不同產(chǎn)品,想要滿(mǎn)足不同場(chǎng)景下的人機(jī)交互需求,考驗(yàn)的不只是語(yǔ)音識(shí)別的準(zhǔn)確率,還有經(jīng)過(guò)用戶(hù)實(shí)際使用驗(yàn)證的差異化方案。而有著億萬(wàn)活躍用戶(hù)的訊飛輸入法,已經(jīng)為手表等小屏設(shè)備提供流暢的手寫(xiě)、面向折疊屏設(shè)計(jì)了“分裂鍵盤(pán)”、更大顯示的智慧屏提供跨端流轉(zhuǎn)的輸入等等,可以說(shuō)是離用戶(hù)和真實(shí)場(chǎng)景最近的玩家。

其次是內(nèi)容表達(dá)的滿(mǎn)足。在用戶(hù)和智能化產(chǎn)品的交互中,“語(yǔ)音輸入”本質(zhì)上只是入口,深層次的需求在于內(nèi)容表達(dá),通過(guò)語(yǔ)音輸入連接各種各樣的服務(wù),譬如網(wǎng)購(gòu)、社交、外賣(mài)等消費(fèi)和生活的場(chǎng)景需求。

記憶中,訊飛輸入法在11.0版本中推出了“AI助手”,僅僅1年時(shí)間,這個(gè)平時(shí)不起眼的小助手已經(jīng)擁有22種AI功能,覆蓋聊天、發(fā)布、搜索、評(píng)論、評(píng)價(jià)、個(gè)性表達(dá)等場(chǎng)景;并在訊飛輸入法12.0版本中,進(jìn)一步搭載了全新AI智能化輸入引擎,在聊天、音樂(lè)、綜藝、影視、生活服務(wù)等場(chǎng)景下,都能賦以高效和準(zhǔn)確。簡(jiǎn)單來(lái)說(shuō),訊飛輸入法的切入口是輸入服務(wù)與用戶(hù)連接的需求,也是智能化時(shí)代用戶(hù)交互的根基。

至于訊飛輸入法的路線(xiàn)是否正確,現(xiàn)階段還無(wú)法給出確切的答案。不妨來(lái)重溫一個(gè)屢試不爽的產(chǎn)品邏輯:更低的使用門(mén)檻,更直接的交互方式,是一切產(chǎn)品發(fā)展的方向,萬(wàn)物智能時(shí)代也不例外。

再確切一些的話(huà),包括訊飛在內(nèi)的第三方輸入法,正在不斷向金融、教育、司法、醫(yī)療、車(chē)載等場(chǎng)景滲透,輸出定制化的解決方案,為用戶(hù)帶來(lái)更好體驗(yàn)的同時(shí),也為自身找到了新的增長(zhǎng)空間。

03 輸入法的生態(tài)化破局

從最早的語(yǔ)音輸入到賦能萬(wàn)物智能,輸入法作為人工智能技術(shù)的天然載體,不可或缺性已經(jīng)毋庸置疑,卻仍要面臨商業(yè)化的挑戰(zhàn):在工具型產(chǎn)品整體式微的局面下,輸入法的想象空間到底在哪?

回到文初的例子,像我爸這樣的用戶(hù)不在少數(shù),他們是語(yǔ)音輸入的直接受益者,以潤(rùn)物細(xì)無(wú)聲的方式深切改變了他們的體驗(yàn)感,一旦養(yǎng)成了語(yǔ)音輸入的用戶(hù)習(xí)慣,就是訊飛輸入法的護(hù)城河??刹煌谥悄荞{駛等技術(shù)的話(huà)題性,語(yǔ)音輸入的大眾化普及,反倒制約了講述資本故事時(shí)的吸引力。

為了改變傳統(tǒng)的市場(chǎng)認(rèn)知,訊飛輸入法代表的輸入法頭部玩家進(jìn)行了多種嘗試。典型的例子就有To B探索,面向不同的行業(yè)打造場(chǎng)景化的輸入解決方案,降低用戶(hù)在垂直場(chǎng)景里的輸入門(mén)檻;同時(shí)還有增值服務(wù)的嘗試,利用個(gè)性化皮膚、字體、表情包等吸引用戶(hù)付費(fèi),事實(shí)上,好的產(chǎn)品和有價(jià)值的服務(wù),用戶(hù)是樂(lè)于付費(fèi)的。

在訊飛輸入法12.0的發(fā)布現(xiàn)場(chǎng),面對(duì)輸入法在萬(wàn)物智能時(shí)代遇到的新考題,訊飛輸入法產(chǎn)品總監(jiān)趙明路給出了生態(tài)化的破局思路。

相對(duì)應(yīng)的就是“i-Blocks”輸入個(gè)性化內(nèi)容開(kāi)放平臺(tái),旨在搭建開(kāi)放內(nèi)容與服務(wù)的載體,以生態(tài)開(kāi)放的理念,將創(chuàng)作者、IP方、設(shè)計(jì)師、普通用戶(hù)串聯(lián)在一起,形成生產(chǎn)、消費(fèi)、價(jià)值創(chuàng)造的生態(tài)閉環(huán)。

個(gè)中邏輯并不難解釋。

進(jìn)入到萬(wàn)物智能時(shí)代后,人機(jī)交互勢(shì)必會(huì)出現(xiàn)復(fù)雜多樣的一幕,不同的產(chǎn)品有著不同的交互界面,不同的場(chǎng)景有著不同的輸入偏好,不同的用戶(hù)群體有著不同的需求,想要解決新的輸入問(wèn)題,既需要產(chǎn)品功能的持續(xù)創(chuàng)新,也需要內(nèi)容生態(tài)的不斷壯大,“i-Blocks”輸入個(gè)性化內(nèi)容開(kāi)放平臺(tái)擔(dān)綱的正是內(nèi)容生態(tài)的建設(shè)。

以當(dāng)前最為熱門(mén)的智能車(chē)機(jī)為例,首先要解決的是輸入效率,然后是個(gè)性化的滿(mǎn)足。比如定制化的皮膚提升品牌的用戶(hù)認(rèn)知;再比如車(chē)機(jī)、手機(jī)、電腦的多端聯(lián)動(dòng),需要表情包、字體等元素進(jìn)行表達(dá)……當(dāng)輸入法的連接對(duì)象由過(guò)去的用戶(hù)和服務(wù),衍生到終端客戶(hù)、品牌方、創(chuàng)作者、用戶(hù)差異化需求等更多層面,內(nèi)容生態(tài)將是輸入法承接客戶(hù)訴求、滿(mǎn)足用戶(hù)需求的重要支撐。

找到的最新一組數(shù)據(jù)是:目前訊飛輸入法個(gè)性化內(nèi)容服務(wù)使用者中年輕用戶(hù)占比達(dá)48%,吸引了內(nèi)容創(chuàng)作者過(guò)萬(wàn)人,內(nèi)容使用量多達(dá)100億次。而在萬(wàn)物智能時(shí)代,內(nèi)容使用需求注定會(huì)爆炸性增長(zhǎng)。

做一個(gè)總結(jié)的話(huà),訊飛輸入法的優(yōu)先級(jí)、競(jìng)爭(zhēng)壁壘和技術(shù)優(yōu)勢(shì),決定了其行業(yè)地位短期內(nèi)不會(huì)被挑戰(zhàn),進(jìn)一步拓寬語(yǔ)音輸入場(chǎng)景,并在內(nèi)容生態(tài)上不斷積蓄力量,不失為一種正確且有前瞻性的打法。

04 寫(xiě)在最后

按照官方公布的數(shù)據(jù):目前訊飛輸入法的日活用戶(hù)已突破1億,語(yǔ)音滲透率達(dá)到75%,日語(yǔ)音調(diào)用量較2021年提升45%。

不難給出合理的解釋?zhuān)Z(yǔ)音為主、鍵盤(pán)觸摸為輔、肢體語(yǔ)言動(dòng)作為補(bǔ)充的混合交互,滿(mǎn)足了萬(wàn)物智能時(shí)代的基本特征,既是訊飛輸入法語(yǔ)音調(diào)用量逐年增長(zhǎng)的誘因,也是其走向萬(wàn)物智能新世界的戰(zhàn)略基石。

在語(yǔ)音賽道深耕十二載的訊飛輸入法,正在讓越來(lái)越多用戶(hù)擺脫人機(jī)交互的種種煩惱,改變不同代際用戶(hù)群體的交互習(xí)慣,沿循著“效率為王”的初心和恒心,賦以輸入生態(tài)新勢(shì)能、新方向、新動(dòng)能。

申請(qǐng)創(chuàng)業(yè)報(bào)道,分享創(chuàng)業(yè)好點(diǎn)子。點(diǎn)擊此處,共同探討創(chuàng)業(yè)新機(jī)遇!

相關(guān)標(biāo)簽
訊飛輸入法

相關(guān)文章

熱門(mén)排行

信息推薦