1. 創(chuàng)業(yè)頭條
  2. 前沿領(lǐng)域
  3. 企業(yè)應(yīng)用
  4. 正文

今天,講講“千里眼”和“順風(fēng)耳”的故事

 2022-05-30 17:30  來(lái)源:互聯(lián)網(wǎng)  我來(lái)投稿 撤稿糾錯(cuò)

  域名預(yù)訂/競(jìng)價(jià),好“米”不錯(cuò)過(guò)

為跟客戶開(kāi)半小時(shí)的會(huì)議,一整天都耗在路上;一個(gè)緊急電話,立即驅(qū)車數(shù)十公里趕往偏遠(yuǎn)的下轄礦區(qū);月總、季總一到,分布在全國(guó)各地的同事就得定期飛回來(lái),不僅鞍馬勞頓,還要花費(fèi)大量的差旅費(fèi)……這些經(jīng)歷,應(yīng)該是許多人的共同記憶。

視頻會(huì)議的普及,給上述種種情況帶來(lái)不少“福音”,但遠(yuǎn)程終究不是現(xiàn)場(chǎng),視聽(tīng)和互動(dòng)的感受,都會(huì)有所影響,在設(shè)備不達(dá)標(biāo)的情況下,還會(huì)出現(xiàn)音畫不同步、聲音斷斷續(xù)續(xù)等一系列問(wèn)題,溝通效率大打折扣。

讓遠(yuǎn)程協(xié)作的用戶體驗(yàn)和效率,盡可能和現(xiàn)場(chǎng)的一模一樣,這是MAXHUB研發(fā)團(tuán)隊(duì)在開(kāi)發(fā)V6系列會(huì)議平板時(shí),所肩負(fù)的一大使命。

今天,一起探究這背后的故事。

像面對(duì)面一樣交流,是音視頻設(shè)備的本位價(jià)值

“讓屏幕兩端的交流感更真切,擁有接近于面對(duì)面討論的逼真效果,我們認(rèn)為音視頻設(shè)備理應(yīng)為用戶帶來(lái)這樣的本位價(jià)值。”MAXHUB視覺(jué)研究負(fù)責(zé)人騰哥如此說(shuō)道。

但當(dāng)騰哥帶領(lǐng)技術(shù)團(tuán)隊(duì)走訪企業(yè)、深入調(diào)研的時(shí)候,看到的卻是另外一番景象。

他們了解到很多中小型企業(yè)正在使用的視頻會(huì)議工具,居然是“電腦+云視頻會(huì)議軟件”這樣的組合,存在看不清、聽(tīng)不清和交互弱等一系列問(wèn)題,很大程度上影響著溝通的效率和員工的積極性。而原因就是,一套專業(yè)級(jí)音視頻設(shè)備的價(jià)格動(dòng)輒幾十萬(wàn),他們沒(méi)有這么多的預(yù)算用于部署。

騰哥也發(fā)現(xiàn),就算是在MAXHUB所專注的會(huì)議平板行業(yè),大部分產(chǎn)品的音視頻功能還有所欠缺,視頻會(huì)議的流暢性和清晰度,未能達(dá)到用戶預(yù)期的效果。

“所以,我們想去改變這個(gè)現(xiàn)狀,讓大家用會(huì)議平板就能進(jìn)行專業(yè)的視頻會(huì)議。”騰哥補(bǔ)充道。

MAXHUB研發(fā)團(tuán)隊(duì)的期盼中,這不僅是能夠解決視頻會(huì)議現(xiàn)狀的產(chǎn)品,更希望可以在行業(yè)中產(chǎn)生“鯰魚(yú)效應(yīng)”,激勵(lì)上下游的廠商,共同來(lái)優(yōu)化用戶體驗(yàn)。

我們花費(fèi)一年半時(shí)間,造出了這顆雙攝

“看到這顆雙攝了不,它是4800萬(wàn)像素廣角與800萬(wàn)像素長(zhǎng)焦雙軸機(jī)械云臺(tái)組合而成的一體化雙攝,我們花了一年半的時(shí)間折騰出來(lái)的。單個(gè)鏡頭的時(shí)候,四五米遠(yuǎn)的人像放大后效果不太理想,所以我們加了一個(gè)長(zhǎng)焦鏡頭,可以在人像特寫的情況下,保證畫面清晰度。”騰哥指了指位于MAXHUB V6科技版頂部的攝像機(jī),自豪地介紹道。

可是,一體化雙攝的研發(fā)過(guò)程,遠(yuǎn)遠(yuǎn)不像描述中的那么輕松。

騰哥帶領(lǐng)的視覺(jué)研發(fā)團(tuán)隊(duì)要攻克的第一個(gè)難關(guān),是如何把兩顆鏡頭、精密的磁編碼云臺(tái)和眾多零部件,高度集成在頂部邊框中。最先采用的是潛望式結(jié)構(gòu),但得到的鏡頭組體積較大,顯得有些突兀,影響整體的美觀性。經(jīng)過(guò)數(shù)十次推倒重來(lái)后,MAXHUB研發(fā)團(tuán)隊(duì)參考專業(yè)云臺(tái)攝像機(jī)的架構(gòu)進(jìn)行重新設(shè)計(jì),實(shí)現(xiàn)了如今兼顧美感和小體積的雙攝方案。

隨之而來(lái)的,是小體積導(dǎo)致的溫升、轉(zhuǎn)動(dòng)精度問(wèn)題。

該雙攝采用4K級(jí)傳輸碼率,且內(nèi)部空間小,故此容易發(fā)熱。為此,MAXHUB視覺(jué)研發(fā)團(tuán)隊(duì)自己搭建了全新的風(fēng)道設(shè)計(jì),并進(jìn)行1000多次熱學(xué)仿真實(shí)驗(yàn),不斷改進(jìn)風(fēng)道結(jié)構(gòu),讓散熱的效果實(shí)現(xiàn)最優(yōu)化。

受整體體積影響,內(nèi)置的微型電機(jī)較難把控轉(zhuǎn)動(dòng)的精度,基于此,研發(fā)團(tuán)隊(duì)自行設(shè)計(jì)電機(jī)的傳動(dòng)架構(gòu),以及采用高精度磁編碼器,使得微型電機(jī)可以精準(zhǔn)轉(zhuǎn)動(dòng),讓攝像頭準(zhǔn)確捕捉到相應(yīng)的人像。

接下來(lái)的難點(diǎn),便是如何讓兩顆鏡頭默契配合,達(dá)到1+1>2的成像效果。

“最大的挑戰(zhàn)是,要讓一顆ISP芯片操控雙攝的圖像處理能力,跟單攝是一樣的,簡(jiǎn)單來(lái)說(shuō),就是當(dāng)你的工作量變成雙倍的時(shí)候,你要把它做得跟之前一樣好。大家可能會(huì)有一個(gè)疑問(wèn),我們?yōu)槭裁床挥脙深w芯片?事實(shí)上,芯片增多后,它們之間的任務(wù)劃分、數(shù)據(jù)交換和數(shù)據(jù)通信,都會(huì)損耗時(shí)間并產(chǎn)生熱量,結(jié)果可能會(huì)適得其反。”騰哥這種化繁為簡(jiǎn)的解釋,哪怕是視覺(jué)領(lǐng)域的技術(shù)小白,也能夠快速理解到其中的關(guān)鍵所在。

為此,MAXHUB視覺(jué)研發(fā)團(tuán)隊(duì)設(shè)計(jì)了多套技術(shù)流方案來(lái)優(yōu)化ISP芯片的系統(tǒng)架構(gòu)和功能單元的運(yùn)作流程,并進(jìn)行大量的仿真計(jì)算,讓ISP芯片的性能充分發(fā)揮出來(lái),在工作量翻倍的情況下,依舊游刃有余。

“再分享一個(gè)小細(xì)節(jié),我們主攝像頭的可視角是92°,這是一個(gè)畸變、透視和解析力都極為均衡的黃金角。為了得到這個(gè)數(shù)值,我們基于微軟Teams的標(biāo)準(zhǔn),在82°到110°這個(gè)角度范圍內(nèi)反復(fù)進(jìn)行了1500多場(chǎng)模擬測(cè)試,并邀請(qǐng)一些真實(shí)用戶來(lái)現(xiàn)場(chǎng)對(duì)比成像效果。”

在騰哥看來(lái),92°超廣角鏡頭帶來(lái)的實(shí)際體驗(yàn)感還是非常令人滿意的,“鏡頭可視角調(diào)整后,視野范圍比以前擴(kuò)大了37.3%,成像的效果非常清晰,這樣一來(lái),我們?cè)诤苄〉臅?huì)議室也能夠進(jìn)行多人視頻,而大型講廳更是可以輕松拍齊整個(gè)會(huì)場(chǎng)。”

小而美的外觀結(jié)構(gòu)、別出心裁的92°黃金角……這些背后藏著的,是MAXHUB視覺(jué)研發(fā)人員對(duì)用戶的洞察及用心。

有了“千里眼”,就得有“順風(fēng)耳”來(lái)配

在視覺(jué)研發(fā)團(tuán)隊(duì)埋頭攻克雙攝技術(shù)難關(guān)的同時(shí),以鄭工為主導(dǎo)的聲學(xué)研發(fā)團(tuán)隊(duì),則在跟如何提升會(huì)議平板的音頻處理能力較著勁。

“視頻會(huì)議的時(shí)候,大家應(yīng)該都體會(huì)過(guò),對(duì)方會(huì)場(chǎng)講的話傳到你耳邊摻雜著鍵盤聲、關(guān)門聲、咳嗽聲等等噪音,而且有時(shí)候聲音還會(huì)時(shí)大時(shí)小……這很影響效率。”解決這樣的用戶痛點(diǎn),是鄭工和他的團(tuán)隊(duì)在堅(jiān)持的事情。

MAXHUB聲學(xué)研發(fā)團(tuán)隊(duì)很早前就自研了AI降噪技術(shù),讓麥克風(fēng)在收音的時(shí)候,可把常見(jiàn)的噪音都過(guò)濾掉。在開(kāi)發(fā)新的麥克風(fēng)模組時(shí),為了再度優(yōu)化AI降噪技術(shù),他們旁聽(tīng)了超過(guò)600多場(chǎng)會(huì)議,收集了1000多個(gè)小時(shí)的錄音,豐富了原有的音源數(shù)據(jù)庫(kù)和聲學(xué)模型體系。如今,MAXHUB的AI降噪技術(shù)可以過(guò)濾掉打字聲、開(kāi)關(guān)門聲、空調(diào)低頻振動(dòng)聲等各類噪音。

“其實(shí),我們的AI降噪技術(shù)還有一個(gè)小缺點(diǎn),它會(huì)把歌聲也過(guò)濾掉,我們?cè)谶@邊唱歌的時(shí)候,對(duì)方能看到口型,但聽(tīng)不到歌聲,這是因?yàn)楫?dāng)時(shí)沒(méi)考慮到大家可能會(huì)在會(huì)議室唱歌???我們后續(xù)的研究課題又多了一個(gè),期待大家以后用MAXHUB會(huì)議平板,來(lái)一次遠(yuǎn)程歌唱比賽。”鄭工這句幽默的話語(yǔ)中,詮釋的正是MAXHUB人不斷發(fā)現(xiàn)問(wèn)題、不斷改善、不斷探索的精神共識(shí)。

為了進(jìn)一步打造極致音頻體驗(yàn),MAXHUB聲學(xué)研發(fā)團(tuán)隊(duì)還引入了騰訊天籟實(shí)驗(yàn)室的領(lǐng)先技術(shù),在MAXHUB V6音視頻專業(yè)版上內(nèi)置騰訊天籟inside音頻模組,采用全新升級(jí)8陣列麥克風(fēng),從而實(shí)現(xiàn)180度廣角、12米超清拾音,并基于深度學(xué)習(xí)模型智能消除超過(guò)300種噪聲,確保多人講話時(shí)每一個(gè)聲音都能聽(tīng)得清、聽(tīng)得真。

“如果把我們的一體化雙攝比作‘千里眼’的話,那我們的麥克風(fēng)模組就是跟它絕配的‘順風(fēng)耳’。它們倆配合工作的原理也挺有趣的,講話人在走動(dòng)的情況下,攝像頭和麥克風(fēng)會(huì)聯(lián)合定位說(shuō)話人的位置,麥克風(fēng)波束就能自動(dòng)對(duì)準(zhǔn)講話人,拾音口就能一直正向收音,確保拾音效果是最好的,我們把這叫做聲隨影動(dòng)。”鄭工驕傲地講解著研發(fā)團(tuán)隊(duì)帶來(lái)的最新成果,當(dāng)然,這不是因?yàn)榧夹g(shù)有多么領(lǐng)先、多么獨(dú)特,而是這些技術(shù)真的能為用戶提供更好的產(chǎn)品體驗(yàn)和更高效的辦公助力。

“千里眼”和“順風(fēng)耳”默契無(wú)間,再搭配上MAXHUB所擅長(zhǎng)的云視頻會(huì)議軟件系統(tǒng),一幅宛如同地的視頻會(huì)議畫面,就展示在眼前:雙方的動(dòng)作、表情和聲音都清晰傳遞給彼此,ppt、設(shè)計(jì)稿等等會(huì)議文件,也能通過(guò)軟件實(shí)時(shí)展示給對(duì)方,如果有哪個(gè)畫面講不清,我們就可以借助同步批注的功能,在這張圖上圈圈畫畫,讓對(duì)方快速鎖定疑問(wèn)的出處。

對(duì)用戶來(lái)說(shuō),MAXHUB帶來(lái)價(jià)值,是讓組織間的遠(yuǎn)程協(xié)作也能同步溝通,就像現(xiàn)場(chǎng)交流一樣高效,幫助減少出差的頻率。對(duì)會(huì)議平板行業(yè)而言,希望MAXHUB的視頻會(huì)議新技術(shù)能起到“燈塔效應(yīng)”,為各大廠商帶來(lái)新的探索方向和技術(shù)原型。

垂髫年華的MAXHUB,才剛剛出發(fā),還很稚嫩,但這里有許許多多像上述兩位工程師一樣的滿懷熱忱和追逐夢(mèng)想的人,用行動(dòng)書(shū)寫著MAXHUB的未來(lái)和詩(shī)歌。

申請(qǐng)創(chuàng)業(yè)報(bào)道,分享創(chuàng)業(yè)好點(diǎn)子。點(diǎn)擊此處,共同探討創(chuàng)業(yè)新機(jī)遇!

相關(guān)文章

  • LTD樞紐云:信創(chuàng)“全面替換”門戶、黨群、經(jīng)營(yíng)管理類軟件產(chǎn)品

    信創(chuàng)即信息技術(shù)創(chuàng)新,是指通過(guò)自主研發(fā)、技術(shù)創(chuàng)新等方式,實(shí)現(xiàn)信息技術(shù)的自主可控,降低對(duì)外部技術(shù)的依賴,提高國(guó)家信息安全保障能力。

  • 助力企業(yè)跑出數(shù)智升級(jí)加速度,828 B2B企業(yè)節(jié)系列直播火熱開(kāi)啟

    第三屆828B2B企業(yè)節(jié)正在全國(guó)如火如荼進(jìn)行中。作為中國(guó)首個(gè)以“提升企業(yè)數(shù)字化能力、助力企業(yè)穩(wěn)健快速成長(zhǎng)”為目標(biāo)的B2B企業(yè)節(jié),828B2B企業(yè)節(jié)由華為云聯(lián)合上萬(wàn)伙伴共同發(fā)起,目的是為了打通數(shù)字化供需天塹,讓科技企業(yè)和有數(shù)轉(zhuǎn)智改需求的中小企業(yè)能在一站購(gòu)平臺(tái)上完成對(duì)接,實(shí)現(xiàn)成就好生意,成為好企業(yè)的節(jié)日

  • 趙峰:提升銷售領(lǐng)導(dǎo)力,實(shí)現(xiàn)業(yè)績(jī)跨越式發(fā)展

    當(dāng)今世界經(jīng)濟(jì)局勢(shì)復(fù)雜多變,企業(yè)面臨著越來(lái)越激烈的市場(chǎng)競(jìng)爭(zhēng)。在生產(chǎn)方式不斷隨著科技水平的發(fā)展而提升的同時(shí),各個(gè)行業(yè)企業(yè)產(chǎn)品之間的差距越來(lái)越小,企業(yè)單純依靠產(chǎn)品很難在如今的市場(chǎng)競(jìng)爭(zhēng)中取勝。因此,如何為企業(yè)尋求更加富有競(jìng)爭(zhēng)力的銷售能力提升辦法,成為了企業(yè)普遍更加看重的問(wèn)題。趙峰,現(xiàn)任北京正信啟德管理顧問(wèn)有

  • 穿越周期:解碼2024年零售快消行業(yè)數(shù)字發(fā)展機(jī)密(附白皮書(shū)下載)

    零售經(jīng)營(yíng)者正處在一個(gè)歷史性的轉(zhuǎn)折點(diǎn)上。一方面,中國(guó)的零售產(chǎn)業(yè)已經(jīng)發(fā)展到門店渠道飽和的狀態(tài),優(yōu)勝劣汰會(huì)是零售產(chǎn)業(yè)未來(lái)一段時(shí)間內(nèi)的主旋律;一方面,中國(guó)消費(fèi)者的價(jià)值觀出現(xiàn)了顯著變化,零售快消市場(chǎng)已經(jīng)進(jìn)入“性價(jià)比時(shí)代”。為此,百望云總結(jié)服務(wù)諸多零售快消經(jīng)營(yíng)者的經(jīng)驗(yàn),集合產(chǎn)品與技術(shù),推出了數(shù)字化解決方案,并取

  • 固態(tài)電池市場(chǎng)大爆發(fā)前夜 這家電池企業(yè)打響第一槍

    受限于三元材料以及磷酸鐵鋰電池在能量密度、安全性、循環(huán)壽命等多方面的限制,純電汽車產(chǎn)品始終無(wú)法完成對(duì)傳統(tǒng)燃油車的致命一擊。在此背景下,優(yōu)勢(shì)明顯的固態(tài)電池被寄予厚望,眾多車企以及電池企業(yè)紛紛加碼這一細(xì)分領(lǐng)域,以求占領(lǐng)技術(shù)制高點(diǎn)。目前,業(yè)界普遍將全固態(tài)電池小批量量產(chǎn)上車的時(shí)間節(jié)點(diǎn)定在2027年左右,大規(guī)

  • 重磅 矢量智控官網(wǎng)正式啟用!

    嘿,朋友們!矢量智控(南京)科技有限公司官網(wǎng)www.ivcon.cn8月31日正式啟用啦!這將是矢量智控的重要里程碑,期待為AI+工業(yè)與制造業(yè)帶來(lái)更深入、更全面的服務(wù)。矢量智控作為南棲仙策旗下工業(yè)智能決策品牌,專注為高端裝備和復(fù)雜流程工業(yè)提供自主智能控制產(chǎn)品和方案。產(chǎn)品積淀前沿AI技術(shù)我們根據(jù)產(chǎn)品的

  • 科沃斯全球首款恒壓活水洗地機(jī)器人亮相,地面清潔能力跨時(shí)代提升?

    北京時(shí)間9月2日凌晨,科沃斯機(jī)器人CEO錢程的一條朋友圈引起業(yè)內(nèi)關(guān)注,搶先揭示了科沃斯將在2024德國(guó)柏林IFA展推出其地寶X系列新品。從簡(jiǎn)短的內(nèi)容中可以窺見(jiàn),科沃斯內(nèi)部對(duì)于這款新品的信心和期待。從錢程朋友圈流出的圖片來(lái)看,猜測(cè)科沃斯此次新品將重點(diǎn)圍繞地面頑垢清潔的提升以及二次污染的問(wèn)題解決。截至上

  • 地球山微電子與AP合作的第二代MEMS揚(yáng)聲器取得重大進(jìn)展

    經(jīng)過(guò)多年堅(jiān)持不懈的努力,以色列AudioPixels公司和中國(guó)地球山微電子公司雙方聯(lián)合研制的數(shù)字像素級(jí)MEMS揚(yáng)聲器技術(shù)取得重大突破。據(jù)AudioPixels官方發(fā)布消息顯示:新研制的第二代MEMS揚(yáng)聲器(GEN-II)所達(dá)到的聲壓級(jí)(SPL或“響度”)已被驗(yàn)證符合其商業(yè)化可行性的數(shù)字聲音重建(DS

  • 縱維立方與3D打印農(nóng)場(chǎng)主相聚2024深圳Formnext展,共探制造新模式

    2024年8月29日,深圳國(guó)際3D打印、增材制造展覽會(huì)(Formnext+PMSouthChina)在深圳國(guó)際會(huì)展中心13號(hào)館隆重舉行。本次展會(huì)以其豐富的活動(dòng)與論壇,再次彰顯了3D打印技術(shù)在商業(yè)發(fā)展中的廣泛應(yīng)用,尤其是在新興的“3D打印農(nóng)場(chǎng)”建設(shè)領(lǐng)域,縱維立方的兩款新品在農(nóng)場(chǎng)主群體中備受關(guān)注,并宣布

  • 拓元智慧受邀參加2024招銀浦江大會(huì),共享新型多模態(tài)大模型的前沿技術(shù)及產(chǎn)業(yè)化實(shí)踐

    8月30日,招商銀行在上海舉辦了“招銀浦江數(shù)字金融生態(tài)大會(huì)”,拓元智慧科技有限公司(以下簡(jiǎn)稱“拓元智慧”)應(yīng)邀參加本次大會(huì)。拓元智慧以其在人工智能領(lǐng)域的深厚積累與前沿探索,吸引了眾多行業(yè)內(nèi)外人士的關(guān)注。公司首席科學(xué)家王廣潤(rùn)博士在論壇上發(fā)表了題為《新型多模態(tài)大模型的前沿技術(shù)及產(chǎn)業(yè)化實(shí)踐》的報(bào)告,深入探

編輯推薦