域名預(yù)訂/競(jìng)價(jià),好“米”不錯(cuò)過(guò)
人工智能一浪接一浪地席卷全球,AI的其中一個(gè)重要分支——計(jì)算機(jī)視覺,也如雨后春筍,不斷涌現(xiàn)出新的想法和應(yīng)用。人臉識(shí)別已經(jīng)逐漸滲透我們的日常生活,機(jī)器能夠認(rèn)準(zhǔn)人臉,想必大家都有所耳聞;而另一類計(jì)算機(jī)視覺的應(yīng)用,是進(jìn)行 商品識(shí)別。
當(dāng)前新興的一些無(wú)人零售店,背后就需要機(jī)器對(duì)商品進(jìn)行自動(dòng)識(shí)別,拍圖購(gòu)物、AR互動(dòng)營(yíng)銷等場(chǎng)景,也運(yùn)用了商品識(shí)別技術(shù)。人工智能商業(yè)公司 ImageDT,則利用商品圖像識(shí)別技術(shù)提供2B商業(yè)服務(wù),包括基于互聯(lián)網(wǎng)圖片大數(shù)據(jù)的商業(yè)分析,以及基于門店貨架識(shí)別的 渠道數(shù)據(jù)洞察,幫助消費(fèi)品企業(yè)提升業(yè)績(jī)。
今天,圖醬就跟大家科普應(yīng)用在無(wú)人店、新零售中的商品識(shí)別技術(shù)。
數(shù)據(jù)邏輯
讓小孩“記住”超市里的所有商品
我們教一個(gè)小孩識(shí)物的時(shí)候,比如“蘋果”,首先要讓他反復(fù)的看到 “蘋果”,他便能認(rèn)識(shí)“蘋果”;他可能會(huì)認(rèn)錯(cuò),把“梨”認(rèn)成“蘋果”,這個(gè)時(shí)候應(yīng)該幫他指出來(lái)。小孩看到的“蘋果”越多,辨識(shí)的能力就越強(qiáng)。
基于深度神經(jīng)網(wǎng)絡(luò)的人工智能,讓機(jī)器具備理解的能力,基本過(guò)程就像教一個(gè)小孩認(rèn)蘋果一樣。首先要有大量的數(shù)據(jù), 比如“蘋果”的圖片;同時(shí),要增加大量機(jī)器會(huì)認(rèn)錯(cuò)的“負(fù)樣本”,比如“梨”的圖片;然后經(jīng)過(guò)一個(gè)深度神經(jīng)網(wǎng)絡(luò),反復(fù)學(xué)習(xí),最終獲得一個(gè)有效的識(shí)別模型。
對(duì)于快消商品的識(shí)別,我們不僅要認(rèn)出一個(gè)瓶子包裝,還要認(rèn)出是一瓶酸奶還是啤酒;不僅要認(rèn)出酸奶,還要認(rèn)出是哪個(gè)品牌的酸奶,甚至是哪個(gè)口味和規(guī)格。要讓機(jī)器能夠準(zhǔn)確識(shí)別成千上萬(wàn)的快消商品SKU,是一項(xiàng)極其龐大而復(fù)雜的AI工程。
數(shù)據(jù)采集
讓機(jī)器獲得學(xué)習(xí)的原始素材
首先,我們需要梳理出所有的目標(biāo)商品清單,并設(shè)法獲得每一件商品的圖片數(shù)據(jù)。根據(jù)商品的特征辨識(shí)度,通常需要幾十到幾百?gòu)埖挠行D片。
數(shù)據(jù)采集是一套組合拳。電商平臺(tái)上擁有結(jié)構(gòu)化的商品介紹圖片以及大量的買家曬圖,社交平臺(tái)上也能獲取到大量的消費(fèi)者曬圖,是性價(jià)比最高的數(shù)據(jù)源。超市店內(nèi)的真實(shí)貨架數(shù)據(jù),是最可靠的數(shù)據(jù)源,但獲取和后期處理的成本都比較高。
除此之外,ImageDT還通過(guò)自主研發(fā)智能燈箱和 智能采集車,模擬各種不同的場(chǎng)景對(duì)商品進(jìn)行360°拍攝從而建立龐大的訓(xùn)練數(shù)據(jù)庫(kù),以此來(lái)獲取最 豐富的訓(xùn)練數(shù)據(jù)。
數(shù)據(jù)標(biāo)注
有多少人工,才有多少智能
采集到原始圖片數(shù)據(jù),通常會(huì)混雜許多“臟數(shù)據(jù)”,需要進(jìn)行清洗;大部分情況下,還需要對(duì)圖片中的物體進(jìn)行標(biāo)注和 分類。只有可靠的數(shù)據(jù)才能產(chǎn)生高質(zhì)量的識(shí)別模型。
在每一個(gè)人工智能公司,都有一支特殊的軍隊(duì)——數(shù)據(jù)標(biāo)注團(tuán)隊(duì)。ImageDT也不例外,在背后支撐這個(gè)團(tuán)隊(duì)的是一個(gè)充滿黑科技的標(biāo)注系統(tǒng)。
比如,圖片在標(biāo)注前通常會(huì)先經(jīng)過(guò)弱模型的處理,讓機(jī)器先解決 50%的問(wèn)題;系統(tǒng)有支持批量標(biāo)注的小圖模式,讓標(biāo)注員可以一目十行,成倍提高標(biāo)注的速度;產(chǎn)品經(jīng)理反復(fù)打磨每一個(gè)功能,做A/B測(cè)試,從每處細(xì)節(jié)提高標(biāo)注的體驗(yàn)和效率。
除此之外,標(biāo)注團(tuán)隊(duì)還為不同任務(wù)配置了不同等級(jí)的質(zhì)量保證機(jī)制,包括抽樣審核、全量審核、交叉校驗(yàn)、埋點(diǎn)校驗(yàn)等,確保讓機(jī)器學(xué)習(xí) 最準(zhǔn)確最可靠的訓(xùn)練數(shù)據(jù)。
模型訓(xùn)練
“活到老學(xué)到老”,機(jī)器也要不斷學(xué)習(xí)
準(zhǔn)備好了數(shù)據(jù),下一步就是讓機(jī)器進(jìn)行學(xué)習(xí),建立識(shí)別模型的過(guò)程。同樣的數(shù)據(jù),選擇不同的神經(jīng)網(wǎng)絡(luò)算法、以及不同的參數(shù)設(shè)置,將會(huì)影響最終模型的效果。模型建立之后,還需要進(jìn)行管理:模型之間存在層次關(guān)系,數(shù)據(jù)和模型會(huì)存在版本的迭代,這些問(wèn)題,當(dāng)遇到大量商品類別的時(shí)候,顯得非常艱難。
在ImageDT內(nèi)部,有一個(gè)自助式的深度學(xué)習(xí)平臺(tái),支持拖拉拽的算法和參數(shù)測(cè)試,甚至一個(gè)非程序員都可以傻瓜式的完成一次建模任務(wù),并獲得模型的效果評(píng)估報(bào)告。
每一位ImageDT的新員工,不管是工程師,還是前臺(tái),都會(huì)接受一次半小時(shí)的建模培訓(xùn);而在培訓(xùn)結(jié)束后,每個(gè)人都將能夠獨(dú)立的建立一個(gè)圖像識(shí)別模型,整個(gè)過(guò)程只需要 半小時(shí)。
同時(shí),深度學(xué)習(xí)平臺(tái)就像一個(gè)模型倉(cāng)庫(kù),兼顧著對(duì)象、數(shù)據(jù)和模型的管理。
整個(gè)建模的過(guò)程已經(jīng)標(biāo)準(zhǔn)化,最快只需要一天,就能完成從數(shù)據(jù)采集、標(biāo)注、建模到上線的整個(gè)流程。
ImageDT的研發(fā)團(tuán)隊(duì)分為四個(gè)組,產(chǎn)品組、建模組、數(shù)據(jù)組和研究組。前三個(gè)組,負(fù)責(zé)實(shí)現(xiàn)流水線的搭建和經(jīng)營(yíng),使得每天都能井井有條地建立大量新的商品識(shí)別模型,并快速上線,對(duì)每天數(shù)千萬(wàn)的圖片數(shù)據(jù)進(jìn)行識(shí)別和分析。研究組,則要克服各種疑難雜癥,比如容易產(chǎn)生褶皺的軟包裝、商品側(cè)面和背面的識(shí)別、遮擋和反光環(huán)境下的識(shí)別等等。
目前,在實(shí)際生產(chǎn)環(huán)境下,已經(jīng)達(dá)到95%以上的識(shí)別準(zhǔn)確率。
人臉都有眼睛、鼻子、嘴巴等固定的特征,而超市中琳瑯滿目的商品,則千奇百態(tài)。與人臉識(shí)別相比,商品識(shí)別有更高的工程復(fù)雜度。 ImageDT正在做的,就是實(shí)現(xiàn)這個(gè)龐大的AI工程,讓機(jī)器能夠自動(dòng)地、準(zhǔn)確地識(shí)別 每一件商品。
關(guān)于ImageDT
ImageDT(圖匠數(shù)據(jù))是一家人工智能商業(yè)應(yīng)用公司。團(tuán)隊(duì)專注于為企業(yè)提供商業(yè)智能化技術(shù)與服務(wù),具備領(lǐng)先的數(shù)據(jù)采集、圖像識(shí)別、語(yǔ)義分析、海量數(shù)據(jù)挖掘等技術(shù),長(zhǎng)期服務(wù)于日化、乳制品、食品、飲料等快速消費(fèi)品生產(chǎn)和零售企業(yè),主要產(chǎn)品包括:智能貨架圖像識(shí)別與洞察系統(tǒng),互聯(lián)網(wǎng)圖片大數(shù)據(jù)應(yīng)用等,用智能科技助力企業(yè)業(yè)績(jī)?cè)鲩L(zhǎng)。
申請(qǐng)創(chuàng)業(yè)報(bào)道,分享創(chuàng)業(yè)好點(diǎn)子。點(diǎn)擊此處,共同探討創(chuàng)業(yè)新機(jī)遇!