RFID世界網(wǎng) > 新聞中心 > 行業(yè)動(dòng)態(tài) > 正文

2019零售大變局！3D視覺暗戰(zhàn)智能貨柜

作者：季瑜生

來源：智東西

日期：2019-01-18 09:59:09

摘要：帶著這些問題，在過去的幾周里，記者在采訪了數(shù)十位行業(yè)頭部玩家以及領(lǐng)域內(nèi)專家后發(fā)現(xiàn)：當(dāng)前的3D動(dòng)態(tài)視覺貨柜正處在大規(guī)模爆發(fā)的前夜，一場關(guān)于技術(shù)以及點(diǎn)位搶占的商業(yè)競賽在2019年一觸即發(fā)。

關(guān)鍵詞：3D視覺RFID零售智能貨柜

當(dāng)經(jīng)歷了2017年的瘋狂點(diǎn)位大戰(zhàn)以及2018年的巔峰急墜之后，智能貨柜終于迎來了行業(yè)的終極形態(tài)——3D動(dòng)態(tài)智能貨柜！

3D動(dòng)態(tài)智能貨柜就能為這個(gè)行業(yè)帶來了什么？高空間利用率、精準(zhǔn)商品識別效率以及低計(jì)算量之外，技術(shù)是否已經(jīng)成熟，產(chǎn)業(yè)鏈的構(gòu)建是否完善，巨頭們到底有誰在瓜分這塊距離用戶最近的蛋糕？

帶著這些問題，在過去的幾周里，記者在采訪了數(shù)十位行業(yè)頭部玩家以及領(lǐng)域內(nèi)專家后發(fā)現(xiàn)：當(dāng)前的3D動(dòng)態(tài)視覺貨柜正處在大規(guī)模爆發(fā)的前夜，一場關(guān)于技術(shù)以及點(diǎn)位搶占的商業(yè)競賽在2019年一觸即發(fā)。

一年升級四次，智能貨柜終極形態(tài)顯現(xiàn)

站在3D動(dòng)態(tài)貨柜破空而出的當(dāng)下，我們會(huì)發(fā)現(xiàn)在經(jīng)歷了一年多的發(fā)展后，無人貨柜早已脫離了草莽階段，精細(xì)化運(yùn)營以及角色區(qū)分正成為當(dāng)下行業(yè)的一大趨勢。

這一階段，出現(xiàn)了阿里為代表的智能貨柜平臺商，以每日優(yōu)鮮為代表的貨柜運(yùn)營商，以及以小賣柜為代表的整體貨柜制造商，進(jìn)一步拓展到產(chǎn)業(yè)鏈上游，我們會(huì)發(fā)現(xiàn)以圖漾科技為代表的3D攝像頭廠商已經(jīng)準(zhǔn)備就緒，同時(shí)以深視科技為代表的3D動(dòng)態(tài)子模塊提供商也早已等待多時(shí)。

而從技術(shù)角度來看，你會(huì)發(fā)現(xiàn)一切發(fā)展的迅速而又靜默，短短一年多時(shí)間，產(chǎn)品方案就已經(jīng)經(jīng)歷了四代升級。

從無人貨架進(jìn)化到智能貨柜的第一代雛形大概發(fā)生在2017年初，當(dāng)年4月“CITYBOX”智能貨柜上線，主要采用了RFID頻射標(biāo)簽進(jìn)行自動(dòng)扣款的方式。

在這種運(yùn)營方式中，每一件商品都會(huì)貼上一個(gè)成本大約為5毛的RFID標(biāo)簽，然后貨柜的每一層都會(huì)裝上相應(yīng)的傳感器，價(jià)格約在千元左右，商品進(jìn)出全部會(huì)被傳感器所捕捉。

但是沒過多久，RFID方案就由于用戶可能撕標(biāo)簽帶來商品盜損，以及部署、運(yùn)營成本過高而迅速被市場淘汰。曾有業(yè)內(nèi)人士笑稱，做RFID方案貨柜的最后都是給標(biāo)簽廠打工的。

接著，到了2018年年初，以非典型智能貨柜玩家深蘭科技為代表的機(jī)器視覺智能貨柜面世，將智能貨柜的市場帶到了“攝像頭”時(shí)代。

這一時(shí)期的智能貨柜會(huì)在每層的頂部中央位置都放一個(gè)攝像頭，或者在每層的左右兩側(cè)各布一個(gè)攝像頭，然后算法會(huì)根據(jù)每層的攝像頭記錄下的貨柜開門前后每層商品的變化來完成扣款。

但是這種方案由于需要攝像頭完整的拍到每層商品變化，因此這就需要商品的擺放不能發(fā)生堆疊，并且攝像頭與商品中間也要留出很大空距，因此這一方案雖然保障了安全但卻造成了極高的空間浪費(fèi)。

另外，一旦需要對SKU進(jìn)行增減，靜態(tài)方案就需要對單品SKU的訓(xùn)練進(jìn)行不斷的位置調(diào)整訓(xùn)練，以應(yīng)對各種可能的取放情況，因此方案整體會(huì)出現(xiàn)過擬合以及對SKU品類限制較高的情況。當(dāng)前市面上的主流靜態(tài)方案應(yīng)用還都停留在賣飲料等典型標(biāo)品的階段。

可以彌補(bǔ)這種缺陷的則是動(dòng)態(tài)視覺方案，2018年3月，YI Tunnel在“中國零售數(shù)字化創(chuàng)新大會(huì)”上首先亮相了這項(xiàng)技術(shù)。同樣是以計(jì)算機(jī)視覺識別商品，動(dòng)態(tài)方案利用的是門口的四個(gè)攝像頭來識別用戶開門后手上的商品，因此對于貨柜內(nèi)部商品的擺放幾乎沒有任何要求，同時(shí)也減少了智能貨柜內(nèi)部的攝像頭數(shù)量。

不過與靜態(tài)識別可以將所有數(shù)據(jù)上傳云端后再進(jìn)行識別不同，動(dòng)態(tài)識別需要對連續(xù)多幀的圖像中的每一個(gè)像素點(diǎn)都進(jìn)行識別，需要進(jìn)行大計(jì)算量的本地化部署。

具體來說，傳統(tǒng)動(dòng)態(tài)方案通常需要攝像頭配備720的像素，每秒60幀的速率。計(jì)算所需的最普通的一個(gè)1070的顯卡就要五千塊左右，另外還需要主板、CPU、內(nèi)存、封裝等一系列配置，最后，一套系統(tǒng)部署下來單柜成本就會(huì)提升近萬元。

為了降低本地化部署的成本同時(shí)降低背景對識別效率的影響，3D動(dòng)態(tài)視覺方案在2019年年初正式登場。

3D動(dòng)態(tài)視覺方案與傳統(tǒng)動(dòng)態(tài)方案的主要區(qū)別在于一個(gè)用于定位的3D攝像頭的引入，它可以原有的2D攝像頭抓拍中從空間角度對用戶手上的物品進(jìn)行像素級定位，進(jìn)而將無關(guān)背景做到擦除，只識別特定區(qū)域內(nèi)的商品，做到減少計(jì)算量從而降低成本的目標(biāo)。

三大頭部入場，2019戰(zhàn)事一觸即發(fā)

在3D動(dòng)態(tài)視覺貨柜迎來爆發(fā)的前夜，最先面世的產(chǎn)品是小賣柜在2018年12月中旬發(fā)布的“極目系列動(dòng)態(tài)視覺智能貨柜”。

有業(yè)內(nèi)人士透露，當(dāng)前小賣柜的這一款產(chǎn)品事實(shí)上還沒有進(jìn)入大規(guī)模的地推階段，不過已經(jīng)有了小范圍的量產(chǎn)，在一些展會(huì)上我們可以看到該款產(chǎn)品的亮相。

從技術(shù)角度來看，這款產(chǎn)品是主要利用Intel OpenVINO AI工具包開發(fā)，基于3D+2D的動(dòng)態(tài)視覺識別輔以重力感應(yīng)的方式，貨柜可以容納240件商品堆疊放置，而結(jié)算的準(zhǔn)確率則可以達(dá)到99%。無論用戶單手、雙手還是多次取放都能做到實(shí)時(shí)交互與識別。

硬件配備上，極目系列動(dòng)態(tài)視覺智能貨柜使用的是一款低功耗的邊緣計(jì)算設(shè)備來實(shí)現(xiàn)模型推導(dǎo)加速，可以在用戶關(guān)門的瞬間，在本地就完成結(jié)算，極大的縮短了用戶購物的結(jié)算時(shí)間與寬帶成本。

耗電量上，這款產(chǎn)品的容量柜機(jī)容量510升，還配上了一塊21.5寸的LED大屏，可以實(shí)時(shí)顯現(xiàn)用戶取放的商品及定價(jià)，但是功耗僅為3度/天。

除了整柜制造商小賣柜外，當(dāng)前阿里也在以平臺商的角度對這一方面進(jìn)行積極的探索。

自2016年的雙十一起，阿里的新零售智能事業(yè)群就已經(jīng)開始了智能貨柜的立項(xiàng)，到了2018年年底，正式開始了對3D動(dòng)態(tài)智能貨柜的探索。

據(jù)悉，阿里為了鋪設(shè)這套3D動(dòng)態(tài)方案曾經(jīng)前后接觸過三家方案商的產(chǎn)品，其中準(zhǔn)確率、售價(jià)、用戶體驗(yàn)都是重要考量。

不過據(jù)阿里內(nèi)部人士表示，設(shè)備正式鋪開之前，設(shè)備還需要一段時(shí)間的測試與優(yōu)化，當(dāng)前在阿里巴巴的西溪園區(qū)已經(jīng)有了少量設(shè)備開始了測試。預(yù)計(jì)今年的11月份左右，阿里將對這套設(shè)備進(jìn)行大范圍的鋪展推廣。

貨柜運(yùn)營商每日優(yōu)鮮方面，有消息稱其早在2018年的四月左右就已經(jīng)開始了對3D動(dòng)態(tài)視覺方案的探索，當(dāng)前已經(jīng)在個(gè)別點(diǎn)位進(jìn)行了試運(yùn)營。

迎接市場爆發(fā)，三維視覺算法提供商已經(jīng)就位

“如果3D動(dòng)態(tài)的方案都跑不出來，智能貨柜也就別做了。”在問及關(guān)于智能貨柜未來幾年的發(fā)展后，深視科技CEO張磊這樣對智東西表示。

深視科技是一家計(jì)算機(jī)三維視覺算法提供商，早在2017年年中的無人貨架浪潮剛剛興起的時(shí)候，張磊與其他兩位核心創(chuàng)始人員就將目光瞄準(zhǔn)了3D動(dòng)態(tài)視覺方案的智能貨柜之中。當(dāng)前已經(jīng)達(dá)成了與個(gè)別頭部廠商的合作，并且對產(chǎn)品進(jìn)行了小規(guī)模的試點(diǎn)運(yùn)營。

而他們所負(fù)責(zé)的正是貨柜當(dāng)中的3D動(dòng)態(tài)視覺系統(tǒng)子模塊，簡單來說就是3D動(dòng)態(tài)方案中的商品識別算法研發(fā)以及相應(yīng)的硬件采購配置。

在他看來，此前市面上主流的智能貨柜解決方案都或多或少有一些致命傷的存在。而3D視覺方案所帶來的貨柜空間利用率高、本地化部署成本低以及商品識別的精準(zhǔn)度高這三大優(yōu)勢則正好可以解決此前的一些行業(yè)方案的不足。

當(dāng)下定決心做這一行之后，他首先確認(rèn)了一個(gè)原則就是要將方案做的通用且高效。

此前市面上的一些3D動(dòng)態(tài)視覺方案，大多與微軟的三維視覺游戲Kinect相類似，但是這種方案當(dāng)時(shí)只能跑在X86的平臺之上，如果要做到大規(guī)模的行業(yè)應(yīng)用，成本就成了致命傷。

因此如何能夠ARM平臺，根據(jù)硬件特性對算法進(jìn)行優(yōu)化就成了當(dāng)務(wù)之急。在解決了這一問題之后，成本問題也就隨之驟降，張磊表示，當(dāng)前深視科技一套完成CPU、GPU、內(nèi)存等封裝的系統(tǒng)也不過兩千元左右，僅僅是2D動(dòng)態(tài)方案的三分之一左右。

技術(shù)難題之外，如何將一個(gè)demo變成行業(yè)通用的穩(wěn)定方案也同樣是一個(gè)不容忽視的問題。

最簡單的事情，就比如四個(gè)2D攝像頭的布局，一般人可能會(huì)想到頂上兩個(gè)攝像頭方向向下，底部兩個(gè)攝像頭方向向上，這樣就可以將用戶的行為比較清晰的捕捉完全。

但是實(shí)際應(yīng)用之后，就發(fā)現(xiàn)這一方案根本行不通，夏天女孩子穿短裙的話就足以讓這套方案變得十分尷尬。經(jīng)過商討，最終大家才確定了四個(gè)2D攝像頭兩個(gè)在頂上，兩個(gè)在中間，一個(gè)3D攝像頭在頂部的中間位置，全部向下拍攝的方案。

甚至關(guān)于3D攝像頭的位置也是一個(gè)被反復(fù)商討優(yōu)化的問題。最開始，由于3D攝像頭會(huì)存在一定的盲區(qū)，大家會(huì)將3D攝像頭的位置放的比較高，但這樣部署之后攝像頭就無法捕捉到用戶本身，這又對識別效率帶來一定的影響。

另外，有時(shí)候會(huì)出現(xiàn)用戶單手拿多件產(chǎn)品的問題，這會(huì)對商品的識別效率帶來一定的影響。

本以為這是個(gè)要通過各種硬件升級或者算法優(yōu)化的復(fù)雜問題，但是最后通過在柜子頂部以及每層貨架的底部加上一塊透明擋板，就完成了讓用戶無法在盲區(qū)內(nèi)取出商品，也無法一次性取出太多商品的目的。有一位前來參觀的行業(yè)大佬曾經(jīng)笑言，你們這一塊板子可以申請專利了。

迎接市場爆發(fā)，3D攝像頭迎來了智能貨柜的定制化時(shí)代

深視科技的3D攝像頭提供方圖漾科技幾乎也是在2017年就將目光瞄準(zhǔn)了消費(fèi)領(lǐng)域。

在圖漾科技CEO費(fèi)浙平看來，3D攝像頭在工業(yè)級的應(yīng)用在當(dāng)時(shí)已經(jīng)逐漸成熟，足以支撐企業(yè)的穩(wěn)定盈利。而同樣對3D視覺有著迫切需要的零售行業(yè)當(dāng)前還處于藍(lán)海階段。

▲圖漾科技CEO費(fèi)浙平

雖然底層的硬件技術(shù)上，工業(yè)領(lǐng)域與零售領(lǐng)域的區(qū)別并不算大，但是針對不同行業(yè)，攝像頭的參數(shù)、鏡頭等配置依舊需要漫長的時(shí)間調(diào)整。

從2017年決定進(jìn)軍消費(fèi)領(lǐng)域到2018年需求逐漸顯現(xiàn)的一年時(shí)間里，費(fèi)浙平把精力主要放在了產(chǎn)品針對特定消費(fèi)領(lǐng)域的打磨上。

首先是技術(shù)的選擇上，當(dāng)前市面上的3D攝像頭方案主要有以下幾種類型：TOF、RGB雙目、結(jié)構(gòu)光。

三種主流方案中，比較成熟的是結(jié)構(gòu)光和TOF。其中結(jié)構(gòu)光方案最為成熟，但是極易受到外界光的干擾、響應(yīng)速度較慢、識別精度較低；TOF則在這幾個(gè)方面比結(jié)構(gòu)光方案具有一定的優(yōu)勢，因此TOF成為了目前在移動(dòng)端被看好的方案?；谝暡钤淼碾p目立體成像方案抗環(huán)境光干擾強(qiáng)，分辨率高，也是移動(dòng)端可選方案之一。但是純雙目方案當(dāng)前頁存在著在紋理單調(diào)的環(huán)境中找不到匹配點(diǎn)而失效的缺點(diǎn)。

與市面上的傳統(tǒng)方案不同的是，圖漾采用的則是主動(dòng)雙目視覺方案，3D視覺傳感器由雙目紅外攝像頭、彩色攝像頭和光學(xué)增強(qiáng)系統(tǒng)組成，也就是將雙目方案與結(jié)構(gòu)光方案整合。

其中，光學(xué)增強(qiáng)系統(tǒng)也就是業(yè)界所成稱的結(jié)構(gòu)光，本質(zhì)上就是一個(gè)激光投射器，雙目攝像頭相當(dāng)于接收器。當(dāng)投射器投出的光線打在物體表面，物體將光線反射到兩個(gè)攝像頭內(nèi)，以此收集相應(yīng)參數(shù)信息，再由圖漾搭配的算法，通過計(jì)算給出物體的長寬高、距離等物理屬性?？梢钥朔陨蠋追N方案在精準(zhǔn)度以及效率上的不足。

除了技術(shù)問題，還有產(chǎn)業(yè)定制化的問題需要應(yīng)對。

一般來說，應(yīng)用在消費(fèi)領(lǐng)域的攝像頭售價(jià)僅在中下游的水平，因?yàn)槠鋵τ谶h(yuǎn)距離識別的精準(zhǔn)度要求并不高。但是針對這一領(lǐng)域，對硬件的盲區(qū)范圍、視角以及速度卻有著更高的要求。

以幀率來說，一般的3D攝像頭幀率是每秒30幀，但是在智能貨柜中就需要60幀才能支持用戶的快速的取放。視覺盲區(qū)的大小上，當(dāng)前市場主流的方案盲區(qū)較大，一般要50公分開外才能有數(shù)據(jù)，但是在智能貨柜中，這一參數(shù)必須縮短到20甚至15厘米以內(nèi)，以防止用戶從盲區(qū)取貨帶來商品的盜損。與此相配合的鏡頭視角上，也需要從60度擴(kuò)展到90度或者100度。

這些看似容易，但是卻涉及到了鏡頭的更換，傳感器參數(shù)的調(diào)試，以及重新打版的產(chǎn)能投入，如果沒有提前預(yù)測到市場的這一需求或者沒有足夠的技術(shù)保障，是無法滿足客戶的這些需求的。

而在完成demo之后，如何保障在真實(shí)情況下適用，依舊需要漫長的壓力測試之路要走。例如最基本的問題：用戶什么動(dòng)作才是正常的，什么動(dòng)作是違規(guī)的，真實(shí)情況下會(huì)出現(xiàn)什么比較異常的消費(fèi)行為，需要對相應(yīng)的硬件產(chǎn)品的參數(shù)要提出什么需求，這些都需要時(shí)間的驗(yàn)證。

但獲取消費(fèi)者行為數(shù)據(jù)并不是普通硬件廠所擅長的，因此獲得頭部客戶的支持，共同完成產(chǎn)品的打磨又成了必須邁過的一道坎，費(fèi)浙平表示，當(dāng)前圖漾已經(jīng)與多家頭部3D動(dòng)態(tài)貨柜廠商達(dá)成了深度合作。

3D智能貨柜未來的可能與當(dāng)下的局限

為什么做智能貨柜？不同的身份會(huì)有不同的考量，于品牌商小賣柜而言或許這將帶來更大的貨柜銷量，于運(yùn)營商每日優(yōu)鮮而言，這或許將帶來運(yùn)營效率的成倍提升以及成本的急速下降，而于阿里而言，作為對新零售的重要探索方式，這或許將為其再造一個(gè)線下的天貓。

當(dāng)前階段，國內(nèi)的電商的爆發(fā)性增長幾乎不會(huì)再來臨，而剩下的用戶大多沉淀在農(nóng)村與線下領(lǐng)域。農(nóng)村方面，無論是拓展的速度還是增長的幅度都十分有限，而線下則幾乎是一塊未經(jīng)開墾的處女地，如果將其利用得當(dāng)，很可能會(huì)帶來一次爆發(fā)式的增長。

簡單的算一筆賬，如果運(yùn)營商鋪設(shè)兩萬臺設(shè)備，單臺設(shè)備一天的訂單量僅為15單，那么單日的訂單量就可以達(dá)到三十萬。而電商新貴拼多多在創(chuàng)立兩年后的日訂單量也不過30-40萬。于阿里而言，這幾乎是再造了一版線下的天貓。

而深扎線下場景的智能貨柜還可以完成一些線上的天貓與拼多多所不能完成的事情。例如天然的廣告展示屬性與和用戶更近的距離。

以友寶在線為例，這是一家傳統(tǒng)的自動(dòng)販?zhǔn)蹤C(jī)廠家，根據(jù)其財(cái)報(bào)披露，友寶在線2018年上半年運(yùn)營設(shè)備總量大約為5.5萬臺，營業(yè)收入11.41億元，凈利潤8604.85萬元，而其中廣告端的收入就達(dá)到了2.14 億元。

如果以日本共計(jì)五百多萬臺收貨機(jī)的密度來算，而當(dāng)前的市場總量還遠(yuǎn)遠(yuǎn)未到飽和。如果將中國的售貨機(jī)、智能貨柜大屏全部利用起來，那么再造一個(gè)分眾傳媒也不是難事。

未來可能無數(shù)，但是眼前仍有問題有待解決，從技術(shù)成型到市場成熟，涉及的一整條產(chǎn)業(yè)鏈的交互配合。

盡管在當(dāng)前階段，3D動(dòng)態(tài)識別技術(shù)在智能貨柜中的應(yīng)用已經(jīng)基本成型，但如何保障及真實(shí)情況下的運(yùn)營效率以及其他配套硬件的產(chǎn)能供給，這都是需要在不斷的優(yōu)化中慢慢改進(jìn)的。

一方面，從技術(shù)指標(biāo)上來看，如何降低用戶單手取三件或多件商品的識別誤差還需一些改進(jìn)，這種針對各種突發(fā)情況的改進(jìn)還需真實(shí)情況下的貨柜運(yùn)營方反饋。

效率上，盡管3D動(dòng)態(tài)識別相較傳統(tǒng)的靜態(tài)識別的SKU訓(xùn)練速度已經(jīng)有了非常大的改進(jìn)，但是單品兩千張的訓(xùn)練樣本需求在面對大規(guī)模SKU上架時(shí)仍舊需要對算法、算力、成本以及時(shí)間消耗進(jìn)行一定的考量。

配套設(shè)施上，盡管當(dāng)前的3D視覺技術(shù)已經(jīng)相對成熟，但是用于復(fù)核校驗(yàn)的微重力感應(yīng)設(shè)備還沒有完成對零售行業(yè)的定制化生產(chǎn)，這也對設(shè)備的大規(guī)模投放時(shí)間帶來了一定的影響。

不過，當(dāng)技術(shù)與模式都已成型，剩下的事情一切交給時(shí)間就好。

結(jié)語：終極形態(tài)已定，市場是否將重現(xiàn)2017的點(diǎn)位大戰(zhàn)？

從興起到如今，無人貨柜走過了過山車似的兩年，第一年里，草莽叢生，資本、點(diǎn)位大戰(zhàn)高潮迭起，第二年里，玩家瘋狂退卻，形態(tài)一年四變。

當(dāng)終極形態(tài)被基本定格在3D的動(dòng)態(tài)方案，技術(shù)已經(jīng)成型，智能貨柜的下半場將走向何方？2017年的點(diǎn)位大戰(zhàn)又是否將重現(xiàn)江湖？

或許技術(shù)的成型會(huì)給這個(gè)行業(yè)帶來一管大劑量的強(qiáng)心針，但是市場卻從來不會(huì)這么簡單，形態(tài)只是這個(gè)市場上露出的冰山一角，海平面之下的供應(yīng)鏈之戰(zhàn)、支付入口之戰(zhàn)、供應(yīng)商搶奪戰(zhàn)……一切都還待定。

盡管如此，技術(shù)的進(jìn)步依舊為這個(gè)行業(yè)的發(fā)展帶來了無限可能，在一片高呼智能貨柜已死，無人零售沒有未來的唱衰中，3D動(dòng)態(tài)視覺正將智能貨柜推向再一次爆發(fā)的前夜。

2019零售大變局！3D視覺暗戰(zhàn)智能貨柜

2019零售大變局！3D視覺暗戰(zhàn)智能貨柜