2024-01-09 14:42:16
視覺(jué)AI可以通過(guò)攝像頭或傳感器來(lái)“感知”外部世界,能將捕捉到的圖像或視頻數(shù)據(jù)進(jìn)行特征提取和分析,最后通過(guò)機(jī)器深度學(xué)習(xí)來(lái)區(qū)分不同物體和特征。一旦系統(tǒng)學(xué)會(huì)了如何識(shí)別圖像中的物體,視覺(jué)AI就可以根據(jù)這些信息自動(dòng)作出決策或響應(yīng)。
近日,廈門浩森威視科技有限公司CEO李密向科技日?qǐng)?bào)記者展示了正在訓(xùn)練的視覺(jué)AI“大顯身手”的新場(chǎng)景。設(shè)計(jì)團(tuán)隊(duì)介紹,他們將視覺(jué)傳感器安裝在普通電子秤上,通過(guò)先進(jìn)的算法設(shè)計(jì),使視覺(jué)AI能迅速將物品與數(shù)據(jù)庫(kù)中的圖像進(jìn)行匹配,從而實(shí)現(xiàn)精準(zhǔn)識(shí)別。這款搭載了視覺(jué)傳感器和算法的智能電子秤能夠在0.5秒內(nèi)精準(zhǔn)識(shí)別480余種果蔬,并自動(dòng)完成稱重結(jié)算。
不同于標(biāo)準(zhǔn)化產(chǎn)品擁有唯一的二維碼信息,散稱果蔬種類龐雜、顏色外形容易混淆,同類果蔬的形態(tài)也因成熟度不同而存在差異。這對(duì)算法技術(shù)提出了很高的要求。為此,該團(tuán)隊(duì)不斷完善算法,持續(xù)訓(xùn)練模型,進(jìn)行了數(shù)次迭代和優(yōu)化。
“通過(guò)算法設(shè)計(jì),我們讓機(jī)器能夠像人類一樣‘看見(jiàn)’并理解‘看見(jiàn)’的世界。”李密說(shuō),其核心技術(shù)在于先進(jìn)的算法中臺(tái),能以圖片數(shù)量較少的圖庫(kù)讓機(jī)器完成深度學(xué)習(xí)。
李密介紹,通常人們?cè)诓耸袌?chǎng)購(gòu)買果蔬時(shí),都需要人工稱重結(jié)算。而有了這臺(tái)智能電子秤,顧客只需自行將散裝商品放在秤上掃描,攝像頭捕捉到圖像后,便能迅速識(shí)別出商品種類,配合系統(tǒng)完成自動(dòng)稱重結(jié)算。這一場(chǎng)景的推廣和普及將極大提高零售業(yè)的結(jié)賬效率,不僅節(jié)省了人力,也優(yōu)化了顧客的購(gòu)物體驗(yàn)。
能自動(dòng)識(shí)別商品的電子秤、能矯正坐姿的臺(tái)燈、能精準(zhǔn)找出工業(yè)產(chǎn)品微小缺陷的系統(tǒng)……當(dāng)前,從家居到工廠生產(chǎn),視覺(jué)AI在多個(gè)創(chuàng)新場(chǎng)景中展現(xiàn)出強(qiáng)大潛力。近年來(lái),該團(tuán)隊(duì)將深度學(xué)習(xí)大模型與成像技術(shù)相結(jié)合,深耕工業(yè)檢測(cè)、智能識(shí)別等,已開(kāi)發(fā)出10余種AI應(yīng)用并用于多個(gè)場(chǎng)景,覆蓋工業(yè)及民用領(lǐng)域。
作為“百度AI技術(shù)生態(tài)伙伴”之一,廈門浩森威視科技有限公司目前正著手與百度共同深入探索不同領(lǐng)域大模型的創(chuàng)新應(yīng)用。在李密看來(lái),相較于文本AI,視覺(jué)AI能夠處理的信息量更大、產(chǎn)品效果更加直觀,可應(yīng)用場(chǎng)景多,市場(chǎng)潛力巨大。“隨著計(jì)算能力的增強(qiáng)和算法的不斷進(jìn)步,視覺(jué)AI將在更多細(xì)分領(lǐng)域的創(chuàng)新場(chǎng)景中發(fā)揮關(guān)鍵作用。無(wú)論是在復(fù)雜的工業(yè)檢測(cè)中,還是在精密的醫(yī)療診斷中,視覺(jué)AI都將成為提高效率和準(zhǔn)確性的強(qiáng)大工具?!崩蠲苷f(shuō)。