一、背景
近年來隨著需求和業(yè)務(wù)量的高速增長(zhǎng),貨運(yùn)安全面臨的挑戰(zhàn)愈發(fā)嚴(yán)峻。這其中貨箱載人、違禁品運(yùn)輸、危險(xiǎn)駕駛、車內(nèi)沖突等安全隱患是事故頻發(fā)的誘因。
這些安全事件一旦發(fā)生事故,后果不堪設(shè)想。不僅會(huì)給當(dāng)事人造成人員傷亡和經(jīng)濟(jì)損失,而且會(huì)給公司帶來巨大的監(jiān)管壓力,對(duì)公司的社會(huì)聲譽(yù)也會(huì)有不小的負(fù)面影響。
由于貨運(yùn)平臺(tái)受限于運(yùn)輸需求撮合的業(yè)務(wù)形態(tài),業(yè)務(wù)發(fā)生場(chǎng)景分散、復(fù)雜,對(duì)貨運(yùn)過程中運(yùn)輸物品的識(shí)別能力有限,因而傳統(tǒng)安全監(jiān)管手段對(duì)互聯(lián)網(wǎng)貨運(yùn)場(chǎng)景無法做到及時(shí)發(fā)現(xiàn)和干預(yù),行前、行中監(jiān)管能力缺失,導(dǎo)致貨運(yùn)平臺(tái)只能通過事后處置來降低事發(fā)后果和影響。
AI技術(shù)的不斷發(fā)展、成熟,賦予了貨運(yùn)平臺(tái)高效、實(shí)時(shí)的監(jiān)測(cè)方式和干預(yù)渠道,尤其是貨運(yùn)訂單行前、行中環(huán)節(jié)。利用AI技術(shù),貨運(yùn)平臺(tái)可以對(duì)貨運(yùn)訂單的風(fēng)險(xiǎn)全程監(jiān)控、識(shí)別、干預(yù)和治理,從而將事故消除在萌芽狀態(tài),這已經(jīng)成為未來安全防控與治理的高效可靠手段。
二、解決方案介紹
下面介紹一種貨運(yùn)安全防控與治理整體解決方案,具體框架如下:
上醫(yī)治未病,是貨運(yùn)安全防控與治理的原則。因此,需要在事故發(fā)生前識(shí)別出運(yùn)輸前、運(yùn)輸中安全隱患。
當(dāng)平臺(tái)識(shí)別到行前、行中的安全隱患后,迅速妥善進(jìn)行事件處置,力爭(zhēng)將安全事故消滅于萌芽前。對(duì)于不同風(fēng)險(xiǎn)等級(jí)的隱患,平臺(tái)將分別采取訂單取消、IVR外呼、TTS語音等手段進(jìn)行干預(yù)提醒。對(duì)在平臺(tái)發(fā)生過高風(fēng)險(xiǎn)隱患的司機(jī)、用戶,可以有針對(duì)性的管控措施,同時(shí)會(huì)進(jìn)行相關(guān)類目的專項(xiàng)安全教育。
通過整體提升貨運(yùn)平臺(tái)對(duì)運(yùn)輸貨物識(shí)別能力,加強(qiáng)運(yùn)輸過程監(jiān)控,以此加強(qiáng)司機(jī)、用戶群體的運(yùn)輸安全意識(shí),減少此類安全事故發(fā)生?! ?/p>
1、行前識(shí)別
貨箱載人、運(yùn)輸違禁品/危險(xiǎn)品等屬于運(yùn)輸物品不合規(guī)的常見高危場(chǎng)景,其中大部分用戶、司機(jī)群體出于對(duì)交通運(yùn)輸規(guī)范和貨物類別的認(rèn)識(shí)不清,并無主觀意愿刻意規(guī)避平臺(tái)監(jiān)控。此類安全問題通過多維度AI技術(shù)可在運(yùn)輸開始前、甚至訂單撮合前被攔截識(shí)別,從而大大降低事故發(fā)生率。
用戶下單階段,利用NLP智能算法提取訂單備注等文本內(nèi)容,同時(shí)利用CV智能算法掃描用戶上傳貨物圖片,識(shí)別存在運(yùn)輸高風(fēng)險(xiǎn)貨物需求的訂單并進(jìn)行干預(yù)。
若訂單信息中并無高風(fēng)險(xiǎn)貨物信息,則訂單進(jìn)入司機(jī)接單階段。此時(shí)司機(jī)與用戶通過IM、電話進(jìn)行需求溝通,隱私號(hào)錄音及IM聊天內(nèi)容通常包含運(yùn)輸貨物信息。利用ASR技術(shù)轉(zhuǎn)錄,結(jié)合NLP智能算法可以識(shí)別出運(yùn)輸高風(fēng)險(xiǎn)貨物需求的訂單并進(jìn)行干預(yù)。
根據(jù)平臺(tái)要求,司機(jī)裝貨完成時(shí)需要上傳裝貨圖,利用CV智能算法可以識(shí)別貨箱中是否包含各類風(fēng)險(xiǎn)貨物,并進(jìn)行干預(yù)。
2、行中識(shí)別
運(yùn)輸過程中的安全隱患主要分人和物品,場(chǎng)景分別發(fā)生于貨箱區(qū)域和駕駛室。通過識(shí)別此階段的各種潛在安全隱患,平臺(tái)可以及時(shí)有效地提醒司機(jī)和乘客。
3、干預(yù)
平臺(tái)識(shí)別出安全風(fēng)險(xiǎn)訂單后,會(huì)結(jié)合不同風(fēng)險(xiǎn)等級(jí)進(jìn)行干預(yù)。對(duì)于高風(fēng)險(xiǎn)違禁品訂單有人工介入進(jìn)行復(fù)核確認(rèn),如核實(shí)無誤則同時(shí)致電司機(jī)與用戶,并引導(dǎo)司機(jī)進(jìn)行無責(zé)取消訂單。對(duì)于其他安全隱患,可通過IVR外呼、TTS語音、實(shí)時(shí)預(yù)警等手段進(jìn)行提醒,必要時(shí)與警方聯(lián)動(dòng)。
4、治理
平臺(tái)將針對(duì)被攔截的下單用戶、接單司機(jī)定向推送專項(xiàng)運(yùn)輸安全教育培訓(xùn)。同時(shí)根據(jù)累計(jì)下單被攔截次數(shù)、安全風(fēng)險(xiǎn)等級(jí)采取不同懲罰、封號(hào)措施。
5、算法
利用深度學(xué)習(xí)圖像技術(shù),通過CNN卷積提取圖像及視頻幀特征圖,結(jié)合空間attention利用多分支網(wǎng)絡(luò)結(jié)構(gòu)定位待識(shí)別目標(biāo)區(qū)域和類別。利用ASR技術(shù)對(duì)語音進(jìn)行文本轉(zhuǎn)錄,結(jié)合深度學(xué)習(xí)文本分類和NER技術(shù)識(shí)別風(fēng)險(xiǎn)訂單。
通過算法識(shí)別的相關(guān)回流數(shù)據(jù),并結(jié)合線上人工審核結(jié)果打標(biāo),不斷擴(kuò)充數(shù)據(jù)集,持續(xù)迭代算法模型效果,從而完成數(shù)據(jù)、標(biāo)注、模型訓(xùn)練閉環(huán)操作。
下一章我們將以“裝貨完成階段”的“裝貨圖識(shí)別算法”為例,來介紹我們?cè)谪涍\(yùn)安全防控領(lǐng)域的嘗試與思考。
三、相關(guān)圖像算法舉例
1、問題與挑戰(zhàn)
業(yè)務(wù)上,圖像算法需要從司機(jī)拍攝的裝貨完成圖中識(shí)別出是否為高風(fēng)險(xiǎn)訂單,例如貨箱載人、運(yùn)輸易燃易爆物品等十幾種以上違規(guī)類別。這在技術(shù)上具有不小的挑戰(zhàn):
(1) 數(shù)據(jù)呈現(xiàn)長(zhǎng)尾分布。風(fēng)險(xiǎn)訂單占全量訂單的比例極小,有的甚至不足0.1%。
(2) 裝貨圖場(chǎng)景極其復(fù)雜。識(shí)別目標(biāo)遮擋嚴(yán)重,且位置、角度、尺寸不一。
(3) 目標(biāo)類內(nèi)距離大、類間距離小。目標(biāo)樣式多變,且相似物體干擾嚴(yán)重。
(4) 司機(jī)不按要求拍照。具體有:低質(zhì)量、非裝貨圖、車外目標(biāo)干擾等。
針對(duì)這些問題我們做了很多工作和嘗試,部分效果如下:
1.1、貨箱載人
貨箱內(nèi)人體具有形態(tài)多樣、尺寸差異大、肢體遮擋嚴(yán)重、人群過于密集等特點(diǎn),很容易漏檢。同時(shí)包裝箱表面廣告人體、車外人體干擾很容易造成貨箱載人誤檢測(cè)。
目前算法可以保證各類貨箱人體的召回,同時(shí)過濾絕大部分“廣告人體”、“車外透過車窗的人體”和“部分裝貨中人體”干擾圖。
1.2、燃?xì)馄?/p>
氣瓶氣罐同貨箱載人類似,容易受遮擋、角度等原因影響,從而導(dǎo)致漏檢。同時(shí)容易同圓柱體、圓形物體等相似物干擾。目前算法可以在保證召回的前提下,大大降低誤報(bào)?! ?/p>
接下來本文將針對(duì)部分技術(shù)難點(diǎn)做詳細(xì)介紹。
2、長(zhǎng)尾問題
現(xiàn)實(shí)場(chǎng)景中算法模型面臨的數(shù)據(jù)分布往往并不均衡,不同類別之間的數(shù)據(jù)量差距可達(dá)2、3個(gè)量級(jí)甚至更大。而我們知道深度模型在訓(xùn)練時(shí)需要大量的數(shù)據(jù),類別間數(shù)據(jù)量分布的極度不均會(huì)給模型訓(xùn)練帶來麻煩?! ?/p>
圍繞長(zhǎng)尾問題常用的解決方法主要有:
(1) Re-sampling和Re-weighting。根據(jù)訓(xùn)練集不同類別的數(shù)量占比,對(duì)數(shù)量多的類進(jìn)行欠采樣或loss低權(quán)重、數(shù)量少的類進(jìn)行過采樣或loss高權(quán)重。
(2) Data augmentation。增加小樣本類別的合成數(shù)量。
(3) Decoupled training method。兩階段訓(xùn)練,先進(jìn)行表征學(xué)習(xí),再finetune分類頭。
(4) End-to-end訓(xùn)練,在表征學(xué)習(xí)和分類頭finetune之間尋找平衡。如:BBN、Equalization loss等。
BBN結(jié)構(gòu)
實(shí)踐中,我們借鑒了上述多種方案,其中Re-sampling和Re-weighting表現(xiàn)一般,其他方案均有不錯(cuò)的表現(xiàn)。
此外長(zhǎng)尾問題的評(píng)估也是一個(gè)問題。常規(guī)的Accuracy無法準(zhǔn)確衡量模型對(duì)尾部類的預(yù)測(cè)效果,precision和recall顯然更加合適。然而recall相同時(shí),數(shù)據(jù)越不均衡,precision越低。AP和AUC是不錯(cuò)的評(píng)估指標(biāo),它們結(jié)合了recall、precision和FPR。我們實(shí)際衡量模型效果時(shí)會(huì)綜合考慮AUC、AP、precision、recall等指標(biāo)。
3、小樣本
有監(jiān)督模型訓(xùn)練需要大量高質(zhì)量標(biāo)注樣本,如果全部人工標(biāo)注,會(huì)帶來標(biāo)注人力成本高、標(biāo)注周期長(zhǎng)的問題。實(shí)踐中我們主要采取了模型預(yù)標(biāo)注+self-training的方式,具體步驟如下:
(1) 我們首先利用人工標(biāo)注一批高質(zhì)量數(shù)據(jù),并訓(xùn)練teacher模型。
(2) 利用初始模型預(yù)測(cè)未標(biāo)注數(shù)據(jù),人工基于預(yù)標(biāo)注的數(shù)據(jù)進(jìn)行調(diào)整標(biāo)簽,加快標(biāo)注速度。
(3) 采用self-training方式,利用teacher模型生成大量偽標(biāo)簽,并保留高置信度標(biāo)簽數(shù)據(jù)。同時(shí)結(jié)合步驟1、2中的有標(biāo)簽數(shù)據(jù)一起訓(xùn)練,得到student模型。
(4) 選擇表現(xiàn)優(yōu)秀的student模型替換初始的teacher模型,重復(fù)步驟1~3。
4、細(xì)粒度
從AlexNet模型問世以來,深度學(xué)習(xí)在圖像分類任務(wù)中發(fā)展迅速。對(duì)于類間距離大的數(shù)據(jù)集,通常深度模型都會(huì)有不錯(cuò)的表現(xiàn)。而面對(duì)下圖這種類間距離小、類內(nèi)距離大的數(shù)據(jù)集,方案則相對(duì)復(fù)雜一些?! ?/p>
上述問題稱為Fine-grained Image Classification,解決方法通常有以下幾類:
在裝貨圖任務(wù)中因?yàn)楹茈y定義不同類之間共同的局部區(qū)域,我們最終選擇利用attention技術(shù)和metric learning技術(shù)來區(qū)分相似物體,相對(duì)于通用分類方法,AUC可以提升5~8個(gè)點(diǎn)。
5、多級(jí)過濾
有時(shí)候待識(shí)別圖片并不符合業(yè)務(wù)規(guī)范,甚至圖片中的背景區(qū)域也對(duì)算法識(shí)別結(jié)果造成干擾。例如:圖片模糊過曝、未上傳裝貨圖、車廂外違禁品干擾等。解決方案也比較常規(guī),利用多級(jí)過濾,逐步過濾掉不符合要求、干擾的圖片和局部信息。過濾流程如下:
四、總結(jié)
互聯(lián)網(wǎng)貨運(yùn)領(lǐng)域因其業(yè)務(wù)場(chǎng)景特殊性,導(dǎo)致貨運(yùn)安全面臨巨大挑戰(zhàn)。在過去幾年里,我們利用AI技術(shù)在貨運(yùn)安全方面做出了不錯(cuò)的成績(jī),團(tuán)隊(duì)在技術(shù)上也有了一定的積累。
然而貨運(yùn)安全防控場(chǎng)景復(fù)雜,對(duì)圖像、文本、語音等相關(guān)AI算法有很高的要求,因此,AI算法能力仍然有很大的提升空間。未來我們將繼續(xù)探索和優(yōu)化,為搭建全面穩(wěn)健的智能安全防控體系而努力。