安吉智能是上汽安吉物流旗下專注智能物流板塊的高新技術企業(yè),根據(jù)客戶需求提供智能解決方案系統(tǒng)集成,其研發(fā)的安眸智能視覺管理系統(tǒng)對港口、園區(qū)、倉庫等物流業(yè)務場景中的核心元素“人員,貨物,設備”進行精準識別并提供安全保障。在智慧物流行業(yè)前沿,安吉智能正在利用人工智能技術將海量的監(jiān)控數(shù)據(jù)運用于行為識別、重點安防、區(qū)域監(jiān)測等場景。面對多場景下爆發(fā)式增長的海量數(shù)據(jù),安吉智能選擇格物鈦TensorBay作為安眸系統(tǒng)研發(fā)中的AI基礎設施組件之一,保障算法團隊在模型迭代中的高質(zhì)量數(shù)據(jù)供給,讓AI創(chuàng)新更高效。
安吉智能算法負責人說:“我們的目標是通過引入標準化的數(shù)據(jù)管理工具,讓算法團隊能夠以最簡單快速的方式對海量數(shù)據(jù)集進行訪問與操作。很高興TensorBay這款優(yōu)秀的產(chǎn)品能夠進入市場,不同于傳統(tǒng)的本地文件系統(tǒng)管理模式,它提供了一個全新的云端數(shù)據(jù)管理解決方案,讓我們看到了AI非結構化數(shù)據(jù)管理的全新未來!
以數(shù)據(jù)為中心驅(qū)動AI創(chuàng)新
今年MLOps形成了一股AI開發(fā)新趨勢吹進全球,隨之而來的是“以模型為中心”還是“以數(shù)據(jù)為中心”的爭議熱度不減。幾年前,機器學習社區(qū)更強調(diào)構建模型、調(diào)整超參數(shù)或選擇正確架構,來提升AI模型效果。人工智能和機器學習領域國際最權威學者之一吳恩達上半年發(fā)布了最新課程《MLOps:從以模型為中心到以數(shù)據(jù)為中心的AI》,他認為“以數(shù)據(jù)為中心”的時代已然來臨,人們應該以數(shù)據(jù)為中心來開發(fā)機器學習系統(tǒng)。
對于規(guī)模精簡的算法團隊而言,以數(shù)據(jù)為中心的策略相比于以模型為中心的策略更具可操作性。一個機器學習項目的生命周期會經(jīng)歷“定義項目-收集數(shù)據(jù)-訓練模型-模型部署生產(chǎn)”四個階段,從數(shù)據(jù)收集到模型部署都會持續(xù)往復迭代。數(shù)據(jù)好比AI的食物,機器學習需要定制化的數(shù)據(jù)集持續(xù)投喂到模型訓練中。決定模型效果的影響因素有兩個:數(shù)據(jù)和算法,F(xiàn)實中的數(shù)據(jù)集往往都是有噪聲的,對于有噪聲的數(shù)據(jù),一種是修改算法,提出能處理噪聲、有泛化能力的算法(顯然難度較大);還有一種修改數(shù)據(jù)集,提升數(shù)據(jù)集的質(zhì)量。用工具鏈和系統(tǒng)化的方法來提升數(shù)據(jù)質(zhì)量,通過不斷地喂給數(shù)據(jù),讓模型保持輕微調(diào)整,這會使模型的效果批量提升成為可能。
安吉智能正在為汽車制造、機械加工、電子電商、煙草醫(yī)藥、日化服裝等各領域客戶提供一體化智能物流解決方案,為了實現(xiàn)供應鏈過程的數(shù)字智能化創(chuàng)新,在算法負責人看來,通過調(diào)整數(shù)據(jù)集來實現(xiàn)模型快速迭代,將極大改善算法團隊工作效率。
激發(fā)物流行業(yè)新動能
據(jù)安吉智能算法團隊負責人介紹,2020年我國物流行業(yè)占整體GDP的14.7%,物流行業(yè)數(shù)字化轉(zhuǎn)型蘊含巨大潛力,且有大量的數(shù)據(jù)價值待挖掘,這是安吉開發(fā)安眸視覺管理系統(tǒng)的雄心所在。
利用大數(shù)據(jù)和人工智能等前沿技術為傳統(tǒng)行業(yè)賦能,一個不容忽視的現(xiàn)象是視頻監(jiān)控和傳感器等積累的非結構化數(shù)據(jù)呈指數(shù)級增長,如果缺少與之匹配的工具鏈和工作流程,將會對數(shù)據(jù)驅(qū)動的AI產(chǎn)品開發(fā)創(chuàng)新帶來挑戰(zhàn)。格物鈦與安吉智能合作調(diào)研了目前行業(yè)內(nèi)在AI開發(fā)流程中的痛點與挑戰(zhàn),并梳理出數(shù)據(jù)管理上的核心訴求:
1.標注數(shù)據(jù)格式、標簽的一致性:方便靈活地根據(jù)特性抽取合并數(shù)據(jù);
2.統(tǒng)一的數(shù)據(jù)存儲路徑:方便搜索和獲取從傳感器端采集的全量數(shù)據(jù),并覆蓋盡可能多的場景和稀缺的數(shù)據(jù)樣本;
3.數(shù)據(jù)版本可追溯性:記錄并比較訓練過程中數(shù)據(jù)集的版本變化,以用于誤差分析和反復迭代。
安眸智能視覺管理系統(tǒng)基于自研深度學習AI算法引擎,形成數(shù)據(jù)采集標注、深度學習算法迭代、視頻數(shù)據(jù)結構化、模型部署自化,實現(xiàn)AI數(shù)據(jù)閉環(huán),為港口、園區(qū)、倉庫等物流業(yè)務中的核心元素“人員、貨物、設備”提供安全保障。
格物鈦TensorBay是一款面向AI開發(fā)者的非結構化數(shù)據(jù)管理工具,為AI開發(fā)者和團隊提供統(tǒng)一的數(shù)據(jù)云端托管、版本管理、在線可視化和高效協(xié)同等功能,專注解決AI開發(fā)中的數(shù)據(jù)痛點。TensorBay為安吉智能提供了如下解決方案,包括:
1、讓AI開發(fā)更便捷——在云端統(tǒng)一托管數(shù)據(jù)
通過授權云存儲的方式,TensorBay可以全面托管安吉智能的原始數(shù)據(jù),標注數(shù)據(jù)與Meta信息。個人和團隊的工作區(qū)可以輕松切換,權限管理功能也在保障數(shù)據(jù)訪問安全的前提下,促進跨團隊協(xié)作,實現(xiàn)數(shù)據(jù)訪問民主化。
安吉智能團隊在研發(fā)過程中需要運用同一批原數(shù)據(jù)集來進行不同的訓練嘗試。借助TensorBay平臺,團隊成員無需復制數(shù)據(jù),就可以在不影響原有數(shù)據(jù)的情況下生成fork數(shù)據(jù)集,并根據(jù)具體的模型研發(fā)目標靈活地對數(shù)據(jù)進行調(diào)整。
2、所見即所得——數(shù)據(jù)集分布實時洞察和數(shù)據(jù)版本追溯
安吉智能算法團隊在研發(fā)過程中,針對不同客戶的物流監(jiān)控場景,需要定制化準備數(shù)據(jù)集進行模型訓練。通過TensorBay的版本管理功能,安吉智能可以快速增加新數(shù)據(jù)和迭代新版本,清晰記錄和追溯歷史版本過程,精細化比較各領域客戶數(shù)據(jù)和標注的差異,大幅提升版本迭代效率。
通常標注數(shù)據(jù)在質(zhì)檢之后會被直接灌入模型用于訓練,但如果標注數(shù)據(jù)存在錯誤(如漏標、錯標等),會對模型的識別能力產(chǎn)生很大干擾。TensorBay的可視化組件讓算法工程師既能從宏觀層面了解數(shù)據(jù)集的特征分布,又能從微觀層面查看單個文件和標注數(shù)據(jù)。這一功能可以讓算法工程師在將數(shù)據(jù)用于訓練前,直接查看標注結果,有效避免了因數(shù)據(jù)質(zhì)量不達標,而產(chǎn)生的模型調(diào)試和標注返工損耗。
3、Model is Temporary, Pipelines are Forever
機器學習的工作流程優(yōu)化和自動化,所帶來的增效復利效應將會更深遠影響產(chǎn)品進程。未來安吉智能將繼續(xù)選擇TensorBay與其現(xiàn)有AI工作流程實現(xiàn)更深層次的融合。包括:
1)TensorBay的Action功能,將安眸智能攝像頭的數(shù)據(jù)收集、篩選、觸發(fā)任務、數(shù)據(jù)上傳流程自動化。改變原本由人工把數(shù)據(jù)上傳至網(wǎng)盤再到算法團隊下載的方式,實現(xiàn)數(shù)據(jù)自動上傳至云端數(shù)據(jù)集進行管理。
2)TensorBay的AI數(shù)據(jù)管理周期還可擴展至標數(shù)據(jù)標注環(huán)節(jié)。標注結果能夠直接導入云端數(shù)據(jù)管理平臺進行進一步數(shù)據(jù)處理,并能實現(xiàn)標注結果實時修改。這讓AI生產(chǎn)環(huán)境數(shù)據(jù)的實時反饋、追溯和優(yōu)化成為可能。
更好的數(shù)據(jù)帶來更優(yōu)的模型性能。格物鈦認為整個AI行業(yè)正在由以模型為中心的開發(fā)模式,向著以數(shù)據(jù)為中心的開發(fā)模式發(fā)展。通過優(yōu)化現(xiàn)有的AI項目工作流程來提升數(shù)據(jù)質(zhì)量,從而加速AI產(chǎn)品的迭代,這一創(chuàng)新未來將在更多智慧物流場景中產(chǎn)生長遠價值。
安吉智能算法負責人高度評價:“格物鈦的機器學習數(shù)據(jù)平臺TensorBay是我們AI開發(fā)流程中的關鍵部分,其強大的數(shù)據(jù)管理平臺能夠和我們的開發(fā)流程無縫銜接,為我們的數(shù)據(jù)準備過程提供了非常便利的功能和開發(fā)者工具。與格物鈦的產(chǎn)品團隊的密切合作,幫助我們安吉智能可以更加順利地實現(xiàn)安眸產(chǎn)品的研發(fā)目標!