
多模態(tài)大模型
為安防行業(yè)帶來重大技術(shù)革新
基于觀瀾大模型技術(shù)體系
海康威視將大參數(shù)量、大樣本量的
圖文多模態(tài)大模型
與嵌入式智能硬件深度融合
發(fā)布多模態(tài)大模型文搜存儲(chǔ)系列產(chǎn)品
——文搜NVR、文搜CVR
??低曃乃汛鎯?chǔ)系列產(chǎn)品
利用多模態(tài)大模型
實(shí)現(xiàn)自然語言與視頻圖像的
跨模態(tài)信息檢索應(yīng)用
輸入一句話、一個(gè)詞就能秒級(jí)檢索目標(biāo)圖像
目標(biāo)檢索變得更廣、更準(zhǔn)、更快、更易
讓安防錄像回溯不再局限于
傳統(tǒng)時(shí)空、報(bào)警等檢索方式
大幅提升目標(biāo)和事件的查找效率
讓安防業(yè)務(wù)管理更高效、更智能
01
基于多模態(tài)大模型,文搜存儲(chǔ)產(chǎn)品實(shí)現(xiàn)了海量視圖數(shù)據(jù)的開放式語義檢索,不再局限于傳統(tǒng)的錄像回放及固定屬性查找。
根據(jù)需求,在搜索框內(nèi)輸入文字描述(一句話或一個(gè)詞等),例如輸入“打電話”、“白色面包車”、 “騎電瓶車未戴頭盔”、“自行車”、“小推車”、“小狗”等開放文字語義描述,即可搜索出相關(guān)目標(biāo)。
搜索范圍廣,既支持人、機(jī)動(dòng)車、非機(jī)動(dòng)車等安防場(chǎng)景的高頻目標(biāo)搜索 ,也廣泛支持特定物品、異常行為等特征搜索。
搜得廣開放式語義檢索,搜人搜車搜物

02
利用多模態(tài)大模型技術(shù),提取圖像與擬搜索語言的特征,并將圖像特征與搜索語言中關(guān)鍵語義特征對(duì)齊,實(shí)現(xiàn)高精度搜索。
如能夠理解 “穿紅色衣服”、“黑色背包”、“戴帽子”、“拉桿箱”、“棍棒”等對(duì)目標(biāo)的文字描述,精準(zhǔn)搜索出相關(guān)目標(biāo)。針對(duì)常見目標(biāo)的檢索,TOP20命中率可達(dá)90%以上。(數(shù)據(jù)來自海康威視實(shí)驗(yàn)室)
搜得準(zhǔn)文字與圖像精準(zhǔn)匹配
03
采用數(shù)據(jù)三級(jí)緩存、均衡抽樣、異步加載等創(chuàng)新技術(shù),實(shí)現(xiàn)文本搜索結(jié)果的秒級(jí)顯示。
極簡操作,輕松搜索
除了手動(dòng)輸入文本進(jìn)行檢索外,貼合用戶常用情景,增設(shè)找人、找機(jī)動(dòng)車、找非機(jī)動(dòng)車、找寵物、找常用物品等快捷搜索入口,還支持用戶自定義編輯搜索慣語,讓操作更簡單,使用更便捷。
搜得快
秒級(jí)出搜索結(jié)果
搜得易
文搜存儲(chǔ)系列產(chǎn)品基于海康威視觀瀾大模型技術(shù)體系,實(shí)現(xiàn)智能化應(yīng)用的變革。觀瀾大模型中的圖文多模態(tài)大模型,在大語言模型的基礎(chǔ)上,使用圖文多模態(tài)數(shù)據(jù)進(jìn)行持續(xù)預(yù)訓(xùn)練,獲得視覺感知和視覺認(rèn)知能力。受益于圖文多模態(tài)大模型強(qiáng)大的感知能力和跨任務(wù)泛化能力,視覺智能業(yè)務(wù)的應(yīng)用門檻被顯著降低。
文搜存儲(chǔ)系列產(chǎn)品是多模態(tài)大模型算法與嵌入式智能硬件結(jié)合的應(yīng)用突破,通過面向平臺(tái)的模型設(shè)計(jì)、大小模型蒸餾、跨層混合精度量化等大模型部署技術(shù)與嵌入式智能硬件創(chuàng)新設(shè)計(jì),實(shí)現(xiàn)多模態(tài)大模型在輕量化嵌入式硬件平臺(tái)上落地,讓多模態(tài)大模型技術(shù)實(shí)現(xiàn)普惠應(yīng)用,使更多行業(yè)和用戶享受大模型帶來的智能與便捷。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“機(jī)電號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of JDZJ Hao, which is a social media platform and only provides information storage services.