科技大時代,引人入勝。視界千變萬化,視界之大,盡收眼底。回歸安防的本初,對圖像無止境的追求與打磨,才形成了現(xiàn)今以智能視頻為核的安防應用大生態(tài)。
有偏差的世界與視界
百態(tài)安防,各色精彩!之于2023歲末之際,之于圖像,回首初心、細看當下、瞭望未來。
人眼看到的世界與機器讀出來得視界,有所異同。
世界即視界,人眼看視界,或許都一樣。
人眼有著很強觀察能力,能夠在復雜及變化的環(huán)境中識別目標,同時由大腦賦予了最高級的智能分析能力,可以運用邏輯分析和推理能力去識別變化目標。
為此,長久以來,在監(jiān)控室里死盯屏幕,成了監(jiān)控人員的日常,這也是視頻監(jiān)控時代最為傳統(tǒng)與普遍的工作方式。但,人眼看到的視界,就是真實視界嗎?
人眼看視界,或許真不一樣。
人非機器,先天性有所短板,帶有主觀性,容易心里誤導,產(chǎn)生誤判。
與文字、聲音相比,視頻承載了更多信息量,而要從大量豐富信息當中去讀取有用數(shù)據(jù),這是非常繁瑣復雜的工作,這種被動應對方式,并不能主動預防,并受制于人員數(shù)量和能力,比如:長時間易疲勞、錯看漏看、看得不及時。此外,在顯示終端方面也因各種原因受制,你看到的視界,不一定為實。
故而,有偏差的世界與視界,就需要圖像處理、優(yōu)化、調教,甚至是多維度的時空融合,來讓圖像盡可能的全域性無所不在與無所不能。
機器視覺的“技術雛形”
既然回首過去,對于圖像,行業(yè)最開始做法是不斷為圖像做加法,一堆的后處理技術進行科研突破,最為明顯體現(xiàn)在視頻圖像處理技術,簡而言之就是用計算機對視頻數(shù)字圖像進行處理,其本質是一種信號處理過程,而且是離散信號處理。
這其實就是機器視覺的最初技術形態(tài),雖功能有限,但底子還在。看圖像處理技術應用價值,有幾個方面:
其一,提高圖像的視感質量,如進行圖像的亮度、彩色變換,增強、抑制某些成分,對圖像進行幾何變換等,以改善視頻圖像的質量。
其二,提取視頻圖像中所包含的某些特征或特殊信息,這些被提取的特征或信息往往為計算機分析圖像提供便利。
其三,視頻圖像增強與復原。圖像增強的目的是將圖像轉換為更適合人和機器的分析的形式。
其四,圖像的分析。從圖像中抽取某些有用的度量、數(shù)據(jù)和信息,以的到某種數(shù)值結果。
其五,能使圖像再現(xiàn)性。圖像在數(shù)字化時準確地表現(xiàn)了原稿,則數(shù)字圖像處理過程始終能保持圖像的再現(xiàn)。
其六,靈活多變的處理功能。把監(jiān)控畫面分割為任意大小的二維數(shù)組,這意味著圖像的數(shù)字化精度可以達到滿足任一應用需求。
其七,適用面寬。不論是來自哪個行業(yè)的信息源的圖像只要被變換為數(shù)字編碼形式后,均是用二維數(shù)組表示的灰度圖像組合而成。
其八,靈活性高。即凡是可以用數(shù)學公式或邏輯關系來表達的一切運算均可用數(shù)字圖像處理實現(xiàn)。
依據(jù)八大特性,圖像處理研究內容就分三大板塊:圖像壓縮;增強和復原;匹配、描述和識別。
機器讀懂視界的行業(yè)邏輯
時代在變革,技術在演進,與之相悖的,終將漸趨式微,這同樣適用于圖像處理技術。如樓宇對講到智能家居,防盜報警到AIOT一樣,圖像處理到機器視覺,也只是時代產(chǎn)物,底色未變。
過去圖像處理在“后側”,而機器視覺更多“向前”。
在當下,智能攝像機本身作為前端產(chǎn)品,芯片、鏡頭、焦距、補光、外殼等一系列硬件工程是基礎。能將智能算法跟場景關聯(lián)后,根據(jù)算法需求界定一個范圍,盡量做到場景變化,但硬件減少變化,用軟件來做調節(jié)。
全天候的多維融合全域感知,這是智能攝像機對于圖像追求的另一個技術維度,視頻、音頻、氣味、生物特征等技術的發(fā)展和成熟,全面掌控防控場景和目標的完整信息成為可能,在安防應用中越來越多的部署更多類別的感知設備,用于從更多維度采集目標信息,包括目標的各種要素、活動軌跡以及關聯(lián)信息等,從而形成一個動態(tài)感知體系,實現(xiàn)防控工作的“無所不在、無所不知”目標。這一點從最近幾年的聲光劃界攝像機、光譜水質攝像機、雷視合一攝像機、氣象觀測攝像機、環(huán)保攝像機等一些列場景定義類產(chǎn)品,無一不在說明,圖像處理的多面與多角度,來適配多場景的深度。
當然,攝像機一個單品,不可能一肩挑起這時代與這視界,形成成熟與高價值的解決方案閉環(huán),是必然。
在追求極致更好圖像的行業(yè)進程中,圖像的廣度在縮小,更多的是在深度的追求。通用型、一招鮮吃遍天的攝像機已經(jīng)不復存在,這還是源于用戶需求驅動。
在2023深圳安博會參觀走訪期間,記者了解到很多底層用戶或中間生態(tài)位集成商大多表示,現(xiàn)有智能視頻方案過于通用,不夠適配行業(yè)具體場景。為此,此屆安博會最大不同之一就是硬件展示減少,方案展示居多的原因。
機器視覺解決方案需要與行業(yè)自身長期運轉而沉淀下來的商業(yè)邏輯與行業(yè)經(jīng)驗相融合。除了成熟的技術能力外,該解決方案對行業(yè)具體場景的全方位適配必不可少。同樣,機器視覺解決方案應用門檻高,企業(yè)IT架構/基礎設施適配難度高。對于很多企業(yè)來說,算法訓練相對容易實現(xiàn),但如何與實時推理結合起來部署到實際應用場景,卻是一個難題。為此,大模型的出現(xiàn),或者類似算法商城、算法工廠、AI自動工具等,就開辟了另一個戰(zhàn)場,另一個對圖像追求無休止的行業(yè)邏輯。
圖像的未來之愿
對于圖像創(chuàng)新,行業(yè)心之所向。沉于過去,不能打破現(xiàn)狀,之于圖像的未來,本當歸于平靜,來看未來之愿與應用模樣。
其一,大視界時代,未來數(shù)據(jù)圖像技術強調高清晰度、高速傳輸、實時圖像處理、三維成像或多維成像、智能化、自動化等方向發(fā)展。
其二,智能化方面,力爭使計算機識別和理解能夠按照人的認識和思維方式工作,能夠考慮到主觀概率和非邏輯思維。這里有一點需要指出,AI在智能化方面可以做圖像數(shù)據(jù)與內容的提取與分析,但是并不能在視頻圖像處理方面做文章。
其三,未來圖像技術強調操作、運用的方便性,圖像處理功能的集中化趨勢是必然會存在的。所以,最近幾年硬件芯片廠家不斷將諸多AI功能固化在芯片上,形成一個SOC級的獨立小系統(tǒng)。
有偏差的視界,在以智能路為路徑,盡可能形成你是我的眼,你見如我見;不止所見,還能關聯(lián)其他,以圖像為圓點,來畫視界。