機器視覺的應用及主要瓶頸_廣東J9九游会中国股份有限公司

行業新聞

機器視覺的應用及主要瓶頸

日期：2017-10-25 來源：J9九游会中国

一台機器為什麽能看到你？因為它有了自己的視覺。機器視覺技術是一門涉及人工智能、神經生物學、心理物理學、計算機科學、圖像處理、模式識別等諸多領域的交叉學科。機器視覺主要用計算機來模擬人的視覺功能，從客觀事物的圖像中提取信息，進行處理並加以理解，最終用於實際檢測、測量和控製，技術最大的特點是速度快、信息量大、功能多。

機器視覺的應用及主要瓶頸_sdyinshuo.com

　　機器視覺主要用計算機來模擬人的視覺功能，但並不僅僅是人眼的簡單延伸，更重要的是具有人腦的一部分功能一一從客觀事物的圖像中提取信息，進行處理並加以理解，最終用於實際檢測、測量和控製。

　　一個典型的工業機器視覺應用係統，包括數字圖像處理技術、機械工程技術、控製技術、光源照明技術、光學成像技術、傳感器技術、模擬與數字視頻技術、計算機軟硬件技術、人機接口技術等。

　　全球應用情況

　　在國外，機器視覺的應用普及主要體現在半導體及電子行業，其中大概40%-50%都集中在半導體行業。機器視覺係統還在質量檢測的各個方麵已經得到了廣泛的應用，並且其產品在應用中占據著舉足輕重的地位。除此之外，機器視覺還用於其他各個領域。

　　而在中國，視覺技術的應用開始於90年代，因為行業本身就屬於新興的領域，再加之機器視覺產品技術的普及不夠，導致以上各行業的應用幾乎空白。目前國內機器視覺大多為國外品牌。國內大多機器視覺公司基本上是靠代理國外各種機器視覺品牌起家，隨著機器視覺的不斷應用，公司規模慢慢做大，技術上已經逐漸成熟。

　　在行業應用方麵，主要有製藥、包裝、電子、汽車製造、半導體、紡織、煙草、交通、物流等行業，用機器視覺技術取代人工，可以提供生產效率和產品質量。例如在物流行業，可以使用機器視覺技術進行快遞的分揀分類，不會出現大多快遞公司人工進行分揀，減少物品的損壞率，可以提高分揀效率，減少人工勞動。

　　主要問題和發展瓶頸

　　機器視覺可以看作是與人工智能和模式識別密切相關的一個子學科或子領域。限製機器視覺發展的瓶頸是多方麵的，其中最重要的可以歸結為三個方麵：計算能力不足、認知理論未明以及精確識別與模糊特征之間的自相矛盾。

　　1.機器視覺麵向的研究對象主要是圖像和視頻，其特點是數據量龐大、冗餘信息多、特征空間維度高，同時考慮到真正的機器視覺麵對的對象和問題的多樣性，單一的簡單特征提取算法（如顏色、空間朝向與頻率、邊界形狀等等）難以滿足算法對普適性的要求，因此在設計普適性的特征提取算法時對計算能力和存儲速度的要求是十分巨大的，這就造成了開發成本的大幅度提高。

　　2. 如何讓機器認知這個世界？這一問題目前沒有成熟的答案，早期的人工智能理論發展經曆了符號主義學派、行為主義學派、連接主義學派等一係列的發展但都沒有找到令人滿意的答案，目前較新的思想認為應該從分析、了解和模擬人類大腦的信息處理功能去構建智能機器視覺係統，但神經科學的發展目前隻能做到了解和模擬大腦的一個局部，而不是整體（當然計算能力限製也是原因之一）。事實上，我們對人是如何對一個目標或場景進行認知的這一問題仍停留在定性描述而非定量描述上。

　　3. 機器視覺係統經常被人詬病的問題之一就是準確性。以十年前如火如荼的人臉識別算法為例，盡管一係列看似優秀的算法不斷問世，但目前為止在非指定大規模樣本庫下進行人臉識別的準確率仍然無法滿足實際應用的需求，因此無法取代指紋或虹膜等近距接觸式生物特征識別方法。這一問題的出現並非偶然。因為目標越精細，越複雜，信息越大，則其模糊性和不確定性也越強。人類之所以能夠較好的對人臉進行識別，其實也是以犧牲一定的準確性為代價的。而機器視覺在做的事情一方麵想要借鑒人腦或人眼係統的靈感去處理複雜而龐大的信息流，另一方麵又想摒除人腦在模式識別方麵存在的精確性不足的缺陷。這顯然是一種一廂情願的做法。

　　綜合以上三點，機器視覺的發展在短期內難有重大突破，當前的實用技術仍然還是會集中在特定性任務或特定性目標的識別算法的開發上。

　　關於視覺測量研究：

　　（1）機器視覺測量的可靠性。相比與其他測量手段，視覺的最大優點就是可以快速獲得三維信息，一張或幾張照片就可以重建出被測物體的三維特征，進而實現測量。但正如大家所說，隻要測量條件、環境、被測物表麵特性等改變，有時甚至時稍加改變，結果則大不一樣，測量重複性和精度更無從談起。這也是目前機器視覺測量尺寸、位姿等參數時比較突出的問題，特別是在一些強光幹擾、溫度場變化、光照條件變化的應用場合這個問題尤為突出。因此，視覺測量的環境適應性問題解決難度很大，無法找到普適性的方法，隻能針對具體問題，研究相應光照、特征提取、匹配、重建、標定等具體方法。

　　（2）測量精度問題。精度是測量係統的重要指標。視覺測量精度依賴於相機分辨率、視場大小、圖像處理算法等等。CCD和CMOS的製造工藝已取得長足進步，目前6000*4000pixel的分辨率已經成為穩定商品。而采用壓電驅動芯片做微米級移動進行像素細分的方法和設備已經商品化，號稱分辨率可近20000*14000pixel。在軟件方麵，各類算法層出不窮，但具有普適性的算法幾乎沒有，這個在CV領域也是如此。因此，提高視覺測量的普適性、並確保精度，目前似乎是個不可能完成的任務。

　　綜上，視覺測量要大的突破確實很難，必須和應用光學、視覺認知、CV、人工智能等相關學科進行深度交叉。

　　提升三維技術

　　在現實生活中，我們越來越需要更多的三維模型來實現對物體或環境的全麵掌握。獲得三維模型有兩種基本方式，一種是利用激光掃描儀，一種是拍攝照片。但激光掃描儀的成本高，也有可能會對樣本帶來一些損害。第二種方式的成本小，而且在精度上也跟激光掃描儀相差無幾，因此成為了現在研究的一個熱點。

　　我們知道，一般的圖像上是沒有長度、距離等深度信息的，而三維模型則能更加全麵、精確地記錄環境，可以直觀呈現物體的位置、距離、姿態等。比如中國古代建築全自動三維重建係統，能夠實現全自動三維建模，即從底層圖像處理到生成最終的三維模型，全部自動實現，無需人工交互。它對圖像的拍攝方式也無特殊約束和限製，隻需手持自由拍攝即可。在精度上，也與激光掃描精度相當，精度小於3cm/100米，通過配備更高像素數量的相機和長焦鏡頭還可以實現毫米級重建。

　　此外，在實時定位與在線三維重建方麵，機器視覺也具有極大的應用潛力。將手機上攝像頭讀取的視頻作為輸入，通過初始化、特征點提取、動態模板特征點匹配、幾何變化計算階段後得到視頻每一幀中感興趣區域的位置。

　　目前，我國基於機器視覺的三維重建技術在國際上可以說處於領先地位，應用也比較廣泛。除了上述之外，還能用在一些不太適合人工作業的環境監測方麵，像對露天煤礦的監測，就是通過無人機對煤礦進行全方位拍攝，生成三維模型來實時監測礦山的變化。此外，也能應用於城市規劃、數字媒體、三維試衣、牙模製造等多方麵。

　　未來發展趨勢

　　由於機器視覺是自動化的一部分，沒有自動化就不會有機器視覺，機器視覺軟硬件產品正逐漸成為協作生產製造過程中不同階段的核心係統，無論是用戶還是硬件供應商都將機器視覺產品作為生產線上信息收集的工具，這就要求機器視覺產品大量采用標準化技術，直觀地說就是要隨著自動化的開放而逐漸開放，可以根據用戶的需求進行二次開發。

　　當今，自動化企業正在倡導軟硬一體化解決方案，機器視覺的廠商在未來十年內也應該不單純是隻提供產品的供應商，而是逐漸向一體化解決方案的係統集成商邁進。隨著中國加工製造業的發展，對於機器視覺的需求也逐漸增多。隨著機器視覺產品的增多，技術的提高，國內機器視覺的應用狀況將由初期的低端轉向高端。由於機器視覺的介入，自動化將朝著更智能、更快速的方向發展。

返回列表

行業新聞

機器視覺的應用及主要瓶頸

企業新聞

Company News

人力資源

Human Resource