噜噜噜噜私人影院,少妇人妻综合久久中文字幕888,AV天堂永久资源网,5566影音先锋

歡迎來到優(yōu)發(fā)表網(wǎng)

購物車(0)

期刊大全 雜志訂閱 SCI期刊 期刊投稿 出版社 公文范文 精品范文

計(jì)算機(jī)視覺論文

時(shí)間:2022-05-02 05:19:48

序論:在您撰寫計(jì)算機(jī)視覺論文時(shí),參考他人的優(yōu)秀作品可以開闊視野,小編為您整理的1篇范文,希望這些建議能夠激發(fā)您的創(chuàng)作熱情,引導(dǎo)您走向新的創(chuàng)作高度。

計(jì)算機(jī)視覺論文

計(jì)算機(jī)視覺論文:計(jì)算機(jī)視覺檢測技術(shù)在機(jī)加工零件測量中的應(yīng)用探究

現(xiàn)階段,我國的市面上有很多不同的方法來進(jìn)行機(jī)械零件尺寸的測量和研究,采取不同的測量辦法,得出的結(jié)果也有著精確度的差異。原始的測量方法是人們通過借助各種測量儀器,如萬能工具顯微鏡和三坐標(biāo)測量機(jī)等,進(jìn)行人工測量操作。這種方式存在著很多弊端,而計(jì)算機(jī)視覺檢測技術(shù)的應(yīng)用則可以很好地解決這一問題。所謂視覺檢測就是檢測被測目標(biāo)時(shí),把圖像當(dāng)作檢測和傳遞信息的手段或載體加以利用的檢測方法,其目的是從圖像中提取有用的信號,它是以現(xiàn)代光學(xué)為基礎(chǔ),融光電子學(xué)、計(jì)算機(jī)圖像學(xué)、信息處理、計(jì)算機(jī)視覺等科學(xué)技術(shù)為一體的現(xiàn)代檢測技術(shù)。由于計(jì)算機(jī)視覺系統(tǒng)可以快速獲取大量信息,而且易于與設(shè)計(jì)信息及加工控制信息集成,基于視覺檢測技術(shù)的儀器設(shè)備能夠?qū)崿F(xiàn)智能化、數(shù)字化、小型化、網(wǎng)絡(luò)化和多功能化,具備在線檢測、實(shí)時(shí)分析、實(shí)時(shí)控制的能力在軍事、工業(yè)、商業(yè)、醫(yī)學(xué)等領(lǐng)域得到廣泛關(guān)注和應(yīng)用。

一、計(jì)算機(jī)視覺檢測技術(shù)含義

計(jì)算機(jī)的視覺又叫做機(jī)器視覺,通過利用計(jì)算機(jī)或者是其他的一些機(jī)械設(shè)備來幫助人們視線事物到圖片的過程,從而進(jìn)行三維世界的感知活動(dòng)。計(jì)算機(jī)的快速發(fā)展,離不開神經(jīng)心理學(xué),心理學(xué)和認(rèn)知科學(xué)方面的研究和發(fā)展,計(jì)算機(jī)視覺檢測技術(shù)的發(fā)展方向就是對周圍的三維空間進(jìn)行感知和分析。一旦能夠擁有這種能力,計(jì)算機(jī)不僅能感知到周圍的總體環(huán)境,而且,還能夠具有對物體進(jìn)行描述,識別理解和儲(chǔ)存的能力。

二、計(jì)算機(jī)視覺檢測的基本原理

要實(shí)現(xiàn)人工智能對視覺的計(jì)算機(jī)處理是很重要的方面在計(jì)算機(jī)視覺應(yīng)用領(lǐng)域中如果要讓我們的計(jì)算機(jī)明白圖像的信息就必須經(jīng)過一系列的處理過程―――數(shù)字圖像處理.數(shù)字圖像的處理包括5個(gè)步驟:圖像預(yù)處理(去除噪聲)、分割處理分割后區(qū)域、測量、圖像判讀、圖像技術(shù).根據(jù)抽象程度和處理方法的不同圖像技術(shù)可分為三個(gè)層次:圖像處理、圖像分析和圖像理解.這三個(gè)層次的有機(jī)結(jié)合也稱為圖像工程.而計(jì)算機(jī)視覺(Computer vision)則是用計(jì)算機(jī)實(shí)現(xiàn)人的視覺功能對客觀世界三維場景的感知、識別和理解.視覺檢測按其所處理的數(shù)據(jù)類型又大致可分為二值圖像、灰度圖像、彩色圖像和深度圖像的視覺檢測.另外還有X射線檢測、超聲波檢測和紅外線檢測。

作為新興檢測技術(shù)計(jì)算機(jī)視覺檢測充分利用了計(jì)算機(jī)視覺研究成果采用像傳感器來實(shí)現(xiàn)對被測物體的尺寸及空間位置的三維測量能較好地滿足現(xiàn)代制造業(yè)的發(fā)展需求.與一般意義上的圖像處理相比計(jì)算機(jī)視覺檢測更強(qiáng)調(diào)精度、速度和無損性以及工業(yè)現(xiàn)場環(huán)境下的可靠性.例如基于三角法的主動(dòng)視覺測量理具有抗干擾能力強(qiáng)、效率高、精度合適等優(yōu)點(diǎn)非常適合制造業(yè)生產(chǎn)現(xiàn)場的在線、非接觸產(chǎn)品檢測及生產(chǎn)監(jiān)控.對人類視覺感知能力的計(jì)算機(jī)模擬促進(jìn)了計(jì)算機(jī)視覺技術(shù)的產(chǎn)生和發(fā)展制造業(yè)上獲取這些信息的目的有:(1)計(jì)算出觀察點(diǎn)到目標(biāo)物體的距離;(2)得出觀察點(diǎn)到目標(biāo)物體的運(yùn)動(dòng)參數(shù);(3)甚至可以判斷出目標(biāo)物體的內(nèi)部特性;(4)推斷出目標(biāo)物體的表面特征有時(shí)要求形成立體視覺。

三、亞像素檢測技術(shù)

隨著工業(yè)檢測等應(yīng)用對精度要求的不斷提高,像素級精度已經(jīng)不能滿足實(shí)際檢測的要求,因此需要更高精度的邊緣提取算法,即亞像素算法。亞像素級精度的算法是在經(jīng)典算法的基礎(chǔ)上發(fā)展起來的,這些算法一般需要先用經(jīng)典算法找出邊緣像素的位置,然后使用周圍像素的灰度值作為判斷的補(bǔ)充信息,利用插值、擬合等方法,使邊緣定位于更加精確的位置。現(xiàn)在的亞像素提取算法很多,如重心法、概率論法、解調(diào)測量法、多項(xiàng)式插值法、濾波重建法、矩法等。由于這些算法的精度、抗噪聲能力和運(yùn)算量各不相同,他們的應(yīng)用場合也是各不相同的。

邊緣是圖像的基本特征,所謂邊緣是指圖像中灰度存在階躍或尖頂狀變化的像素的集合,邊緣廣泛存在于物體與物體、物體與背景之間。圖像測量是通過處理被測物體圖像中的邊緣而獲得物體的幾何參數(shù)的過程,邊緣的定位精度直接影響最終的測量結(jié)果。因此,圖像邊緣提取方法是檢測的基礎(chǔ)和關(guān)鍵之一。在視覺測量領(lǐng)域中,早期使用的都是像素級邊緣檢測方法,例如常用的梯度算子、Lapacian算子和門式算子等。以上的邊緣檢測方法的精度可以達(dá)到像素級精度,即可以判斷出邊緣位于某個(gè)像素內(nèi),但不能確定邊緣在該像素內(nèi)的更精確的位置。如果一個(gè)像素對應(yīng)的實(shí)際長度較大,就會(huì)產(chǎn)生較大的誤差,傳統(tǒng)的整像素邊緣檢測方法就不再適用。

四、計(jì)算機(jī)視覺檢測技術(shù)在機(jī)加工零件檢測中的應(yīng)用要素與過程

(一)曲陣CCD相機(jī)

面陣CCD是本項(xiàng)目圖像采集系統(tǒng)中的主要設(shè)備之一,其主要功能是采集實(shí)驗(yàn)圖像。該CCD相機(jī)主要由CCD感光芯片、驅(qū)動(dòng)電路、信號處理路、電子接口電路和光學(xué)機(jī)械接口等構(gòu)成。

(二)工業(yè)定焦鏡頭

在圖像測量系統(tǒng)中,鏡頭的主要作用是將目標(biāo)聚焦在圖像傳感器的光敏面上。鏡頭的質(zhì)量直接影響到圖像測量系統(tǒng)的整體性能,合理選擇并安裝光學(xué)鏡頭是圖像測量系統(tǒng)設(shè)計(jì)的重要環(huán)節(jié)。

(三)數(shù)字圖像采集卡

隨著數(shù)字信號處理技術(shù)和嵌入式處理器技術(shù)在圖像采集卡中的應(yīng)用,使得圖像采集卡向高速度、多功能和模塊化方向不斷發(fā)展。這類圖像采集卡不僅具有高速圖像采集功能,同時(shí)還具備部分圖像處理功能,因此又可以稱之為圖像處理卡。

(四)標(biāo)定板

為提高測量精度,需要進(jìn)行攝像機(jī)標(biāo)定。標(biāo)定過程中,采用NANO公司的CBC75mm}.0型高精度標(biāo)定板,外形尺寸為75mmx75mmx3.0mm,圖形為棋盤格,其尺寸為2.0mmx2.0mm,精度為1級,即圖形尺寸精度與圖形位置精度為。

(五)背光源

背光方式只顯示不透明物體的輪廓,所以這種方式用于被測物需要的信息可以從其輪廓得到的場合。因此,為精確提取軸的圖像中的邊緣特征,需采用背光源。為使圖像邊緣更銳利,光源顏色選擇紅色。

五、結(jié)語

隨著計(jì)算機(jī)技術(shù)和光電技術(shù)的發(fā)展,已經(jīng)出現(xiàn)了一種新的檢測技術(shù)―基于計(jì)算機(jī)視覺的檢測技術(shù),利用CCD攝像機(jī)作為圖像傳感器,綜合運(yùn)用圖像處理等技術(shù)進(jìn)行非接觸測量的方法,被廣泛地應(yīng)用于零件尺寸的精密測量中。本文以面陣CCD為傳感器,研究了零件在線測量的方法,實(shí)現(xiàn)了零件尺寸的圖像邊緣亞像素定位測量,對面陣CCD在高精度測量方面的應(yīng)用作了進(jìn)一步的探索和研究,為面陣CCD在復(fù)雜零件尺寸高精度測量的實(shí)現(xiàn)打下了基礎(chǔ)。

計(jì)算機(jī)視覺論文:包裝條碼計(jì)算機(jī)視覺識別系統(tǒng)設(shè)計(jì)

摘要:隨著商品種類的不斷豐富和信息化管理手段的應(yīng)用普及,條形碼作為現(xiàn)代生產(chǎn)、物流和銷售各環(huán)節(jié)的重要信息化手段之一,它的應(yīng)用也日益廣泛,而且,隨著我國對食品和藥品安全問題的重視,條碼作為追溯碼也開始被用于食品藥品追溯領(lǐng)域。如何對條形碼中的信息進(jìn)行提取就變得非常重要了。本文在這樣的背景下針對乳品企業(yè)的產(chǎn)品可追溯問題,設(shè)計(jì)了一套可用于乳品追溯的包裝條碼計(jì)算機(jī)視覺識別系統(tǒng)。

關(guān)鍵詞:條碼;乳品包裝;條碼識別;計(jì)算機(jī)視覺

本系統(tǒng)硬件部分采用面陣攝像機(jī)、工控機(jī)構(gòu)成,軟件部分采用C#語言和OpenCV軟件進(jìn)行開發(fā),采用EF Model(實(shí)體框架)作為程序框架,通過搭建好的視頻采集系統(tǒng),利用外觸發(fā)啟動(dòng)攝像機(jī)采集圖像,經(jīng)過圖像預(yù)處理、識別區(qū)域的檢測和定位后,提取出待識別圖像,對于待識別圖像中的條碼和數(shù)字,分別采用相似邊距離方法進(jìn)行一維碼識別、采用逐行掃描法進(jìn)行二維碼識別,并利用模型匹配進(jìn)行數(shù)字識別。

本系統(tǒng)可綜合識別條碼以及數(shù)字識別,實(shí)驗(yàn)表明本系統(tǒng)具有較好的識別效率和識別精度,可以滿足一般條件下的包裝條碼計(jì)算機(jī)識別,并且已在乳品可追溯方面取得應(yīng)用。

1 概述

在數(shù)不勝數(shù)的新型計(jì)算機(jī)科學(xué)技術(shù)出現(xiàn)之后,條形碼技術(shù)儼然已經(jīng)成為了最為經(jīng)濟(jì)實(shí)用的一種自動(dòng)識別技術(shù)。隨著時(shí)代的不斷發(fā)展和用戶需求的不斷擴(kuò)展,各種各樣的商品出現(xiàn)在我們生活中[1]。雖然條形碼的技術(shù)發(fā)展的爐火純青,但是隨著條形碼的不斷變化和創(chuàng)新,識別包裝條形碼技術(shù)已然成為我們現(xiàn)在需要不斷研究的課題。

條形碼的出現(xiàn)無疑給我們的生活帶來了方便,但τ謖飧隹燜俜⒄溝氖貝,對其識別的技術(shù)的效率還需要我們進(jìn)行大量的研究和開發(fā)。這也是開發(fā)本系統(tǒng)的初衷。對于本系統(tǒng)來說,它既要滿足對條形碼的檢測,圖像提取,校正等功能的實(shí)現(xiàn),又要實(shí)現(xiàn)所有程序自動(dòng)化的功能。該系統(tǒng)主要應(yīng)用于對海河食品包裝的識別。該系統(tǒng)利用外觸發(fā)器,實(shí)現(xiàn)將視頻轉(zhuǎn)化到靜態(tài)圖片的功能,同時(shí)通過后臺(tái)處理快速地找到該靜態(tài)圖片中條形碼的位置并對提取的條形碼以圖片的形式存儲(chǔ),然后對條形碼圖片進(jìn)行識別。

2 條形碼定位

2.1 圖像采集

采集方式是利用相機(jī)和觸發(fā)器采取圖像,DirectX以流的方式讀取播放視頻。

2.2 圖像預(yù)處理[2]

OpenCV現(xiàn)在利用Mat類來表示圖像,在此基礎(chǔ)上進(jìn)行圖像的灰度化處理[3],在灰度處理基礎(chǔ)上,進(jìn)行圖像梯度化[4]。就是把圖像作為二維離散函數(shù)。梯度化過程就是對該函數(shù)求導(dǎo)的過程。圖像邊緣的確定大多都是通過圖像梯度化處理來實(shí)現(xiàn)的。梯度化方向[5],分水平方向梯度計(jì)算和垂直方向梯度計(jì)算,或者是振幅計(jì)算。在進(jìn)行檢測前,還要使用Scharr算子先確定邊緣像素[6]的位置。接下來進(jìn)行圖像二值化,所有的像素點(diǎn)的像素值設(shè)置為0或者255。最后,采用開運(yùn)算算法進(jìn)行形態(tài)化處理。

2.3 條碼檢測

本系統(tǒng)使用Vecor容器用于存放面積;findContours函數(shù)對二值圖像中的輪廓進(jìn)行檢測;Point用來表示坐標(biāo)為整數(shù)的二維點(diǎn);Rect方法:用于提取旋轉(zhuǎn)的矩形圖案;angle檢查這個(gè)矩形的偏斜角度;將提取的矩形輪廓標(biāo)記在圖片上并剪截下來進(jìn)行保存。

2.4 二維碼提取

相對應(yīng)一維碼,二維碼在譯碼之前需要先對二維碼進(jìn)行分割,再進(jìn)行邊緣檢測。采用區(qū)域增長的方法修正邊界。二維碼是正方形形態(tài),我們也要對其進(jìn)行圖形區(qū)域的旋轉(zhuǎn)處理,利用Hough變換來進(jìn)行處理利用二維圖像的投影變換。然后對拍攝的圖像進(jìn)行Hough變換,根據(jù)4條邊界線進(jìn)行位置旋轉(zhuǎn)。也可以使用仿射變換。即先對一個(gè)向量空間進(jìn)行一次線性變換并根據(jù)該變化做出相對性的平移,使其變成另一個(gè)向量空間。該變化方法包括水平的平移、圖像的縮放、圖像的旋轉(zhuǎn)等功能。

2.5 數(shù)字定位方法

商品包裝上的條碼一般都是預(yù)印刷的,許多商品的生成日期和使用日期也需要入庫進(jìn)行保存,但是由于條碼印刷成本較高,所以廠家通常采用的方式是以數(shù)字形式將商品的生成日期和使用日期印刷在包裝袋上。因而,本系統(tǒng)添加了數(shù)字識別功能。數(shù)字技術(shù)識別的主要核心字符分割技術(shù):切割數(shù)字區(qū)域后,進(jìn)行字符的切割,由于該圖像還是灰度圖像,所以我們在切割前還要進(jìn)行一些圖像處理。具體過程:灰度拉伸、二值化、傾斜校正以及字符分割。圖像以海河牛奶的包裝袋為例。由于信息過多,一個(gè)條形碼無法將全部信息存儲(chǔ),所以會(huì)在包裝正面的空白位置加些數(shù)字,以此來完善條形碼內(nèi)容不足的地方。

具體分割算法如圖1所示。將截取后的整個(gè)圖片進(jìn)行自上而下的逐行對比,提取黑色的字符部分,直到整幅圖像完畢。已列為高度基準(zhǔn)進(jìn)行掃描,進(jìn)行從左到右依次排查,直到全部圖片掃面完畢。由于印刷問題,數(shù)字區(qū)域可能有小圓點(diǎn),采用的是比例方法運(yùn)算將這些小點(diǎn)清除,把每個(gè)切割后的圖像的寬度均除以未切割前的圖像的寬度,設(shè)立一個(gè)最小的商值。如果小于該商值,將其以噪聲方式清除。最后對字符進(jìn)行了加框和歸一化處理。上述所切割的圖像大小是根據(jù)字符的最高和最低的值進(jìn)行的切割,所以我們得到的結(jié)果并不是很準(zhǔn)確,我們要將每個(gè)字符再進(jìn)行進(jìn)一步的確定,所以要多進(jìn)行幾次從第一個(gè)步驟到第三個(gè)步驟的運(yùn)算。這樣我們得到的才是該字符的準(zhǔn)確范圍。

3 條形碼識別

3.1 一維碼識別

一維碼儲(chǔ)存的信息是由條和空的寬度以及所在的位置來傳遞的。以EAN-13碼為例。一維條形碼的條和空的數(shù)量越多,它就越寬,儲(chǔ)存的數(shù)據(jù)量就越多,由于一維碼是由條和空組成的,將信息變化成二進(jìn)制或者十進(jìn)制的數(shù)字。

本系統(tǒng)對于一維碼識別采用的方法是相似邊距離方法,利用相似法識別一維碼[6]:根據(jù)算法進(jìn)行字符的掃描和識別,定義:C1和C3表示相鄰條的寬度,C2和C4表示空的寬度,T表示整個(gè)字符的寬度,T1和T2為相似邊的距離。用算法取得值JTj(j=1,2)來進(jìn)行T1與T2的歸一化處理。

3.2 二維碼識別

二維碼是按照一定的規(guī)律在平面上分布的黑色與白色相間的圖形記錄符號。識別二位碼[7]需先定位圖案,再是功能性數(shù)據(jù),識別由數(shù)據(jù)碼和糾錯(cuò)碼共同組成的數(shù)據(jù)信息。

定位圖案:我們通常定位二維碼是根據(jù)左上角、右上角以及左下角三個(gè)位置定位的。以其中一個(gè)圖形為例,我們可以將其看作分別為7*7、5*5和3*3三個(gè)模塊。三個(gè)之間比例為1:1:3:1:1。掃描:用一個(gè)直線逐行掃描二維碼,該線被截為1:1:3:1:1時(shí)截取。誤差在0.5之間在列方向,也用相同的方法進(jìn)行二維碼定位掃描。我們通常定位二維碼是根據(jù)圖上的三個(gè)位置定位的。

3.3 數(shù)字識別

數(shù)字識別[8]部分已經(jīng)超出了我們圖像處理的范圍依據(jù)了,屬于模式識別,由于我們已經(jīng)對圖片進(jìn)行了分割,所以我們只需通過其特征進(jìn)行分類與識別。采用的是逐像素取法方法[9],具體操作就是對圖片M行每行每列的依次查找,遇到的黑點(diǎn)時(shí),將其像素值設(shè)為“1”,其他為“0”,全部掃描結(jié)束后,將提取的個(gè)數(shù)相同的像素,放在特征矩陣?yán)铩⑻卣餍畔?,輸入到分類器中,進(jìn)行分類處理,從而得出結(jié)果。再進(jìn)行采取模塊匹配,事先做好海河包裝上的圖像中字符的圖像采集,然后建立一個(gè)圖片模板識別庫。當(dāng)我們進(jìn)行字符識別時(shí),就將模板取出來依次對比,把與字符特征對比的結(jié)果的矢量求出加權(quán)距離。則最小的結(jié)果就是識別的結(jié)果。如圖2所示。

計(jì)算機(jī)視覺論文:計(jì)算機(jī)視覺技術(shù)在智能交通系統(tǒng)中的應(yīng)用

摘 要

近年來,經(jīng)濟(jì)的發(fā)展和人們生活水平的提升也使得人們的出行更加便捷,越來越多的人都是自己駕車出行,這樣導(dǎo)致公路上的交通流量不斷增加,如何保障交通的順暢性和安全性成為人們關(guān)注的重點(diǎn)問題。信息技術(shù)的發(fā)展推動(dòng)了計(jì)算機(jī)視覺技術(shù)的出現(xiàn),為交通安全性的提升提供了一定的保障。本文主要對計(jì)算機(jī)視覺技術(shù)進(jìn)行分析,進(jìn)一步探討計(jì)算機(jī)視覺技術(shù)在智能交通系統(tǒng)中的應(yīng)用。

【關(guān)鍵詞】計(jì)算機(jī) 視覺技術(shù) 智能交通 系統(tǒng) 應(yīng)用

智能交通系統(tǒng)簡稱ITS,這是一種新型的交通管理系統(tǒng)。該系統(tǒng)主要結(jié)合了信息化技術(shù)、計(jì)算機(jī)技術(shù)以及數(shù)據(jù)傳輸技術(shù)等多種技術(shù),用來對整個(gè)交通運(yùn)輸體系進(jìn)行管理,可以實(shí)現(xiàn)人、車、路的全面監(jiān)控和管理。計(jì)算機(jī)視覺藝術(shù)作為智能交通系統(tǒng)中的一個(gè)重要環(huán)節(jié),受到相關(guān)工作人員的高度重視。隨著計(jì)算機(jī)視覺技術(shù)的發(fā)展,不僅為交通行業(yè)的發(fā)展提供了更多的便捷,同時(shí)還能夠篩選道路交通的各種信息,進(jìn)一步增強(qiáng)了智能交通系統(tǒng)的靈活性和準(zhǔn)確性。

1 計(jì)算機(jī)視覺技術(shù)的概述

計(jì)算機(jī)視覺也被稱為圖像分析和圖解理解,其包括的理論主要有攝影幾何學(xué)、概率論、圖像處理理論以及人工智能理論等部分。計(jì)算機(jī)視覺技術(shù)主要是用二維投影圖像實(shí)現(xiàn)三維物體重構(gòu)。這種技術(shù)的應(yīng)用范圍比較廣泛,不僅應(yīng)用于二維圖像識別方面,同時(shí)還用于三維物體的識別和重建上面。通過計(jì)算機(jī)視覺技術(shù)能夠獲取專業(yè)化的三維信息,對三維信息的獲取一般有兩種方法,其中一種是直接獲取法,還有一種是間接獲取法。直接獲取法主要是通過計(jì)算機(jī)視覺技術(shù)的效果來確定三維運(yùn)動(dòng)中產(chǎn)生的各種參數(shù),這一過程對攝像機(jī)運(yùn)動(dòng)問題的關(guān)注程度較高;間接獲取的方式就是將單幅圖像和攝像機(jī)焦距相結(jié)合,來判斷被測量位置視覺上的信息。計(jì)算機(jī)視覺技術(shù)的關(guān)鍵就是實(shí)現(xiàn)特別匹配,在特殊情況下可以利用不同的攝像C同時(shí)收集運(yùn)動(dòng)信息,從而提高相關(guān)控制的精確度。

2 計(jì)算機(jī)視覺技術(shù)在智能交通系統(tǒng)中的應(yīng)用

計(jì)算機(jī)視覺技術(shù)在智能交通系統(tǒng)中的應(yīng)用可以實(shí)現(xiàn)道路交通的監(jiān)控,同時(shí)還能夠?qū)崿F(xiàn)自動(dòng)收費(fèi)、智能導(dǎo)航等功能,主要應(yīng)用有以下幾個(gè)方面的內(nèi)容。

2.1 交通監(jiān)控中對計(jì)算機(jī)視覺技術(shù)的應(yīng)用

基于計(jì)算機(jī)視覺技術(shù)的交通監(jiān)控系統(tǒng)主要分為三個(gè)步驟,首先是對車輛和行人進(jìn)行跟蹤和分割,其次是對車流量進(jìn)行分析和計(jì)算,并且計(jì)算車輛的平均速度和道路上車輛的隊(duì)列長度,最后根據(jù)道路的交通狀況來規(guī)劃形式線路,從而有效緩解道路交通擁堵的現(xiàn)狀,方便人們減少出行時(shí)間。車輛和行人作為道路中運(yùn)動(dòng)的主要目標(biāo),在監(jiān)控場合下,需要對運(yùn)動(dòng)時(shí)間進(jìn)行有效分割,常用到的分割方式包括光流法和幀差法兩種,其中前一種分割方式主要是依據(jù)圖像中不同的運(yùn)動(dòng)用映射參數(shù)正確的表達(dá),這樣可以將具有同樣映射參數(shù)的光流量進(jìn)行分配,從而完成參數(shù)分割。計(jì)算機(jī)視覺在交通監(jiān)控中的應(yīng)用主要是對車輛速度、車輛數(shù)目、車輛分類進(jìn)行檢測。隨著計(jì)算機(jī)通信技術(shù)的發(fā)展,計(jì)算機(jī)視覺技術(shù)也是日新月異,基于計(jì)算機(jī)視覺的交通監(jiān)控系統(tǒng)具有較強(qiáng)的實(shí)時(shí)工作性,能夠快速的適應(yīng)高度公路以及城市道路交通的監(jiān)控。

2.2 車輛導(dǎo)航中對計(jì)算機(jī)視覺技術(shù)的應(yīng)用

實(shí)現(xiàn)車輛的智能導(dǎo)航是計(jì)算機(jī)視覺技術(shù)在智能交通中應(yīng)用的典型案例。這種技術(shù)主要為駕駛?cè)藛T提供道路信息和車輛運(yùn)行狀況兩大信息。通過車輛智能導(dǎo)航系統(tǒng)的運(yùn)行能夠?qū)Φ缆穬蛇叺慕缦捱M(jìn)行有效的識別,將車輛引向規(guī)定的行駛車道,在車輛行駛過程中,該系統(tǒng)能夠自動(dòng)檢測車輛與前方其他車輛之間的距離,從而提醒駕駛?cè)藛T保持車輛的安全距離,最終實(shí)現(xiàn)安全導(dǎo)航駕駛。通過該系統(tǒng)的攝像機(jī)運(yùn)動(dòng)能夠識別其他車輛的行駛狀況,并且通過計(jì)算檢測點(diǎn)的方式計(jì)算車輛的模擬匹配點(diǎn)。車倆智能導(dǎo)航系統(tǒng)中就使用了計(jì)算機(jī)視覺技術(shù),可以從中提取相關(guān)信息,計(jì)算車輛行駛的安全距離和速度。

2.3 計(jì)算機(jī)視覺技術(shù)用于車輛輔助駕駛

計(jì)算機(jī)視覺技術(shù)在車輛輔助駕駛中的應(yīng)用主要是幫助駕駛?cè)藛T對外界的變化做出反應(yīng)。具體表現(xiàn)為車輛在市內(nèi)行駛時(shí),計(jì)算機(jī)視覺技術(shù)的應(yīng)用能夠識別周邊道路的標(biāo)記,并且對交通標(biāo)志、其他車輛和行人進(jìn)行識別,然后篩選相關(guān)信息進(jìn)行計(jì)算,讓駕駛?cè)饲宄饨绲木唧w狀況,從而避開其他的車輛和行人,能夠從根本上減少交通事故的發(fā)生,增強(qiáng)車輛的安全運(yùn)行。輔助駕駛的形式轉(zhuǎn)變?yōu)槿藱C(jī)交互的方式,一定程度上能夠滿足駕駛?cè)藛T對信息的需求。

2.4 計(jì)算機(jī)視覺技術(shù)用于車輛智能收費(fèi)

車輛收費(fèi)是車輛在公共交通位置行駛中的一個(gè)關(guān)鍵環(huán)節(jié)。隨著科學(xué)技術(shù)的發(fā)展,車輛收費(fèi)系統(tǒng)逐漸向著計(jì)算機(jī)技術(shù)的應(yīng)用方向發(fā)展,計(jì)算機(jī)視覺技術(shù)在各地區(qū)交通發(fā)展中的應(yīng)用是現(xiàn)代化交通發(fā)展的一個(gè)重要突破口。很多地區(qū)的智能化收費(fèi)都是通過識別車牌的方式來實(shí)現(xiàn)收費(fèi),我國在車牌識別這方面僅僅限制于單目車牌和雙目車牌的識別,其中單目車牌識別的核心就是將車牌照位置作為核心部分,我國大部分地區(qū)都是將單目系統(tǒng)作為核心部分來使用。采用雙目系統(tǒng)對車牌進(jìn)行識別,也可以對車輛的型號進(jìn)行識別,通過大量的實(shí)踐發(fā)現(xiàn),雙目系統(tǒng)進(jìn)行車牌識別的實(shí)用性較強(qiáng)。但是這種識別方式在實(shí)際應(yīng)用過程中仍然存在著信息獲取難度大、車牌照定位難度大等多種問題,尤其是車輛在高速路上行駛時(shí),對于車牌信息的獲取更為困難,因此,在這方面還需要加大研究和實(shí)踐。

3 結(jié)束語

隨著計(jì)算機(jī)視覺技術(shù)的智能化發(fā)展,其在智能交通系統(tǒng)中的應(yīng)用能夠解決多方面的問題。該技術(shù)的應(yīng)用不僅能夠?qū)崿F(xiàn)車輛的實(shí)時(shí)監(jiān)控,同時(shí)還能夠?qū)崿F(xiàn)車輛導(dǎo)航以及車輛收費(fèi),幫助駕駛?cè)藛T識別車輛行駛中存在的障礙物,這樣一來,可以增強(qiáng)車輛行駛的安全性,同時(shí)還能夠提高我國道路交通系統(tǒng)的整體管理水平。但是該技術(shù)應(yīng)用中也存在不足之處,未來發(fā)展中需要降低視覺系統(tǒng)的價(jià)格,減少系統(tǒng)的尺寸,從而增強(qiáng)系統(tǒng)對車輛信息的處理速度,最終實(shí)現(xiàn)對道路交通的全面監(jiān)測。

計(jì)算機(jī)視覺論文:淺析計(jì)算機(jī)圖形學(xué)、計(jì)算機(jī)視覺與可視化技術(shù)

摘 要:在科技的帶動(dòng)下,計(jì)算機(jī)圖形學(xué)、計(jì)算機(jī)視覺與可視化技術(shù)得以快速發(fā)展,并被應(yīng)用到各個(gè)領(lǐng)域,隨著它們的應(yīng)用,極大的推動(dòng)了現(xiàn)代社會(huì)發(fā)展。為進(jìn)一步了解這些技術(shù),充分發(fā)揮其應(yīng)有作用,本文將對計(jì)算機(jī)圖形學(xué)、計(jì)算機(jī)視覺以及可視化技術(shù)展開研究,希望能為相關(guān)人士帶來有效參考。

關(guān)鍵詞:計(jì)算機(jī)圖形學(xué);計(jì)算機(jī)視覺;可視化技術(shù)

計(jì)算機(jī)圖形學(xué)、計(jì)算機(jī)視覺以及可視化技術(shù)三者均是計(jì)算機(jī)領(lǐng)域重要組成部分,要做好計(jì)算機(jī)知識,就要先學(xué)好計(jì)算機(jī)圖形學(xué),但計(jì)算機(jī)圖形學(xué)學(xué)習(xí)相對枯燥,尤其是算法教學(xué)難以理解,為解決這一問題,計(jì)算機(jī)視覺與可視化技術(shù)被應(yīng)用到計(jì)算機(jī)圖形學(xué)中。可見,三者之間存在一定的聯(lián)系,因此,有必要對計(jì)算機(jī)圖形學(xué)、計(jì)算機(jī)視覺以及可視化技術(shù)展開研究。

1 計(jì)算機(jī)圖形學(xué)概述

1.1 計(jì)算機(jī)圖形學(xué)目的

所謂的計(jì)算機(jī)圖形學(xué)實(shí)際上就是怎樣利用計(jì)算機(jī)表示圖形,并利用計(jì)算機(jī)完成圖形計(jì)算與處理,而這一過程的實(shí)現(xiàn)需要得到相關(guān)算法的支持。學(xué)習(xí)計(jì)算機(jī)圖形學(xué)的目的是利用計(jì)算機(jī)技術(shù)為人們呈現(xiàn)既帶有美感又不缺真實(shí)的圖形(如下圖1所示),為實(shí)現(xiàn)這一目標(biāo),就需要按照圖形的要求創(chuàng)設(shè)合適的場景,并在一些光照模型的作用下,做好光照效果設(shè)計(jì),在這一過程中需要計(jì)算機(jī)圖形學(xué)能夠與其他計(jì)算機(jī)技術(shù)相配合。經(jīng)過計(jì)算機(jī)圖形學(xué)出來的圖像,多會(huì)以數(shù)字圖像的方式展示出來,總的來說,計(jì)算機(jī)圖形學(xué)與圖像處理之間存在著一定的聯(lián)系[1]。計(jì)算機(jī)圖形學(xué)的涉及范圍相對寬泛,不僅有圖形硬件設(shè)計(jì),還包括動(dòng)畫制作,虛擬現(xiàn)實(shí)等多個(gè)部分。此外,計(jì)算機(jī)圖形學(xué)在動(dòng)畫制作中的應(yīng)用頻率也很高,如45分鐘一集的動(dòng)畫影片中,85%的畫面都需要用算機(jī)圖形學(xué)來完成,由此可見,計(jì)算機(jī)圖形學(xué)的應(yīng)用頻率極高,并在動(dòng)畫制作中發(fā)揮著不可替代的作用。因此,應(yīng)重視計(jì)算機(jī)圖形學(xué)的應(yīng)用。

1.2 計(jì)算機(jī)圖形學(xué)應(yīng)用

隨著計(jì)算機(jī)圖形學(xué)的發(fā)展,它被應(yīng)用到各個(gè)領(lǐng)域中,并發(fā)揮著重要作用。首先,在計(jì)算機(jī)輔助設(shè)計(jì)與制造中的應(yīng)用,這是計(jì)算機(jī)圖形學(xué)應(yīng)用最多的領(lǐng)域,在計(jì)算機(jī)圖形學(xué)被應(yīng)用以后,不僅可以設(shè)計(jì)出更精準(zhǔn)的圖形,還能做好人機(jī)交互設(shè)計(jì),強(qiáng)化修改能力。計(jì)算機(jī)圖形學(xué)還被應(yīng)用到三維形體重建中,利用該技術(shù)可以將原理的二維信息轉(zhuǎn)化為三維信息,如在某次工程圖紙?jiān)O(shè)計(jì)中就應(yīng)用了計(jì)算機(jī)圖形學(xué),經(jīng)過一系列的處理以后,三維形體逐漸形成,最終實(shí)現(xiàn)了重建。其次,在醫(yī)學(xué)領(lǐng)域中的應(yīng)用。計(jì)算機(jī)圖形學(xué)在醫(yī)學(xué)領(lǐng)域中的應(yīng)用多以計(jì)算可視化的形式展示出來,如在腦部手術(shù)中,醫(yī)生為看清患處真實(shí)情況,經(jīng)常需要利用在可視化技術(shù)的作用下將復(fù)雜的數(shù)據(jù)轉(zhuǎn)化為圖像,這時(shí)就體現(xiàn)了計(jì)算機(jī)圖形學(xué)在其中的應(yīng)用[2]。再者,在計(jì)算機(jī)動(dòng)畫中的應(yīng)用,人們看到的動(dòng)畫影片就是計(jì)算機(jī)圖形學(xué)作用的結(jié)果,以動(dòng)畫人物的行走為例,為保證動(dòng)畫人物的行走與自然人不存在過大差異,就需要應(yīng)用大量的計(jì)算機(jī)技術(shù),并在計(jì)算機(jī)圖形學(xué)的作用下完成設(shè)計(jì)。最后,在計(jì)算機(jī)藝術(shù)中的應(yīng)用。計(jì)算機(jī)圖形學(xué)在計(jì)算機(jī)藝術(shù)中也有廣泛應(yīng)用,它不僅可以用于藝術(shù)制作,很多場景都是通過計(jì)算機(jī)圖形學(xué)來完成的,現(xiàn)階段,一些人正在利用計(jì)算機(jī)圖形學(xué)創(chuàng)設(shè)人體模擬系統(tǒng),其目的是讓已故人士再次出現(xiàn)在熒屏上,這一目標(biāo)的實(shí)現(xiàn)就需要得到計(jì)算機(jī)圖形學(xué)的支持。

2 計(jì)算機(jī)視覺技術(shù)

2.1 計(jì)算機(jī)視覺技術(shù)含義

所謂的計(jì)算機(jī)視覺技術(shù),實(shí)際上就是用計(jì)算機(jī)取代人眼做識別、跟蹤以及測量等,同時(shí)也兼顧圖形處理,其目的是讓圖像在計(jì)算機(jī)被處理以后更適于識別。對于計(jì)算機(jī)視覺技術(shù)來說,意在實(shí)現(xiàn)人工智能,主要是從圖像與多維數(shù)據(jù)等方面實(shí)現(xiàn)人工智能系統(tǒng)設(shè)計(jì)[3]。計(jì)算機(jī)視覺是一種在相關(guān)理論與模型基礎(chǔ)上發(fā)展起來的視覺系統(tǒng),其主要構(gòu)成部分有以下幾種:

(1)程序控制,這一點(diǎn)主要體現(xiàn)在機(jī)器人設(shè)計(jì)上;(2)事件檢測,多體現(xiàn)在圖像監(jiān)測上;(3)信息組織,主要體現(xiàn)在圖像數(shù)據(jù)庫等方面。計(jì)算機(jī)視覺三個(gè)階段如圖2所示,通過觀察圖1可以發(fā)現(xiàn),計(jì)算機(jī)視覺存在于圖像處理始終,從早期處理直到后期結(jié)束都存在,最終實(shí)現(xiàn)了3D描述,可見,計(jì)算機(jī)視覺具有十分重要的作用[4]。

2.2 計(jì)算機(jī)視覺技術(shù)的應(yīng)用

現(xiàn)階段,現(xiàn)代社會(huì)已經(jīng)進(jìn)入信息化時(shí)代,計(jì)算機(jī)技術(shù)也被應(yīng)用到各個(gè)領(lǐng)域,并發(fā)揮著重要作用。計(jì)算機(jī)視覺的應(yīng)用促使計(jì)算機(jī)實(shí)現(xiàn)了智能化,在該技術(shù)的支持下,計(jì)算機(jī)可以像人一樣透過視覺看待世界萬物,且具有良好的適應(yīng)能力,但這一目標(biāo)的實(shí)現(xiàn)還需要很長時(shí)間,需要一系列的努力才能實(shí)現(xiàn)?,F(xiàn)階段,計(jì)算機(jī)視覺應(yīng)用最多的就是車輛視覺導(dǎo)航,然而,這種導(dǎo)航還沒有實(shí)現(xiàn)完全自主導(dǎo)航,這也是需要進(jìn)一步研究的地方。計(jì)算機(jī)視覺技術(shù)的適應(yīng)性較好,特別適合在工業(yè)領(lǐng)域應(yīng)用,即便是存在電子在干擾或溫度變化較大的地方都能很好的運(yùn)行,其整體效果也不會(huì)受到影響,再者,計(jì)算機(jī)視覺技術(shù)的嵌入性較好,成本相對較低,尤其適合在PC方案中使用,同時(shí),具有一定的非接觸能力,能夠獲取大量信息,且不受距離限制,總的來說,計(jì)算機(jī)視覺技術(shù)總體效果較好,適合利用在各種工業(yè)環(huán)境中應(yīng)用,因此,應(yīng)重視計(jì)算機(jī)視覺技術(shù)的應(yīng)用[5]。同時(shí)計(jì)算機(jī)視覺還被應(yīng)用到移動(dòng)機(jī)器人設(shè)計(jì)中,主要是利用小波模板展示人體形態(tài),然后做圖像掃描,這樣就可以順利完成小波變換,進(jìn)而了解到人的存在。同樣,將計(jì)算機(jī)視覺應(yīng)用到機(jī)器人設(shè)計(jì)上,可以自動(dòng)檢測出正在行動(dòng)的人或車輛,而無法檢測到靜止的人,之所以會(huì)出現(xiàn)這樣情況,主要是由于其中采用率步態(tài)分析法。

3 可視化技術(shù)

3.1 可視化技術(shù)含義

可視化技術(shù)是一種綜合了計(jì)算機(jī)圖形學(xué)與圖像處理于一體的技術(shù),它可以將復(fù)雜的數(shù)據(jù)轉(zhuǎn)化為圖像并在屏幕上展示出來。在可視化技術(shù)中,融合了以上兩種技術(shù)的特點(diǎn),并在多個(gè)領(lǐng)域都有應(yīng)用,隨著可視化技術(shù)的應(yīng)用,不僅有效實(shí)現(xiàn)了數(shù)據(jù)表示,還強(qiáng)化了數(shù)據(jù)處理能力,更對數(shù)據(jù)決策分析有一定作用[6]。現(xiàn)階段,虛擬現(xiàn)實(shí)技術(shù)已經(jīng)成為可視化技術(shù)主要發(fā)展方向。

3.2 可視化技術(shù)的應(yīng)用

首先,在計(jì)算機(jī)圖形學(xué)教學(xué)中的應(yīng)用,計(jì)算機(jī)圖形學(xué)相對枯燥,相關(guān)知識也很抽象,不便于學(xué)生理解,在計(jì)算機(jī)圖形學(xué)中最重要的部分是曲線曲面,而這些曲線曲面多是與數(shù)學(xué)模型有關(guān),具有一定的抽象性,學(xué)生理解難度較大,以往教師只能通過一系列的公式演算幫助學(xué)生理解,盡管這樣依然難以讓學(xué)生掌握曲線變化情況,學(xué)生依舊無法正確理解。為減少這種情況的發(fā)生,可視化技術(shù)被應(yīng)用到計(jì)算機(jī)圖形學(xué)教學(xué)中,教師將抽象的知識用動(dòng)畫的形式展示出來,學(xué)生只要觀看動(dòng)畫,拖動(dòng)一定的控制點(diǎn)就可以了解到曲線變化情況,這樣一來不僅增加了教學(xué)趣味性,學(xué)生也可以隨意變動(dòng)曲線,讓復(fù)雜的知識變得簡單,深化學(xué)生對計(jì)算機(jī)圖形學(xué)知識的深度理解,同時(shí),利用可視化技術(shù)在一定條件下,還可以完成代碼編譯,如在Actoin ScriPt中做編譯,這樣也可以增強(qiáng)學(xué)生的理解能力[7]。

其次,在醫(yī)學(xué)領(lǐng)域中的應(yīng)用。醫(yī)學(xué)領(lǐng)域?qū)τ诳梢暬夹g(shù)的應(yīng)用主要體現(xiàn)在放射治療與矯正手術(shù)上。通過可視化技術(shù)可以屏幕上看到手術(shù)整個(gè)過程,并將原來細(xì)節(jié)部位放大,手術(shù)醫(yī)生觀察的更加細(xì)致,手術(shù)成功幾率也會(huì)大幅度提升,患者生命也能得到保證(如圖3所示)。如在對某名患者進(jìn)行身體檢查的過程中需要應(yīng)用到可視化技術(shù),由于通過檢查會(huì)獲得大量數(shù)據(jù),而這些數(shù)據(jù)又相對復(fù)雜,但在可視化技術(shù)下就可以通過圖表、曲線圖或立柱圖的方式展示出來,經(jīng)過可視化技術(shù)的作用,了解到患者的血糖為5.6mmol/L,醫(yī)生可以根這一數(shù)據(jù)做出診斷,而不必再分析這些數(shù)據(jù)。據(jù)不完全統(tǒng)計(jì),80%的醫(yī)療檢查工作都是需要利用可視化技術(shù)。

地質(zhì)勘探是我國最重要的工作之一,由于多數(shù)礦藏都深埋地下,即便使用探測儀受多種因素影響也無法了解到實(shí)際礦藏情況,這就需要應(yīng)用到可視化技術(shù),在可視化技術(shù)的作用下,相關(guān)工作人員可以了解到地下有無礦藏,如果存在礦藏,相關(guān)工作人員也可以了解到礦藏所在位置與實(shí)際儲(chǔ)備量,進(jìn)而為礦藏開采奠定基礎(chǔ)。如在地質(zhì)勘探中,相關(guān)工作人員利用可視化技術(shù)做地形圖整理,然后從中提取地形數(shù)據(jù),再用CATIA做導(dǎo)入,這樣就可以完成地形模型創(chuàng)建,這樣就完成了三維地質(zhì)模型創(chuàng)建工作,同時(shí)在相關(guān)工作臺(tái)的影響下,還可以完成地形數(shù)據(jù)導(dǎo)入,進(jìn)而生成一定的地形云點(diǎn),如果其中存在錯(cuò)誤,可視化技術(shù)也可以將其中的錯(cuò)誤內(nèi)容刪除,這些都是可視化技術(shù)所帶來的好處[8]。由此可見,可視化技術(shù)已經(jīng)成為地質(zhì)勘探中不缺少的技術(shù)。

最后,在氣象預(yù)報(bào)中的應(yīng)用(如圖4所示)。利用可視化技術(shù)能夠?qū)?shù)據(jù)轉(zhuǎn)化為圖像,通過觀察圖像就可以了解到云層變化情況,同時(shí)也能了解到實(shí)際風(fēng)力大小與風(fēng)走向等,氣象預(yù)報(bào)人員就可以根據(jù)圖像做出精準(zhǔn)分析,需要了解氣象變化的人也能了解到現(xiàn)實(shí)情況,如果氣象條件惡劣,相關(guān)工作人員也可以及時(shí)做出工作調(diào)整,減少危險(xiǎn)事件的發(fā)生。據(jù)不完全統(tǒng)計(jì),可視化技術(shù)在氣象預(yù)報(bào)中的應(yīng)用頻率高達(dá)100%,由此挽回的經(jīng)濟(jì)損失高達(dá)13.2億元,可見,可視化技術(shù)在氣象預(yù)報(bào)中的應(yīng)用十分有必要,因此,應(yīng)重視可視化技術(shù)在氣象預(yù)報(bào)中的應(yīng)用。

4 結(jié)語

通過以上研究得知,計(jì)算機(jī)圖形學(xué)、計(jì)算機(jī)視覺以及可視化技術(shù)三者各具特色,三者間也存在一定的關(guān)系,尤其是可視化技術(shù)綜合了前兩者的特點(diǎn),并融合了其他技術(shù),在很多領(lǐng)域中都有應(yīng)用??梢暬夹g(shù)是現(xiàn)階段應(yīng)用最多的一種技術(shù),在計(jì)算機(jī)圖形學(xué)教學(xué)中也有應(yīng)用,并發(fā)揮著不可替代的作用。本文分析了計(jì)算機(jī)圖形學(xué)、計(jì)算機(jī)視覺以及可視化技術(shù)的含義與應(yīng)用,希望能為相關(guān)人士帶來有效參考,正確利用這些技術(shù)。

計(jì)算機(jī)視覺論文:淺談OpenCV計(jì)算機(jī)視覺庫

摘 要:用C、C++、Java等計(jì)算機(jī)語言編一個(gè)圖像識別程序,常常需要借助一些圖像處理的工具庫,OpenCV就是其中之一,使用OpenCV要比使用計(jì)算機(jī)應(yīng)用軟件困難,需要前期復(fù)雜的準(zhǔn)備工作,如果了解了OpenCV與其他圖像處理應(yīng)用軟件的區(qū)別、學(xué)習(xí)OpenCV的基礎(chǔ)、運(yùn)行環(huán)境、圖像操作原理以及OpenCV文檔包含的內(nèi)容,學(xué)習(xí)和使用OpenCV就會(huì)容易很多。

關(guān)鍵詞:圖像處理 OpenCV C

圖像識別技術(shù)已經(jīng)應(yīng)用到生活中的許多方面。文字識別系統(tǒng),直接把圖片上的文字掃描成文本文檔格式。人臉識別技術(shù)已經(jīng)用到了智能手機(jī)之中,現(xiàn)在的手機(jī)解鎖可以直接使用人臉識別。指文圖像識別的應(yīng)用更為廣泛,如辦理身份證、入學(xué)考試、駕照等用來確認(rèn)身份。百度、Google、蘋果等公司研究的無人駕駛汽車,將該技術(shù)用于對障礙物、路標(biāo)、行人及其他車輛的判斷。道路交通監(jiān)控系統(tǒng)中,系統(tǒng)自動(dòng)檢索違規(guī)車輛,并對車輛的車牌等信息進(jìn)行識別。通過車牌提取、圖像預(yù)處理、特征提取、車牌字符識別等技術(shù),識別車輛牌號,目前,字母和數(shù)字的識別率可達(dá)96%,漢字的識別率可達(dá)95% [1-2]。所有的這些都用到了圖像識別功能,要編寫圖像識別程序使用OpenCV是一個(gè)不錯(cuò)的選擇。

1 OpenCV簡介

OpenCV是Intel公司于1999年推出的一種面向圖像處理的開源計(jì)算機(jī)視覺庫,其中,OpenCV是Open Source Computer Vision Library的縮寫,如今由Willow Garage提供支持,其中包括了3個(gè)版本OpenCV1、OpenCV2、OpenCV3,除了OpenCV1現(xiàn)在很少使用外,其他兩個(gè)版本已經(jīng)有了很多改進(jìn)的版本。OpenCV有開源的函數(shù)庫,可以滿足不同領(lǐng)域的圖像處理需求,使用時(shí)以函數(shù)調(diào)用的形式提供給用戶,也可以對其代碼進(jìn)行改進(jìn),便于用戶實(shí)驗(yàn)教學(xué)或程序開發(fā)使用。

2 OpenCV的特點(diǎn)

(1)開源。OpenCV是一個(gè)開源的圖像處理函數(shù)庫,無論是商業(yè)應(yīng)用,還是做科學(xué)研究,完全是免費(fèi)的,與Linux類似它的源代碼也是公開的,這樣程序的安全性就得到保障,OpenCV的函數(shù)庫是用C語言和C++語言進(jìn)行編寫的,源代碼可讀性比較高,發(fā)現(xiàn)其中不足之可以自行進(jìn)行修改,避免編譯后的可執(zhí)行文件出現(xiàn)漏洞。

(2)跨平臺(tái)。OpenCV是一個(gè)基于BSD許可(開源)發(fā)行的跨平臺(tái)計(jì)算機(jī)視覺庫,可以運(yùn)行在Windows、Linux、Mac OS和嵌入式等操作系統(tǒng)上[3]。

(3)應(yīng)用領(lǐng)域廣。OpenCV圖像處理可以使用到多個(gè)領(lǐng)域當(dāng)中,包括生物醫(yī)學(xué)、工業(yè)、軍事安防、機(jī)器視覺、航空航天等。目前已知OpenCV編程系統(tǒng)在航空航天定位、衛(wèi)星地圖繪制、工廠大規(guī)模生產(chǎn)視覺檢測等方面得到了廣泛的應(yīng)用,同時(shí)對于無人飛行器的視覺捕捉技術(shù)也有極大的幫助[4]。

(4)支持多種語言進(jìn)行開發(fā)。OpenCV中包括了多種編程語言的接口,其中支持的編程語言包括C、C++、C#、Java、Python等。

3 OpenCV與圖像處理應(yīng)用軟件

在計(jì)算機(jī)學(xué)習(xí)中也會(huì)學(xué)到一些其他的圖像處理軟件,如Photo Shop、Windows畫圖工具等在計(jì)算機(jī)中使用的圖像處理工具。在手機(jī)中有一個(gè)比較流行的軟件,在拍好照片后可以對個(gè)人照片進(jìn)行智能美化,這些軟件都是應(yīng)用軟件缺少編程需要的接口,這些軟件處理圖像后只是給出結(jié)果,無法取到程序處理所需要的中間參數(shù),只能局限于最后的結(jié)果展示,如果只是單純的圖像制作, Photo Shop類的圖像處理工具已經(jīng)足夠了。但是對于圖像識別、機(jī)器視覺等,需要對圖像內(nèi)容做出判斷,用類似于Photo Shop這樣的圖像處理軟件就無法完成了,因?yàn)闊o法集成到所編寫的程序當(dāng)中。OpenCV是一個(gè)圖像處理函數(shù)庫,其中包涵了對于計(jì)算機(jī)操作系統(tǒng)和計(jì)算機(jī)語言編譯平臺(tái)支持的API接口以及源碼庫,可以在編寫的程序中去處理圖像,不但可以得到圖像處理后的結(jié)果,還可以對圖像中間的處理過程進(jìn)行控制,可以對圖像中的內(nèi)容用自己編寫的程序代碼進(jìn)行判定,實(shí)現(xiàn)識別操作。

4 學(xué)習(xí)OpenCV的基礎(chǔ)

C和C++語言在工科類專業(yè)中一般設(shè)置必修課程,C語言常作為一門基礎(chǔ)的編程語言來教,有的學(xué)生覺得C比較容易,有的學(xué)生感覺比較難,這個(gè)取決于每個(gè)人對計(jì)算機(jī)語言的理解能力與對計(jì)算機(jī)語言的興趣,C和C++的區(qū)別在于C++增加了類,支持面向?qū)ο缶幊?。新版OpenCV函數(shù)庫是基于C++的,打開源代碼的文件夾可以看到許多以.cpp結(jié)尾的C++代碼文件,所以對于C和C++的掌握情況直接關(guān)系到對OpenCV的學(xué)習(xí)。

5 OpenCV的運(yùn)行環(huán)境

在學(xué)習(xí)每種計(jì)算機(jī)語言之前都要對每種計(jì)算機(jī)語言的IDE(Integrated Development Environment,集成開發(fā)環(huán)境)進(jìn)行安裝和配置,集成開發(fā)環(huán)境不只是用來編輯程序代碼,還包括了對代碼的編譯、調(diào)試與運(yùn)行等。如Java語言,在Windows操作系統(tǒng)中Java語言最簡單的編輯環(huán)境是記事本,對于Java的編譯與運(yùn)行需要用到命令窗調(diào)用所安裝JDK(Java Development Kit,Java開發(fā)包)中的編譯程序與運(yùn)行環(huán)境,如果是集成的IDE,如Eclipse、MyEclipse等,點(diǎn)擊IDE上的運(yùn)行或是調(diào)試按鈕,就可以在IDE中的結(jié)果輸出窗口上直接查看運(yùn)行結(jié)果。OpenCV是用C和C++語言所編寫的圖像處理函數(shù)庫,它沒有自己獨(dú)立的IDE,所以它需要借助其他編程語言的IDE進(jìn)行編寫和調(diào)用,如Microsoft Visual Studio、QT Creator等。

配置開發(fā)環(huán)境是學(xué)習(xí)OpenCV中重要的一步,但是這個(gè)過程相對于初學(xué)者來說有些復(fù)雜。首先,要從網(wǎng)上下載并安裝計(jì)算機(jī)語言的開發(fā)環(huán)境,如微軟的Visual Studio、QT集成開發(fā)環(huán)境等。其次,下載并安裝OpenCV的安裝包,安裝OpenCV是一個(gè)解壓的過程。下一步,就是對開發(fā)環(huán)境的配置,其中要對系統(tǒng)變量、包含目錄、附加依賴項(xiàng)進(jìn)行配置。然后進(jìn)行調(diào)試運(yùn)行。在對開發(fā)環(huán)境配置時(shí),為保證OpenCV庫與本地開發(fā)環(huán)境兼容性更好,最好使用CMaker(Cross Platform Make)在本地環(huán)境中對OpenCV源代碼重新編譯。

6 OpenCV中的Hello World

在學(xué)習(xí)C或是java語言時(shí),常常會(huì)有一個(gè)重要的標(biāo)志就是‘Hello World!’,標(biāo)志著系統(tǒng)配置完成并且整個(gè)IDE環(huán)境運(yùn)行正常,編譯系統(tǒng)成功的編譯了所寫的代碼,并且在操作系統(tǒng)中執(zhí)行成功。OpenCV中這個(gè)標(biāo)志有所不同,它的‘Hello World!’是在IDE中寫好代碼后,調(diào)用OpenCV中的函數(shù)打開一幅代碼中指定的圖片并顯示到新建的窗口中,標(biāo)志著IDE中的參數(shù)是正確的,這是進(jìn)行圖像操作的重要一步。

7 OpenCV圖像像素操作

對于數(shù)值的計(jì)算是第一步一般輸出一個(gè)結(jié)果,在學(xué)任何一門計(jì)算機(jī)語言時(shí)會(huì)有一個(gè)很好的例子“計(jì)算器”,那圖像如何去表示?其實(shí)圖像是多個(gè)結(jié)果的一個(gè)集合,就像在C語言中打出星號所組成的菱形,每一個(gè)星號可以比喻成一個(gè)圖像中的像素點(diǎn)。對于圖像處理過程中常常見到的有3種:第一種,RGB圖像,彩色的圖像,每個(gè)像素點(diǎn)由3個(gè)數(shù)值表示。第二種,灰度圖像,像以前的黑白電視機(jī),每個(gè)像素點(diǎn)由一個(gè)數(shù)值就可以表示。第三種,二值圖像,每個(gè)像素點(diǎn)由一個(gè)數(shù)值表示。在OpenCV中有多種方法可以對圖像進(jìn)行操作,其中比較方便的就是利用cv::Mat類,對圖像進(jìn)行打開、顯示、修改和保存,這也是進(jìn)行圖像操作的重要一步。

8 OpenCV的文檔

大家在OpenCV官網(wǎng)提供的文檔中可以得到更多幫助。在OpenCV的文檔中包括了對組件結(jié)構(gòu)的介紹,了解OpenCV的組件結(jié)構(gòu)對學(xué)習(xí)OpenCV是十分有利的,該介紹包括了一系列的動(dòng)態(tài)或靜態(tài)庫,如矩陣數(shù)組的定義、圖像處理模塊包含的內(nèi)容、視頻分析所需要的算法、基本的多視覺算法、外部特征的檢測類、物體的檢測類、UI類的使用、圖像算法的硬件加速等,在編寫代碼時(shí)可以查找其類中對象所包含成員和方法。一些OpenCV圖書所帶的光盤中或互聯(lián)網(wǎng)上網(wǎng)友提供的圖像處理代碼,由于編程使用的操作系統(tǒng)或編譯環(huán)境不同,有些代碼會(huì)包含未知的頭文件或者缺少頭文件,代碼本身并沒有錯(cuò)誤,但總是編譯出錯(cuò),了解了這些知識后在編程時(shí),有利于定位在程序中所引用的文件所屬的位置,從而有效地處理文件引用出現(xiàn)的問題。

無論對什么樣的物體進(jìn)行識別,圖像識別過程基本是不變的,包括:圖像預(yù)處理、圖像分割,特征提取、判斷匹配、輸出結(jié)果。圖像預(yù)處理中會(huì)用到圖像的灰度化、圖像的二值化、去除圖像的噪聲等算法。特征提取中會(huì)用到圖像變換、圖像邊緣檢測等算法。判斷匹配中用到直方圖、投影等算法。圖像分割有3種:基于閾值的分割、基于區(qū)域分割、基于邊緣的分割[5]。在OpenCV的文檔中都詳細(xì)提供了基本算法類的定義與方法,通過OpenCV的代碼庫中的基本算法類或幾個(gè)基本算法類的組合可以實(shí)現(xiàn)以上所列算法的所有功能。

9 結(jié)語

據(jù)統(tǒng)計(jì),一個(gè)人獲取的信息大約有75%來自視覺。在工業(yè)4.0的時(shí)代里機(jī)器也需要有自己的視覺系統(tǒng),基于圖像處理的機(jī)器視覺在人工智能領(lǐng)域會(huì)得到更廣泛的應(yīng)用,如:無人駕駛汽車、智能機(jī)器人、智能安防系統(tǒng)等。OpenCV是一個(gè)進(jìn)入這些行業(yè)的重要工具之一,圖像處理的學(xué)習(xí)過程是一個(gè)循序漸進(jìn)的過程,希望學(xué)習(xí)者在OpenCV的基礎(chǔ)上提高對于圖像處理的認(rèn)識及對圖像處理的技術(shù)水平。

計(jì)算機(jī)視覺論文:基于計(jì)算機(jī)視覺的實(shí)時(shí)車輛運(yùn)動(dòng)速度檢測算法研究

摘 要: 在對比了傳統(tǒng)運(yùn)動(dòng)車輛實(shí)時(shí)檢測方法的基礎(chǔ)上,提出了一種新的G?C二重差分法,將視頻流中的某一當(dāng)前幀與背景幀進(jìn)行邊緣檢測,將兩幀的結(jié)果相減,得到梯度差分,再將此結(jié)果與背景顏色差分結(jié)果進(jìn)行“或”運(yùn)算,提高了車輛存在判斷的準(zhǔn)確度,此算法可以準(zhǔn)確檢測出路面運(yùn)動(dòng)車輛存在同時(shí)有效消除車輛陰影的影響,為后續(xù)車輛運(yùn)動(dòng)速度的實(shí)時(shí)檢測提供了有力保證。基于運(yùn)動(dòng)車輛檢測的結(jié)果,在VC環(huán)境下進(jìn)行了編程實(shí)現(xiàn),自動(dòng)檢測出運(yùn)動(dòng)車輛的實(shí)時(shí)速度,測試結(jié)果表明該算法效果很好。

關(guān)鍵詞: 計(jì)算機(jī)視覺; 車輛檢測; 速度檢測; 消除車輛陰影

0 引 言

計(jì)算機(jī)視覺(Computer Vision)主要研究如何運(yùn)用照相機(jī)和計(jì)算機(jī)獲取被拍攝對象的數(shù)據(jù)與信息,形象的說,就是給計(jì)算機(jī)安裝上“眼睛”(照相機(jī))和“大腦”(算法)。目前,計(jì)算機(jī)視覺技術(shù)的應(yīng)用領(lǐng)域十分廣泛,其在道路交通管理中的應(yīng)用更是取得了很好的效果。隨著科學(xué)技術(shù)的飛速發(fā)展,現(xiàn)代交通在經(jīng)濟(jì)發(fā)展中所起的作用越來越大,而交通現(xiàn)代化帶來的問題也越來越多,諸如交通擁擠、交通事故頻發(fā)、交通環(huán)境惡化等。在這樣的大背景下,智能交通系統(tǒng)(Intelligent Traffic System,ITS)作為一種強(qiáng)有力的交通管理手段應(yīng)運(yùn)而生,其高效率的管理特點(diǎn)使其成為當(dāng)今世界道路交通管理的發(fā)展趨勢,而計(jì)算機(jī)視覺技術(shù)則是ITS的重要技術(shù)支持。

實(shí)時(shí)車輛運(yùn)動(dòng)速度檢測是ITS對交通實(shí)施監(jiān)測和管理的重要一環(huán),對車輛速度的檢測一方面可以監(jiān)控超速等違章問題,減少交通事故的發(fā)生,另一方面可以根據(jù)車速判斷道路擁擠程度,進(jìn)而迅速采取措施,保證道路交通的安全和暢通,從而實(shí)現(xiàn)智能交通管理的目的。在上一代ITS中,實(shí)時(shí)車輛運(yùn)動(dòng)速度檢測的方法主要有線圈檢測、激光檢測、雷達(dá)檢測等,這些速度檢測方法多多少少都存在一定的問題,如容易受路基狀況、自然環(huán)境等的影響精度降低,而在新一代ITS中基于計(jì)算機(jī)視覺的車輛速度檢測法則大大提高了測速的精度,這有賴于計(jì)算機(jī)有一個(gè)“超強(qiáng)大腦”,即好的算法。

1 運(yùn)動(dòng)車輛的檢測

運(yùn)動(dòng)車輛的檢測是實(shí)時(shí)運(yùn)動(dòng)車輛速度檢測的基礎(chǔ),使計(jì)算機(jī)能夠自動(dòng)的把相機(jī)攝取的視頻里的靜止物體與運(yùn)動(dòng)物體區(qū)別開,并且自動(dòng)提取出運(yùn)動(dòng)物體。所以,在研究實(shí)時(shí)車輛速度檢測算法前,先要研究運(yùn)動(dòng)車輛的檢測算法。

1.1 現(xiàn)有運(yùn)動(dòng)目標(biāo)檢測方法比較

目前,常用的運(yùn)動(dòng)車輛實(shí)時(shí)檢測方法主要有幀間差分法和背景差分法。

1.2.2 預(yù)處理幀的顏色差分

由于無論車身像素值是否低于路面像素值,其梯度邊緣必然存在,而交通路面一般都很平坦,除了車道線外檢測不到邊緣,將當(dāng)前幀與路面背景模型均進(jìn)行邊緣檢測,再將兩個(gè)邊緣圖像按式(8)做差得到運(yùn)動(dòng)物體的邊緣梯度差分圖像:

3 實(shí)驗(yàn)結(jié)果與分析

筆者用實(shí)際拍攝的視頻圖像對上述算法進(jìn)行了試驗(yàn)測試,實(shí)驗(yàn)時(shí)模擬實(shí)際交通攝像機(jī)的安裝情況,使其固定不動(dòng),計(jì)算機(jī)處理的速度約為20 f/s。首先將視頻中的某一幀進(jìn)行邊緣檢測,與背景做梯度差分,并與背景顏色差分的結(jié)果進(jìn)行“或”運(yùn)算,最后對圖像去噪并二值化,通過測試多種路況、天氣和光照條件,試驗(yàn)結(jié)果顯示該算法可以在陽光充足、遇到物體陰影明顯的情況下準(zhǔn)確地將運(yùn)動(dòng)車輛從視頻的背景中提取出來,并能準(zhǔn)確檢測出車輛的速度,如圖3所示。

4 結(jié) 語

計(jì)算視覺的應(yīng)用提高了智能交通系統(tǒng)的準(zhǔn)確性,本文在對比了傳統(tǒng)運(yùn)動(dòng)車輛實(shí)時(shí)檢測方法的基礎(chǔ)上,提出了一種新的運(yùn)動(dòng)車輛實(shí)時(shí)速度檢測算法,此算法與傳統(tǒng)的算法相比,可以更加準(zhǔn)確地檢測出路面運(yùn)動(dòng)車輛的存在,同時(shí)有效消除車輛陰影的影響,為后續(xù)車輛運(yùn)動(dòng)速度的實(shí)時(shí)檢測提供有力保證?;谶\(yùn)動(dòng)車輛檢測的結(jié)果,進(jìn)行編程實(shí)現(xiàn),可以自動(dòng)檢測出運(yùn)動(dòng)車輛的實(shí)時(shí)速度,測試結(jié)果表明該算法效果很好。

計(jì)算機(jī)視覺論文:基于計(jì)算機(jī)視覺理論的石材大板表面輪廓提取算法的研究

[摘 要]石材大板表面輪廓提取是石材加工生產(chǎn)過程中的重要步驟和關(guān)鍵工序。它對于實(shí)時(shí)優(yōu)化切割不規(guī)則石材以及優(yōu)化排版和下料具有決定性的作用,對于提高生產(chǎn)效率和石材利用率、節(jié)約石材資源具有重要意義。本文基于計(jì)算機(jī)視覺理論,研究了石材輪廓提取的算法。通過分析石材目標(biāo)圖像的灰度、顏色和紋理等特征,提出了石材輪廓提取算法,較準(zhǔn)確的提取出石材目標(biāo)輪廓。

[關(guān)鍵詞]石材大板;輪廓提?。粓D像處理

1、 引言

圖像處理是在線測量系統(tǒng)中很重要的一部分,本文就是利用圖像處理技術(shù)提取石材大板的輪廓信息,然后利用其目標(biāo)點(diǎn)的間距最終求得石材大板尺寸。本文對圖像處理的相關(guān)算法進(jìn)行研究,提取石材大板的輪廓信息,最終計(jì)算其尺寸。提取過程主要包括圖像預(yù)處理和圖像分割兩部分。圖像處理過程如圖1所示。

2、圖像處理

2.1 圖像預(yù)處理

通過CCD攝像機(jī)獲取的石材大板圖像在其傳輸、接收和處理的過程中,由于受多種因素的影響,如系統(tǒng)噪聲、曝光不足或過量、傳輸過程中的誤差以及人為因素等等,均會(huì)對石材大板圖像產(chǎn)生一定的噪聲干擾。噪聲會(huì)惡化圖像質(zhì)量,有時(shí)會(huì)使提取的信息減少甚至淹沒某些有用特征,給分析帶來困難。因此,對圖像進(jìn)行預(yù)處理是非常必要的,這樣可以去除噪聲,使其更接近真實(shí)圖像,更有利于對石材大板圖像進(jìn)行后續(xù)處理。圖像預(yù)處理主要包括濾波和增強(qiáng)。

2.1.1 圖像灰度化

圖像的灰度化是圖像增強(qiáng)處理技術(shù)中一種非?;尽⒅苯拥膱D像處理方法。圖像的增強(qiáng)用于調(diào)整圖像的對比度,為了獲得對后續(xù)計(jì)算機(jī)處理、分析過程更有利的圖像,需要對采集的原始圖像進(jìn)行圖像增強(qiáng),從而淡化背景,消除噪聲干擾,提高對比度,突出圖像中的重要細(xì)節(jié)[1]。

本文采用的是加權(quán)平均值法:R=G=B=aR+bG+cB??紤]到圖像的合理性,取a=0.11,b=0.59,c=0.30,即采用公式(1)進(jìn)行灰度轉(zhuǎn)換:

其中:為轉(zhuǎn)換后的灰度圖像在點(diǎn)處的灰度值;、和分別為彩色圖像在點(diǎn)處的紅色分量值、綠色分量值和藍(lán)色分量值。

在OpenCV函數(shù)庫中,圖像的灰度化可以通過cvCvtColor(const CvArr* src,CvArr* dst,int code)函數(shù)實(shí)現(xiàn),其中src為原彩色圖像,dst為處理后的圖像,code為色彩空間轉(zhuǎn)換方式,在這里code定義為CV_RGB2GRAY。彩色石材大板圖像經(jīng)過式(1)轉(zhuǎn)換后,變成灰度圖像。圖2所示為4個(gè)彩色石材圖像灰度化后的結(jié)果。

2.1.2 圖像平滑

圖像的平滑處理技術(shù)即圖像的去噪聲處理,它是將輸入的圖像進(jìn)行濾波去除噪聲。圖像平滑一是平滑非邊緣區(qū)域,二是使圖像邊緣得到保護(hù)。一個(gè)較好的平滑方法應(yīng)該是既能消掉這些噪聲效應(yīng)又不使圖像的邊緣輪廓和線條模糊。在濾波方法中,最常用的有均值濾波和中值濾波兩種,本文采用此兩種方法分別對石材大板平滑處理,效果如圖3所示。

這里僅選取了其中的一幅圖像進(jìn)行處理。從圖中可以看出均值濾波和中值濾波對含有高斯噪聲的圖像都能夠有效地抑制噪聲的干擾,對含有椒鹽噪聲的圖像也能抑制部分噪聲。但通過比較明顯可以看出,,中值濾波在椒鹽噪聲處理方面的能力是均值濾波無法比擬的,因此,本文采用中值濾波對圖像進(jìn)行濾波去噪。

2.2 圖像分割與邊緣檢測

圖像分割是圖像處理和計(jì)算機(jī)視覺中基本而關(guān)鍵的技術(shù)之一,其目的就是將目標(biāo)物體與背景分離開來,為后續(xù)的處理提供堅(jiān)實(shí)的基礎(chǔ)。圖像分割的方法主要包括閾值法、邊緣檢測法、區(qū)域跟蹤法等。本論文采用的是邊緣檢測法。

2.2.1 邊緣檢測

檢測石材大板邊緣是其輪廓提取的基礎(chǔ)。邊緣檢測實(shí)現(xiàn)的難點(diǎn)在于邊緣檢測的精度和抗噪聲的能力。邊緣檢測有很多算法,例如Roberts算子、Sobel算子、Prewitt算子、拉普拉斯算子等[2]。

(1)Roberts算子

Roberts算子采用的是對角方向相鄰的兩個(gè)像素之差。從圖像處理的實(shí)際效果來看,邊緣定位準(zhǔn),對噪聲敏感。Roberts算子是一種利用局部差分算子尋找邊緣的算子,該算子對具有陡峭邊緣且含噪聲少的圖像效果較好。

(2)Sobel算子

Sobel邊緣檢測算子是先做加權(quán)平均,再微分,然后求梯度。以下兩個(gè)卷積核形成了Sobel邊緣檢測算子,圖中的每個(gè)點(diǎn)都用這兩個(gè)核做卷積,其中一個(gè)對垂直邊緣影響最大,而另一個(gè)對水平邊緣影響最大。邊緣檢測算子的中心與中心像素相對應(yīng),進(jìn)行卷積運(yùn)算。兩個(gè)卷積核的最大值作為該點(diǎn)的輸出位。運(yùn)算結(jié)果是一幅邊緣幅度圖像。在邊沿檢測中,Sobel算子對于像素的位置的影響做了加權(quán),加權(quán)平均邊寬2像素,因此效果更好。Sobel算子都對噪聲具有很好的抑制能力,但仍然不能完全排除檢測出來的邊緣中存在虛假邊緣的情況。

(3)Prewitt算子

Prewitt算子與Sobel算子基本相同,只是沒有加權(quán),所有系數(shù)全為1。Prewitt算子產(chǎn)生一幅邊緣強(qiáng)度圖像。

(4)拉普拉斯算子

拉普拉斯(Laplacian)算子是一種二階導(dǎo)數(shù)算子,對一個(gè)連續(xù)函數(shù), Laplacian算子是不依賴于邊緣方向的二階微分算子,對圖像中的階躍型邊緣點(diǎn)定位準(zhǔn)確。該算子對噪聲非常敏感,它使噪聲成分得到加強(qiáng)。這兩個(gè)特性使得該算子容易丟失一部分邊緣的方向信息,造成一些不連續(xù)的檢測邊緣,同時(shí)抗噪聲能力比較差。

圖4為不同邊緣檢測算子對石材大板邊緣進(jìn)行檢測的結(jié)果。

從圖4中可以看出,不同的邊緣檢測算法應(yīng)用到石材大板圖像上會(huì)有不同的檢測效果,通過比較可以發(fā)現(xiàn)Sobel和Prewitt算子的處理效果相對較好。經(jīng)多次試驗(yàn)比較,而且由于Sobel算子對于水平和垂直邊緣的檢測有更好的效果,因此效果相對較好。

2.2.2 圖像二值化

圖像的二值化處理就是將圖像上每點(diǎn)的灰度值變?yōu)?或者255,也就是將整個(gè)圖像呈現(xiàn)出明顯的黑白效果。在數(shù)字圖像處理中,二值化是一種簡單有效的方法。設(shè)定某一閾值,可以用將圖像的數(shù)據(jù)分成兩部分:大于的像素群和小于的像素群。因此圖像二值化可按公式(5)進(jìn)行:

式中,是原始圖像中位于處像素的灰度;是二值化后該處的像素值,它只能取0或1。

圖5所示為用二值化方法提取的石材大板輪廓,通過這組圖像處理過程我們可以發(fā)現(xiàn),這類提取石材輪廓的方法適用于石材大板和圖像背景圖案有很大的區(qū)別的圖像,而且我們也可以看出這種方法的提取效果很好。

2.2.3 數(shù)學(xué)形態(tài)學(xué)處理

數(shù)學(xué)形態(tài)學(xué)(Mathematical Morphology)是由一組形態(tài)學(xué)的代數(shù)運(yùn)算子組成的,它的基本運(yùn)算有4個(gè):膨脹(或擴(kuò)張)、腐蝕(或侵蝕)、開啟和閉合,它們在二值圖像和灰度圖像中各有特點(diǎn)。數(shù)字圖像處理中的形態(tài)學(xué)處理是指將數(shù)字形態(tài)學(xué)作為工具從圖像中提取對于表達(dá)和描繪區(qū)域形狀有用處的圖像分量,比如邊界、骨架以及凸殼,還包括用于預(yù)處理或后處理的形態(tài)學(xué)過濾、細(xì)化和修剪等[3]。

本文采用的是閉運(yùn)算,先膨脹,反復(fù)膨脹后得到需要的狀態(tài),如圖6(2)所示。很明顯邊界得到了擴(kuò)張,于是逐步進(jìn)行腐蝕,以恢復(fù)原始邊界,如圖6(3)所示。最后提取石材大板輪廓,如圖6(4)所示。輪廓提取是接下來計(jì)算石材大板尺寸的基礎(chǔ),最終實(shí)現(xiàn)在線測量尺寸。

3、結(jié)論

本文介紹了石材大板在線測量系統(tǒng)的重要階段,先后介紹了圖像的灰度化處理、平滑處理、二值化、圖像分割和數(shù)學(xué)形態(tài)學(xué)處理的相關(guān)原理及算法,提取了石材大板的邊緣輪廓信息。本文的設(shè)計(jì)為石材領(lǐng)域的發(fā)展提供了一個(gè)創(chuàng)新點(diǎn),將其應(yīng)用到現(xiàn)有石材加工設(shè)備上可以實(shí)現(xiàn)石材加工自動(dòng)化水平,解決了國內(nèi)石材企業(yè)針對不規(guī)則外型的石材大板不能進(jìn)行實(shí)時(shí)測量的困擾,提高了生產(chǎn)效率和經(jīng)濟(jì)效益。

計(jì)算機(jī)視覺論文:基于圖像處理與計(jì)算機(jī)視覺的車輛四輪定位儀的設(shè)計(jì)與實(shí)現(xiàn)

摘 要: 針對傳統(tǒng)四輪定位儀精度不高、操作復(fù)雜的問題,設(shè)計(jì)了一套基于圖像處理與計(jì)算機(jī)視覺的車輛四輪定位儀,給出了該儀器基于2D平面靶標(biāo)的攝像機(jī)定標(biāo)方法及攝像頭拍攝連續(xù)圖像的處理方法。最后分析了該車輛四輪定位儀的工作過程及工作原理,并與手工測量的車輛四輪定位參數(shù)進(jìn)行了對比實(shí)驗(yàn),實(shí)驗(yàn)結(jié)果表明基于圖像處理與計(jì)算機(jī)視覺的車輛四輪定位儀的設(shè)計(jì)理論和方法都是正確的。

關(guān)鍵詞: 計(jì)算機(jī)視覺; 攝像機(jī)定標(biāo); 圖像處理; 四輪定位

0 引 言

隨著汽車行駛速度的加快,影響車輛安全性的車輪定位參數(shù)就越發(fā)的重要。當(dāng)車軸、轉(zhuǎn)向機(jī)構(gòu)和車架發(fā)生磨損和變形[1]后,車輪定位將會(huì)失準(zhǔn)從而影響車輛的安全性。但現(xiàn)有的四輪定位儀精度不高、操作復(fù)雜,嚴(yán)重的影響了車輪定位調(diào)校的效率[2?4]。

針對上述問題,設(shè)計(jì)了一套基于圖像處理與計(jì)算機(jī)視覺的車輛四輪定位儀。給出了該儀器基于2D平面靶標(biāo)的攝像機(jī)定標(biāo)方法及攝像頭拍攝連續(xù)圖像的處理方法,并分析了該四輪定位儀的工作原理,最后通過實(shí)驗(yàn)證明了該儀器設(shè)計(jì)理論和測量方法的正確性。

1 基于2D平面靶標(biāo)的攝像機(jī)定標(biāo)

1.1 圖像坐標(biāo)系、攝像機(jī)坐標(biāo)系與世界坐標(biāo)系

攝像機(jī)拍攝的圖像采用標(biāo)準(zhǔn)電視信號的形式存儲(chǔ)于計(jì)算機(jī)中,然后計(jì)算機(jī)使用數(shù)模板轉(zhuǎn)換為數(shù)字圖像。在圖1所示的直角坐標(biāo)系[(u,v)]中,各像素的坐標(biāo)[(u,v)]表示該像素在整個(gè)數(shù)組中的列數(shù)編碼和行數(shù)編碼。但并沒有物理單位能夠表示出該像素在整幅圖像中的具體位置,所以還需創(chuàng)建以物理單位為刻度的圖像坐標(biāo)系。圖像坐標(biāo)系以圖像內(nèi)一點(diǎn)作為坐標(biāo)原點(diǎn),其中[x]軸 與[u]軸平行,[y]軸與[v]軸平行,具體如圖1所示,[(u,v)]表示以像素作為單位的圖像坐標(biāo)系,[(x,y)]表示以物理單位毫米作為單位的圖像坐標(biāo)系,兩個(gè)坐標(biāo)系均為圖像坐標(biāo)系,但所采用的坐標(biāo)單位不同。

攝像機(jī)的光心為[O]點(diǎn),攝像機(jī)的光軸為[zc]軸,垂直于圖像平面,[xc]軸與圖像坐標(biāo)系的[x]軸平行,[yc]軸與圖像坐標(biāo)系的[y]軸平行。圖像坐標(biāo)系的坐標(biāo)原點(diǎn)為圖像平面和光軸的交點(diǎn),[xc]軸,[yc]軸和[zc]軸與點(diǎn)[O]組成的坐標(biāo)系即為攝像機(jī)坐標(biāo)系,[OO1]即為攝像機(jī)焦距。

1.2 基于2D平面靶標(biāo)的攝像機(jī)定標(biāo)

由于3D立體靶標(biāo)加工精度受到一定的限制且制作成本較高,此處采用2D平面靶進(jìn)行攝像機(jī)定標(biāo)[5]。在定標(biāo)過程中,攝像機(jī)以多于兩個(gè)方位對同一個(gè)平面靶標(biāo)進(jìn)行拍攝,平面靶標(biāo)和攝像機(jī)均能夠自由移動(dòng)且無需知曉其運(yùn)動(dòng)參數(shù)。在定標(biāo)過程中,攝像機(jī)內(nèi)部參數(shù)始終為定常數(shù),僅外部參數(shù)發(fā)生變化。

2 圖像處理

為了降低圖像的噪聲干擾,靶盤為黑底,上面有若干個(gè)白色圓斑,并以圓心作為特征點(diǎn),為了取得特征點(diǎn)(白色橢圓中心)的二維圖像坐標(biāo),首先進(jìn)行圖像閾值分割,然后完成邊緣檢測,最后尋找特征點(diǎn)坐標(biāo)[6]。四輪定位系統(tǒng)工作中拍攝的靶盤圖像如圖3所示。

2.1 圖像閾值分割和邊緣檢測

根據(jù)實(shí)際觀測,將閾值設(shè)置為150,則閾值分割處理后的結(jié)果如圖4所示。

2.2 Hough變換求取橢圓參數(shù)

對于平面上的任意橢圓,設(shè)橢圓圓心為點(diǎn)[c,]在平面上任取一點(diǎn)[p,]則點(diǎn)[p]距橢圓上任意點(diǎn)的最大距離必然大于點(diǎn)[c]距橢圓上任意點(diǎn)的最大距離。根據(jù)橢圓的該性質(zhì),可以通過尋找平面內(nèi)距橢圓上任意點(diǎn)的最大距離數(shù)值最小的點(diǎn)來確定橢圓圓心,而且找到的這個(gè)最大距離的最小值即為橢圓的長軸長度。通過該方法,可以得到橢圓長、短軸長,橢圓圓心點(diǎn)橫、縱坐標(biāo)和旋轉(zhuǎn)角度5個(gè)參數(shù)中的3個(gè),剩下的2個(gè)橢圓參數(shù)就能夠通過Hough變換的方法求得,算法的具體實(shí)現(xiàn)步驟如下:

(1) 首先對需處理的圖像完成邊緣檢測,取得二值化的圖像邊緣輪廓,將邊緣輪廓圖上的各點(diǎn)數(shù)據(jù)存入數(shù)組[A;]

(2) 針對二維平面上的所有點(diǎn),分別計(jì)算與上步中得到的數(shù)組[A]中點(diǎn)的距離,得到所有點(diǎn)與數(shù)組[A]中點(diǎn)的最大距離,在計(jì)算的最大距離中的最小值對應(yīng)的點(diǎn)就是橢圓圓心的橫縱坐標(biāo)[p,q,]該最大距離就是橢圓長軸的長度[a;]

(3) 將第一步中數(shù)組[A]所有點(diǎn)的數(shù)值與橢圓參數(shù)[p,q,a]代入橢圓方程[E,]橢圓方程為:

然后在二維空間內(nèi)對參數(shù)[b,θ]進(jìn)行統(tǒng)計(jì)分析,得到一組峰值大于一定閾值的參數(shù)即為橢圓的參數(shù)。

2.3 特征點(diǎn)三維坐標(biāo)求取

通過前面的分析可知,當(dāng)靶盤上圓的實(shí)際大小與圖像上橢圓長、短軸尺寸都知道時(shí),攝像機(jī)與圓心間的距離為:

式中:[F]表示攝像機(jī)鏡頭的焦距;[P]表示圓半徑;[A]表示橢圓長軸長度,[A=μ×N,][μ]表示像元尺寸,[N]表示圖像中橢圓長軸的長度,單位為像素。

根據(jù)式(3)世界坐標(biāo)系與圖像坐標(biāo)系的關(guān)系,可以通過求解該方程得到特征點(diǎn)坐標(biāo)[(xw,yw,zw)。]此處選取測量靶盤中相距0.075 m的兩圓心的距離進(jìn)行實(shí)驗(yàn),攝像機(jī)拍到的照片如圖6所示。

3 四輪定位儀的工作流程及原理

3.1 工作流程

基于圖像處理與計(jì)算機(jī)視覺的車輛四輪定位系統(tǒng)由兩臺(tái)數(shù)字?jǐn)z相機(jī)、計(jì)算機(jī)主機(jī)和四個(gè)靶盤組成,具體如圖7所示。

攝像機(jī)僅能獲取單側(cè)靶盤的圖像,紅外線由特制的光源發(fā)射,靶盤接收到紅外線后,將其反射至高性能數(shù)字?jǐn)z像機(jī)成像,攝像機(jī)依據(jù)獲取的圖像通過計(jì)算得出相機(jī)與目標(biāo)之間的距離,然后將數(shù)據(jù)處理后就能夠得出車輪的定位參數(shù),車輪定位參數(shù)的測量流程具體如下:將汽車放置于舉升機(jī)上,使汽車進(jìn)入攝像機(jī)的拍攝視角范圍;打開攝像機(jī),固定方向盤后推動(dòng)汽車行駛,然后拍攝行駛中的靶盤;根據(jù)攝像機(jī)拍攝到的圖像(三幅以上)計(jì)算出車輪的外傾角和前束角;將汽車整體固定使其無法前后移動(dòng),轉(zhuǎn)動(dòng)方向盤,獲取車輪轉(zhuǎn)動(dòng)過程中靶盤的圖像,然后計(jì)算出主銷后傾角和內(nèi)傾角。

3.2 建立測量基準(zhǔn)平面?車身平面

在汽車行駛過程中,靶盤本身是傾斜的,車輛前輪兩個(gè)旋轉(zhuǎn)中心點(diǎn)即為汽車前輪定位平面;同樣,車輛后輪兩個(gè)旋轉(zhuǎn)中心點(diǎn)即為后輪定位平面。這兩個(gè)面作為整個(gè)四輪定位測量系統(tǒng)的基準(zhǔn)平面,其優(yōu)點(diǎn)是該平面無需依賴于重力和重力傳感器。所以,在車輛行駛過程中,不論車輛是前后傾斜還是左右傾斜,都不會(huì)影響車輪定位參數(shù)的測量[7]。

3.3 汽車定位參數(shù)數(shù)學(xué)模型的建立

靶盤固定于車輪,所以可將靶盤和車輪當(dāng)做一個(gè)剛體來分析,車輪的運(yùn)動(dòng)可分解為平動(dòng)和旋轉(zhuǎn)兩個(gè)分運(yùn)動(dòng)。由于車輪的旋轉(zhuǎn)軸與車輪輪面垂直,所以可將車輪前束角和外傾角看作是車輪旋轉(zhuǎn)軸與各坐標(biāo)軸間的夾角。

由于汽車前輪上安裝的兩靶盤是完全相同的,且其能夠與車輪共同當(dāng)做一個(gè)剛體處理[8],汽車車輪運(yùn)動(dòng)驅(qū)動(dòng)靶盤運(yùn)動(dòng),將靶盤的運(yùn)動(dòng)分解成平移運(yùn)動(dòng)和旋轉(zhuǎn)運(yùn)動(dòng),同時(shí)假設(shè)靶盤先平移后旋轉(zhuǎn)。在靶盤的旋轉(zhuǎn)過程中,車輪滾動(dòng)一圈,則靶盤上所有白色圓心的運(yùn)動(dòng)軌跡均是圓。但在四輪定位儀的實(shí)際測量中,車輪滾動(dòng)軌跡達(dá)不到一圈,靶盤圓心軌跡是一段弧,但仍能夠通過圓弧上任意三點(diǎn)求出軌跡圓心。在車輪的平動(dòng)過程中,左右靶盤上同一位置的白色圓心的連線隨車輪平動(dòng)形成前輪定位平面,后輪則形成后輪定位平面。

在汽車轉(zhuǎn)向過程中,車輪繞主銷旋轉(zhuǎn),通過旋轉(zhuǎn)前后靶盤特征點(diǎn)的坐標(biāo)變化就能夠得出主銷軸線本身與[X,Y,Z]軸間的夾角[α,β,γ,]進(jìn)一步就可求出主銷后傾角和內(nèi)傾角,具體求解示意圖如圖9所示。

4 實(shí) 驗(yàn)

為了驗(yàn)證本文所設(shè)計(jì)的車輪定位儀的準(zhǔn)確性,選取車輪外傾角和前束角進(jìn)行了實(shí)驗(yàn)。實(shí)驗(yàn)通過車輪外傾角和前束角的變化,從四輪定位儀中輸出各定位參數(shù)的變化,同時(shí)選取手工測量作為對比數(shù)據(jù)。各組實(shí)驗(yàn)數(shù)據(jù)如表2~表4所示。

5 結(jié) 論

針對傳統(tǒng)四輪定位儀精度不高、操作復(fù)雜這一問題,設(shè)計(jì)了一套基于圖像處理與計(jì)算機(jī)視覺的車輛四輪定位儀。給出了該儀器的設(shè)計(jì)方法并進(jìn)行了測量精度實(shí)驗(yàn),實(shí)驗(yàn)結(jié)果表明所設(shè)計(jì)的四輪定位儀操作簡單并具有較高的精度。但為了進(jìn)一步提高儀器的測量精度,后續(xù)還要對圖像質(zhì)量和圖像處理算法進(jìn)行改進(jìn),并提高攝像機(jī)的定標(biāo)精度。

計(jì)算機(jī)視覺論文:陌上花“衣+”:人工智能計(jì)算機(jī)視覺引擎

時(shí)展日新月異,人們的生活也瞬息萬變。人們每天會(huì)接受到很多視覺信息,隨著時(shí)間的流逝,城市中的每一處光影、每一個(gè)街角,都定格著屬于它的美好?!耙?” (北京陌上花科技有限公司)人工智能計(jì)算機(jī)視覺引擎將AR(增強(qiáng)現(xiàn)實(shí))和AI(人工智能)融合,會(huì)讓你眼中的世界完全不同,它更智能化、更懂你的需求,把你所看到的視覺信息經(jīng)過人工智能“大腦系統(tǒng)”處理后,通過AR展現(xiàn)和交互,帶給你更多全新的驚喜與感動(dòng)。

小時(shí)候,我們都有過這樣的夢想:生活實(shí)景都變成游戲,隨時(shí)隨地看到的場景、人物、好看的好吃的好玩的都能動(dòng)起來,穿越時(shí)空,虛擬和現(xiàn)實(shí)世界夢幻疊加?!耙?”將AR技術(shù)和人工智能技術(shù)深度結(jié)合,使用復(fù)雜的計(jì)算機(jī)視覺技術(shù)和深度學(xué)習(xí)算法,去理解場景,然后增強(qiáng)場景,幫你達(dá)成這個(gè)愿望。仿佛擁有一雙慧眼+超強(qiáng)大腦,而且這只是“衣+”暫時(shí)制定的一個(gè)小目標(biāo)而已。

AR技術(shù)是通過計(jì)算機(jī)系統(tǒng)提供的信息疊加用戶對現(xiàn)實(shí)世界感知的技術(shù),將虛擬的信息應(yīng)用到真實(shí)世界,并將計(jì)算機(jī)生成的虛擬物體、場景或系統(tǒng)提示信息疊加到真實(shí)場景中,從而實(shí)現(xiàn)對現(xiàn)實(shí)的增強(qiáng)。更通俗一點(diǎn)的說法是,它是一種全新的人機(jī)交互技術(shù),利用攝像頭、傳感器、實(shí)時(shí)計(jì)算和匹配技術(shù),將真實(shí)的環(huán)境和虛擬的物體實(shí)時(shí)地疊加到同一個(gè)畫面或空間。用戶可以通過虛擬現(xiàn)實(shí)系統(tǒng)感受到在客觀物理世界中所經(jīng)歷的“身臨其境”的逼真性,還能突破空間、時(shí)間,以及其他客觀限制,感受到在真實(shí)世界中無法親身經(jīng)歷的體驗(yàn)。

“衣+”是世界領(lǐng)先的人工智能計(jì)算機(jī)視覺引擎,致力于讓計(jì)算機(jī)看懂世界,屬于人工智能中的感知和認(rèn)知智能,在圖像視頻中對場景、通用物體、商品、人臉的檢測、識別、理解、搜索及推薦均達(dá)到領(lǐng)先水平。陌上花自主研發(fā)的深層次多屬性深度學(xué)習(xí)網(wǎng)絡(luò),是人工智能在云和端上計(jì)算的核心基礎(chǔ)。在國際頂級計(jì)算機(jī)視覺競賽ImageNet2015和ImageNet2016中,先后獲得五項(xiàng)和三項(xiàng)世界第一。

“衣+”技術(shù)團(tuán)隊(duì)正在做這樣一個(gè)嘗試,利用AR技術(shù)結(jié)合人工智能大數(shù)據(jù)技術(shù)感知認(rèn)知世界,并增強(qiáng)了交互方式,這將大大改變?nèi)藗兊纳?,將深度學(xué)習(xí)的人工智能科技和AR技術(shù)相結(jié)合應(yīng)用到視頻、直播、時(shí)尚、購物、美食、出行、運(yùn)動(dòng)、旅行等生活體驗(yàn)的各個(gè)方面,提供全生活場景智能服務(wù),打造前所未有的智能視覺體驗(yàn)。

增強(qiáng)現(xiàn)實(shí)技術(shù),不僅展現(xiàn)了真實(shí)世界的信息,而且將虛擬的信息同時(shí)顯示出來,兩種信息相互補(bǔ)充、疊加。在視覺化的增強(qiáng)現(xiàn)實(shí)中,用戶利用AR設(shè)備,把真實(shí)世界與電腦圖形合成在一起。“衣+”AR技術(shù)結(jié)合人工智能,以計(jì)算機(jī)視覺技術(shù)為基礎(chǔ)實(shí)現(xiàn)感知認(rèn)知,能將人眼看到的所有信息,包括商品、物體、食物、服飾、汽車、建筑等,都精準(zhǔn)匹配出同款及相關(guān)商品。它的展現(xiàn)方式更加生動(dòng)、立體、多樣化,能夠帶給用戶高品質(zhì)、高時(shí)效、一站式的服務(wù)體驗(yàn)。

“衣+”AR技術(shù)和人工智能的結(jié)合實(shí)現(xiàn)了對現(xiàn)實(shí)世界的感知和認(rèn)知的能力,可以在圖像視頻中完成對場景、通用物體、商品、人臉的檢測、識別、理解、搜索等。如今,每個(gè)月有上億次的商品推薦通過“衣+”邊看邊買引擎來完成,幫助用戶搜索、識別他們所看到的物品。目前“衣+”支持服飾、3C數(shù)碼、商超、家居、日用品、交通工具等超過幾百類商品的檢測和識別。

通過對海量數(shù)據(jù)進(jìn)行深度學(xué)習(xí),“衣+”視覺引擎能夠檢測識別視頻或圖像中的商品,并通過分析商品特征,準(zhǔn)確判斷商品類目等商品信息。在餐飲方面,當(dāng)用戶用不同的手持終端對餐廳的食品進(jìn)行拍攝后,餐廳的位置以及菜品的食材等將即刻呈現(xiàn)在手持終端上,使就餐體驗(yàn)的科技含量越來越高。

此外,“衣+”利用技術(shù)手段可以實(shí)現(xiàn)對視頻和圖像中的物體的位置、名稱、運(yùn)動(dòng)軌跡、輪廓等屬性的實(shí)時(shí)分析。目前已支持超過10000類常用物體、大于400類室內(nèi)外場景的識別。

利用深度學(xué)習(xí)技術(shù),“衣+”還可以在視頻、圖像中實(shí)現(xiàn)人臉關(guān)鍵點(diǎn)檢測,可用于相機(jī)、直播等多種娛樂場景。讓場景營銷變得更自然、更直觀、更有趣味。“衣+”人臉屬性識別,可以準(zhǔn)確識別出人物的性別、年齡、種族、情緒、顏值、性感、時(shí)尚等屬性信息,平均準(zhǔn)確率超過93%?;谏疃葘W(xué)習(xí)的人臉對比技術(shù),實(shí)現(xiàn)人臉相似度測量,可用于人臉聚類、敏感人物監(jiān)控等場景。這一切,都是在人工智能計(jì)算機(jī)視覺搜索引擎中實(shí)時(shí)完成。

目前,AR技術(shù)越來越火熱,并將全面融入人們的日常生活。目前,“衣+”和阿里云、華為、優(yōu)酷土豆、微博、360、華數(shù)、京東、天貓魔盒、CIBN、英偉達(dá)、趣拍、花椒等數(shù)十家頂級機(jī)構(gòu)深度合作,通過提供邊看邊買引擎、圖像視頻內(nèi)容分析引擎、人臉屬性分析引擎服務(wù)海量用戶,同時(shí)幫助用戶實(shí)現(xiàn)場景營銷、智能分析和內(nèi)容互動(dòng)。AR技術(shù)與人工智能相融合的市場將快速增長?!耙?”也將不斷利用無處不在的AR技術(shù)和人工智能技術(shù),創(chuàng)造一個(gè)智能世界,將生活中的美好愿望變?yōu)楝F(xiàn)實(shí)。

計(jì)算機(jī)視覺論文:計(jì)算機(jī)視覺在交通領(lǐng)域的應(yīng)用

摘 要

在我國市場經(jīng)濟(jì)不斷發(fā)展的盛況下,我國科技發(fā)展水平也緊隨其后,成為世界上的科技強(qiáng)國之一。在計(jì)算機(jī)水平的不斷提高下,計(jì)算機(jī)視覺技術(shù)應(yīng)運(yùn)而生。其中,計(jì)算機(jī)視覺技術(shù)被應(yīng)用與各個(gè)領(lǐng)域,并在各個(gè)領(lǐng)域都得到廣泛有效的應(yīng)用,比如軍事領(lǐng)域、醫(yī)療領(lǐng)域、工業(yè)領(lǐng)域等。本文針對計(jì)算機(jī)視覺技術(shù)在交通領(lǐng)域中的應(yīng)用進(jìn)行分析。

【關(guān)鍵詞】計(jì)算機(jī)視覺 交通領(lǐng)域 探究

近年來,隨著科技水平的提高,計(jì)算機(jī)視覺技術(shù)逐漸被人們熟知并廣泛應(yīng)用。相較于其他傳感器來說,視覺能獲得更多的信息。因此,在我國交通領(lǐng)域中,也對計(jì)算機(jī)視覺技術(shù)進(jìn)行研究完善,將計(jì)算機(jī)視覺技術(shù)應(yīng)用在交通領(lǐng)域各個(gè)方面中,并取得了顯著的成效。

1 計(jì)算機(jī)視覺的概述及基本體系結(jié)構(gòu)

1.1 計(jì)算機(jī)視覺概述

通過使用計(jì)算機(jī)和相關(guān)設(shè)備,對生物視覺進(jìn)行模擬的方式,就是計(jì)算機(jī)視覺。對采集到的圖片或視頻進(jìn)行相應(yīng)的技術(shù)處理,從而獲得相應(yīng)的三維信息場景,是計(jì)算機(jī)視覺的主要任務(wù)。

計(jì)算機(jī)視覺是一門學(xué)問,它就如何通過計(jì)算機(jī)和照相機(jī)的運(yùn)用,使人們獲得被拍攝對象的數(shù)據(jù)與信息所需等問題進(jìn)行研究。簡單的說,就是讓計(jì)算機(jī)通過人們給其安裝上的“大腦”和“眼睛”,對周圍環(huán)境進(jìn)行感知。

計(jì)算機(jī)視覺是一門綜合性學(xué)科,在各個(gè)領(lǐng)域都有所作為,已經(jīng)吸引了各個(gè)領(lǐng)域的研究者對其研究。同時(shí),計(jì)算機(jī)視覺也是科學(xué)領(lǐng)域中一個(gè)具有重要挑戰(zhàn)性的研究。

1.2 計(jì)算機(jī)視覺領(lǐng)域基本體系結(jié)構(gòu)

提出第一個(gè)較為完善的視覺系統(tǒng)框架的是Marr,他從信息處理系統(tǒng)角度出發(fā),結(jié)合圖像處理、心理物理學(xué)等多領(lǐng)域的研究成果,提出被計(jì)算機(jī)視覺工作者基本接受的計(jì)算機(jī)視覺系統(tǒng)框架。在此基礎(chǔ)上,研究者們針對視覺系統(tǒng)框架的各個(gè)角度、各個(gè)階段、各個(gè)功能進(jìn)行分析研究,得出了計(jì)算機(jī)視覺系統(tǒng)的基本體系結(jié)構(gòu),如圖1。

2 計(jì)算機(jī)視覺在交通領(lǐng)域的應(yīng)用

2.1 牌照識別

車輛的唯一身份是車輛牌照。在檢測違規(guī)車輛、稽查被盜車輛和管理停車場工作中,車輛牌照的有效識別與檢測具有重要的作用和應(yīng)用價(jià)值。然而在實(shí)際應(yīng)用工作中,雖然車牌識別技術(shù)相對成熟,但是由于受到拍攝角度、光照、天氣等因素的影響,車牌識別技術(shù)仍需改善。車牌定位技術(shù)、車牌字符識別技術(shù)和車牌字符分割技術(shù)是組成車牌識別技術(shù)的重要部分。

2.2 車輛檢測

目前,城市交通路口處紅綠燈的間隔時(shí)間是固定不變的,但是受交通路口的位置不同、時(shí)間不同的影響,每個(gè)交通路口的交通流量也是持續(xù)變化的。此外,對于某些交通區(qū)域來說,公共資源的配備,比如交通警察、交通車輛的數(shù)量是有限的。如果能根據(jù)計(jì)算機(jī)視覺技術(shù),對交通路口的不同時(shí)間、不同位置的交通情況進(jìn)行分析計(jì)算,并對交通流量進(jìn)行預(yù)測,有利于為交通警察縮短出警時(shí)間、為交通路口的紅綠燈根據(jù)實(shí)際情況設(shè)置動(dòng)態(tài)變化等技術(shù)提供支持。

2.3 統(tǒng)計(jì)公交乘客人數(shù)

城市公共交通的核心內(nèi)容是城市公交調(diào)度問題,一個(gè)城市如何合理的解決公交調(diào)度問題,是緩解城市運(yùn)力和運(yùn)量矛盾,緩解城市交通緊張的有效措施。城市公交調(diào)度問題,為公交公司與乘客的平衡利益,為公交公司的經(jīng)濟(jì)利益和社會(huì)效益的提高做出了巨大的貢獻(xiàn)。由于在不同的地域、不同的時(shí)間,公交客流會(huì)存在不均衡性,高峰時(shí)段的公交乘客過多,平峰時(shí)段的公交乘客過少,造成了公交調(diào)度不均衡問題,使有限資源浪費(fèi)嚴(yán)重。在計(jì)算機(jī)視覺智能公交系統(tǒng)中,自動(dòng)乘客計(jì)數(shù)技術(shù)是其關(guān)鍵技術(shù)。自動(dòng)乘客計(jì)數(shù)技術(shù),是對乘客上下車的時(shí)間和地點(diǎn)自動(dòng)收集的最有效的技術(shù)之一。根據(jù)其收集到的數(shù)據(jù),從時(shí)間和地點(diǎn)兩方面對客流分析,為城市公交調(diào)度進(jìn)行合理的安排。

2.4 對車道偏離程度和駕駛員工作狀態(tài)判斷

交通事故的發(fā)生率隨著車輛數(shù)量的增加而增加。引發(fā)交通事故的重要因素之一就是駕駛員疲勞駕駛。據(jù)相關(guān)數(shù)據(jù)顯示,因車道偏離導(dǎo)致的交通事故在40%以上。其中,駕駛員的疲勞駕駛就是導(dǎo)致車道偏離的主要原因。針對此種現(xiàn)象,為減少交通事故的發(fā)生,計(jì)算機(jī)視覺中車道偏離預(yù)警系統(tǒng)被研究開發(fā)并被廣泛應(yīng)用。針對駕駛員眨眼頻率,利用計(jì)算機(jī)視覺對駕駛員面部進(jìn)行圖像處理和分析,再根據(jù)疲勞駕駛關(guān)注度與眨眼頻率的關(guān)系,對駕駛員的工作狀態(tài)進(jìn)行判斷。此外,根據(jù)道路識別技術(shù),對車輛行駛狀態(tài)進(jìn)行檢測,也是判斷駕駛員工作狀態(tài)的方法之一。這兩種方法,是目前基于計(jì)算機(jī)視覺的基礎(chǔ)上,檢測駕駛員疲勞狀態(tài)的有效方法。

2.5 路面破損檢測

最常見的路面損壞方式就是裂縫。利用計(jì)算機(jī)視覺,及時(shí)發(fā)現(xiàn)路面破損情況,并在其裂縫程度嚴(yán)重之前進(jìn)行修補(bǔ),有利于節(jié)省維護(hù)成本,也避免出現(xiàn)路面坍塌,車輛凹陷的情況發(fā)生。利用計(jì)算機(jī)視覺進(jìn)行路面檢測,相較于之前人工視覺檢測相比,有效提高了視覺檢測的效率,增強(qiáng)了自動(dòng)化程度,提高了安全性,為市民的出行安全帶來了更高保障。

3 結(jié)論

本文從計(jì)算機(jī)視覺的概述,及計(jì)算機(jī)視覺基本體系結(jié)構(gòu),和計(jì)算機(jī)視覺在交通領(lǐng)域中的應(yīng)用三面進(jìn)行分析,可見計(jì)算機(jī)視覺在交通領(lǐng)域中的廣泛應(yīng)用,在交通領(lǐng)域中應(yīng)用的有效性、顯著性,以此可得計(jì)算機(jī)視覺在現(xiàn)展過程中的重要性。隨著計(jì)算機(jī)視覺技術(shù)的越來越成熟,交通領(lǐng)域的檢測管理一定會(huì)加嚴(yán)格,更加安全。

計(jì)算機(jī)視覺論文:計(jì)算機(jī)視覺技術(shù)的推廣與應(yīng)用

【摘要】由于計(jì)算機(jī)技術(shù)的不斷發(fā)展,計(jì)算機(jī)視覺技術(shù)也得到了很大的發(fā)展。從產(chǎn)生的時(shí)間來看,計(jì)算機(jī)視覺產(chǎn)生于上個(gè)世紀(jì)中葉,當(dāng)時(shí)它的主要工作內(nèi)容是進(jìn)行統(tǒng)計(jì)模式識別,較為簡單,目前為止已經(jīng)經(jīng)過了長時(shí)間的發(fā)展,工作內(nèi)容明顯增加,依然發(fā)展為一門獨(dú)立的學(xué)科,而且在多個(gè)領(lǐng)域都得到了廣泛的應(yīng)用。對于人們的生活產(chǎn)生了很大的影響。本文主要是簡單介紹計(jì)算機(jī)視覺技術(shù)的發(fā)展歷程,并分析它在那些社會(huì)生產(chǎn)領(lǐng)域中得到了推廣以及應(yīng)用。

【關(guān)鍵詞】計(jì)算機(jī)視覺技術(shù) 推廣 應(yīng)用

在人工智能領(lǐng)域的研究中,計(jì)算機(jī)視覺是主要的研究對象之一,目前它已經(jīng)發(fā)展為一門獨(dú)立的科學(xué)學(xué)科,主要是對相關(guān)的理論以及技術(shù)進(jìn)行研究,從而建立一個(gè)完善的人工信息系統(tǒng)。

一、計(jì)算機(jī)視覺技術(shù)的產(chǎn)生與發(fā)展歷程

計(jì)算機(jī)視覺產(chǎn)生于20世紀(jì)50年代,其當(dāng)時(shí)主要的工作內(nèi)容為統(tǒng)計(jì)模式識別,尤其是需要進(jìn)行分析二維圖像的特點(diǎn)和作用,例如對航空圖片進(jìn)行研究、對顯微圖片進(jìn)行分析等。直至60年代初,Roberts使用計(jì)算機(jī)從大量的數(shù)字圖像當(dāng)中選取出棱柱體、長方體等物體的三維圖形,并且分析物體空間的主要特點(diǎn)。在70年代初期,視覺應(yīng)用系統(tǒng)開始得到應(yīng)用,然后過了幾十年之后,專家們已經(jīng)了解了機(jī)器視覺的特點(diǎn),并且開設(shè)了對應(yīng)的課程。到了80年代中期,計(jì)算機(jī)視覺已經(jīng)逐漸被人們應(yīng)用與工作和生活當(dāng)中。計(jì)算機(jī)技術(shù)的不斷發(fā)展,使得計(jì)算機(jī)視覺系統(tǒng)的實(shí)用性得以提升,現(xiàn)已被大量使用于機(jī)器人學(xué)、幾何計(jì)算等領(lǐng)域,直接影響著人們的生活。

二、計(jì)算機(jī)視覺技術(shù)的推廣與應(yīng)用領(lǐng)域

2.1應(yīng)用于工業(yè)生產(chǎn)領(lǐng)域

目前為止計(jì)算機(jī)視覺技術(shù)已經(jīng)普遍應(yīng)用于工業(yè)生產(chǎn)領(lǐng)域中,除了在工業(yè)探傷、檢測方面得到了推廣,而且還在辦公以及生產(chǎn)自動(dòng)化等各方面都得到了廣泛的應(yīng)用。一般來說在工業(yè)生產(chǎn)中推廣計(jì)算機(jī)視覺技術(shù),能夠在很大程度上提高自動(dòng)化程度,從而提高產(chǎn)品生產(chǎn)的效率,同時(shí)還能防止人工的失誤,導(dǎo)致不必要的損失。

2.2應(yīng)用于農(nóng)業(yè)生產(chǎn)領(lǐng)域中

從農(nóng)業(yè)生產(chǎn)領(lǐng)域的角度來看,計(jì)算機(jī)視覺技術(shù)的應(yīng)用也越愛越普遍,一方面主要是利用該技術(shù)全程監(jiān)測農(nóng)作物的生產(chǎn)過程,已達(dá)到預(yù)防病害蟲的作用,另一方面利用該技術(shù)對農(nóng)產(chǎn)品進(jìn)行檢測,以便對其進(jìn)行分類與分級。由于在農(nóng)業(yè)生產(chǎn)領(lǐng)域中利用計(jì)算機(jī)視覺技術(shù)能夠?qū)崿F(xiàn)自動(dòng)化管理,因此能夠減少大量的勞動(dòng)力,降低生產(chǎn)的人工成本,進(jìn)一步提高管理生產(chǎn)效率。

2.3應(yīng)用于社會(huì)公共安全領(lǐng)域中

社會(huì)公共安全是人們非常重視的一個(gè)問題,計(jì)算機(jī)視覺技術(shù)在這方面也得到了有效的應(yīng)用,不僅應(yīng)用于偵查、犯罪偵破工作中,而且還應(yīng)用于指紋配比、人臉合成等工作中。應(yīng)用這種技術(shù)能夠進(jìn)一步提高犯罪案件的偵破效率,避免更多的犯罪行為發(fā)生,從而影響人們的正常生活。

2.4應(yīng)用于視覺導(dǎo)航領(lǐng)域中

通過對計(jì)算機(jī)視覺技術(shù)進(jìn)行長時(shí)間的研究后,當(dāng)前已將之推廣于視覺導(dǎo)航領(lǐng)域中,主要是應(yīng)用于太空探測、航天飛行等方面,在此基礎(chǔ)上還應(yīng)用于巡航導(dǎo)彈制導(dǎo)、智能交通等方面。在視覺導(dǎo)航領(lǐng)域中,應(yīng)用計(jì)算機(jī)視覺技術(shù)可以解放大量的勞動(dòng)力,避免工作帶來的危險(xiǎn),而且還能有效提高工作效率。

2.5應(yīng)用于人機(jī)交互領(lǐng)域中

一般來說在人機(jī)交互領(lǐng)域中應(yīng)用計(jì)算機(jī)視覺技術(shù),可以通過人的肢體語言、人臉表情進(jìn)行測定,進(jìn)一步分析人的意愿,從而按照要求認(rèn)真完成指令,這樣不僅可以有效增加交互的方便性,而且還可以有效增加臨場感,具有其他技術(shù)不可替代的作用。

2.6應(yīng)用于虛擬現(xiàn)實(shí)領(lǐng)域中

當(dāng)前計(jì)算機(jī)視覺技術(shù)在虛擬現(xiàn)實(shí)領(lǐng)域中得到了推廣,利用這種技術(shù)可以進(jìn)行不同的軍隊(duì)?wèi)?zhàn)場場景模擬,在此基礎(chǔ)上還能對飛行員飛行、醫(yī)生手術(shù)等現(xiàn)場進(jìn)行模擬。總之,利用這種技術(shù)能夠帶給人們一種身臨其境的感覺,從而進(jìn)一步提高工作效率。

2.7應(yīng)用于衛(wèi)星遙感領(lǐng)域中

從衛(wèi)星遙感領(lǐng)域的角度來看,計(jì)算機(jī)視覺技術(shù)的應(yīng)用并不少見,不僅應(yīng)用于礦藏勘探、資源探測等方面,而且還應(yīng)用于氣象預(yù)報(bào)、自然災(zāi)害監(jiān)測等方面。一般來說衛(wèi)星遙感涉及的信息量非常大,而且類別也很多,分析識別工作稍不注意,就會(huì)出現(xiàn)錯(cuò)誤,而利用這種技術(shù)后,能夠快速、有效的進(jìn)行信息的收集以及分析工作,進(jìn)一步提高信息的準(zhǔn)確性。

三、結(jié)語

計(jì)算機(jī)視覺技術(shù)發(fā)展到現(xiàn)在,已經(jīng)在多個(gè)領(lǐng)域得到應(yīng)用與推廣,在虛擬現(xiàn)實(shí)、工農(nóng)業(yè)生產(chǎn)等眾多領(lǐng)域中隨處可見。而隨著社會(huì)的不斷進(jìn)步,市場對于計(jì)算機(jī)視覺技術(shù)的需求也越來越大,具有很大的發(fā)展?jié)摿?。為了能夠滿足市場增長的需求,使計(jì)算機(jī)視覺技術(shù)得到更廣泛的應(yīng)用,需要研發(fā)人員通過不斷的努力研制出更加完善的計(jì)算機(jī)視覺技術(shù)系統(tǒng),這是當(dāng)前科研工作的主要課題。

計(jì)算機(jī)視覺論文:基于OpenCV 的計(jì)算機(jī)視覺技術(shù)研究

摘要:該文基于OpenCV的計(jì)算機(jī)視覺技術(shù)進(jìn)行研究,探討了視頻中計(jì)算機(jī)對運(yùn)動(dòng)物體視覺檢測的原理,并對OpenCV的應(yīng)用情況進(jìn)行說明,闡述了基于OpenCV的計(jì)算機(jī)視覺技術(shù)體系,最終重點(diǎn)敘述了計(jì)算機(jī)視覺三維模擬技術(shù),以期能為相關(guān)工作提供參考。

關(guān)鍵詞:OpenCV;計(jì)算機(jī)視覺技術(shù);三維模擬技術(shù)

21世紀(jì)是國際計(jì)算機(jī)技術(shù)高度發(fā)展的時(shí)代,人們生活中的每個(gè)角落都可以看到計(jì)算機(jī)技術(shù)的身影,尤其是現(xiàn)代計(jì)算機(jī)視覺技術(shù)和圖像處理功能發(fā)展更加迅猛,各技術(shù)分支也逐漸趨于成熟。計(jì)算機(jī)視覺技術(shù)主要指的就是利用智能計(jì)算機(jī)系統(tǒng)來代替人類的眼睛對現(xiàn)實(shí)三維世界進(jìn)行辨識和理解,整個(gè)過程均是計(jì)算機(jī)自我學(xué)習(xí)的過程,而隨著這項(xiàng)技術(shù)研究的不斷深入,其不再僅僅包含計(jì)算機(jī)技術(shù)科學(xué),同時(shí)還涉獵了包括生理學(xué)、神經(jīng)學(xué)、物理學(xué)、應(yīng)用數(shù)學(xué)等多門學(xué)科,為人類科技的進(jìn)步提供了有效的動(dòng)力。

1 計(jì)算機(jī)對視頻中運(yùn)動(dòng)物體檢測的原理概述

在現(xiàn)代計(jì)算機(jī)技術(shù)基礎(chǔ)下,對視頻當(dāng)中的運(yùn)動(dòng)物體檢測原理主要包括兩種,分別是從微觀和宏觀的角度出發(fā)。其中宏觀檢測技術(shù)指的是當(dāng)計(jì)算機(jī)截取了視頻中的某一個(gè)圖像,其以整幅圖像為對象進(jìn)行檢測;微觀檢測技術(shù)是指在截取圖像后,根據(jù)實(shí)際需求對某一區(qū)域內(nèi)的圖像內(nèi)容進(jìn)行檢測。在計(jì)算機(jī)視覺技術(shù)實(shí)際應(yīng)用時(shí),其第一步就是對圖像的采集,第二步是對已經(jīng)采集的圖像進(jìn)行預(yù)分析處理,如果采用宏觀檢測技術(shù)則對圖像整體進(jìn)行分析;如果采用微觀檢測技術(shù)則首先將圖像進(jìn)行分割,然后對分割后各圖像內(nèi)容中出現(xiàn)的運(yùn)動(dòng)物體影像進(jìn)行分析。在圖像數(shù)據(jù)獲取過程中應(yīng)用的是背景差分法,這一技術(shù)主要是將背景和運(yùn)動(dòng)物體進(jìn)行分離提取,以獲取沒有背景圖像的運(yùn)動(dòng)物體影像數(shù)據(jù)。還可以利用幀間差分法,這種方法主要是對一個(gè)視頻圖像的逐幀畫面進(jìn)行差別比較,從而獲得各幀圖像上的差值,而將這些差值幀圖結(jié)合起來就是一個(gè)物體在計(jì)算機(jī)視覺下的運(yùn)動(dòng)軌跡。現(xiàn)代研究者更傾向于將背景和幀間差分法進(jìn)行結(jié)合運(yùn)用,這樣可以獲得無背景下的運(yùn)動(dòng)物體軌跡,進(jìn)而提升計(jì)算機(jī)視覺系統(tǒng)捕捉數(shù)據(jù)的準(zhǔn)確性。

2 OpenCV的應(yīng)用概述

OpenCV是現(xiàn)代計(jì)算機(jī)視覺技術(shù)當(dāng)中具有開源性的視覺庫,其最早是由俄羅斯Intel分公司所研發(fā),不僅高效,而且具有兼容的優(yōu)勢。同時(shí)與傳統(tǒng)IPL圖像處理系統(tǒng)相比,OpenCV所處理的圖像數(shù)據(jù)等級更高,例如在對運(yùn)動(dòng)物體進(jìn)行特征跟蹤、目標(biāo)分割、運(yùn)動(dòng)軌跡分析以及三維模型重建等方面都有著巨大的優(yōu)勢。

OpenCV本身編輯的源代碼是開放式的,編寫過程簡潔且方便,并且程序中大多數(shù)函數(shù)已經(jīng)通過了匯編的最優(yōu)化,使其能夠更加高效地被應(yīng)用。在使用OpenCV的攝像機(jī)標(biāo)定模塊已經(jīng)為用戶設(shè)計(jì)了實(shí)用性較強(qiáng)的接口,并且能夠支持Windows界面的操作平臺(tái),使得這一技術(shù)的操作更加簡便。這一技術(shù)本身操作簡便,對于編程人員和檢驗(yàn)人員個(gè)人技能素質(zhì)要求并不高,視覺技術(shù)系統(tǒng)研發(fā)人員可以利用簡便的操作來檢驗(yàn)其設(shè)想是否能夠?qū)崿F(xiàn),這就使得現(xiàn)代計(jì)算機(jī)視覺技術(shù)開發(fā)團(tuán)隊(duì)能夠形成更好的協(xié)作研發(fā)關(guān)系,進(jìn)一步提升技術(shù)研究效率。目前已知OpenCV編程系統(tǒng)在航空航天定位、衛(wèi)星地圖繪制、工廠大規(guī)模生產(chǎn)視覺檢測等方面得到了廣泛的應(yīng)用,同時(shí)對于無人飛行器的視覺捕捉技術(shù)也有極大的幫助。最為重要的是OpenCV編程語言的兼容性較強(qiáng),編程人員可以根據(jù)自己的意愿對源代碼進(jìn)行披露,并且國內(nèi)也已經(jīng)形成了規(guī)模較大的交流社區(qū),給更多同行業(yè)者提供答疑解惑的場所,進(jìn)一步擴(kuò)大了OpenCV的應(yīng)用范圍。

3 基于OpenCV的計(jì)算機(jī)視覺技術(shù)

3.1 基于OpenCV下的運(yùn)動(dòng)物體檢測技術(shù)

在常規(guī)運(yùn)動(dòng)物體檢測技術(shù)下,均是直接通過圖像背景和運(yùn)動(dòng)物體的區(qū)分來實(shí)現(xiàn)運(yùn)動(dòng)物體的捕捉。而基于OpenCV下的運(yùn)動(dòng)物體檢測技術(shù)則不僅能夠針對于圖像背景的分離實(shí)現(xiàn)運(yùn)動(dòng)物體的觀察,還可通過物體本身特定的信息來進(jìn)行檢測,主要包括形狀、輪廓以及顏色等。這樣就能夠?qū)崿F(xiàn)在復(fù)雜的背景當(dāng)中將特定的運(yùn)動(dòng)物體完整抽離出來。其基本流程包括:首先,對影像數(shù)據(jù)當(dāng)中某一時(shí)間點(diǎn)的圖像進(jìn)行捕捉,然后對這一視頻圖像的格式進(jìn)行轉(zhuǎn)化;其次,對轉(zhuǎn)化格式后的視頻圖像進(jìn)行早期處理,并將運(yùn)動(dòng)物體和復(fù)雜的背景區(qū)分開,降低周圍各環(huán)境因素對運(yùn)動(dòng)物體主體圖像的影響;第三,根據(jù)完成提取后的運(yùn)動(dòng)物體圖像進(jìn)行辨識,然后再從視頻當(dāng)中捕捉擁有相同特征的物體,并對該物體進(jìn)行跟蹤識別。而這一過程的實(shí)質(zhì)則在于先利用圖像捕捉技術(shù)對畫面進(jìn)行截取,然后同時(shí)利用背景差分法和幀間差分法對圖像進(jìn)行分割,逐幀地將運(yùn)動(dòng)物體完成提取出來,以供計(jì)算機(jī)進(jìn)行視覺跟蹤處理。

3.2 基于OpenCV的圖像預(yù)處理技術(shù)

一般情況下,計(jì)算機(jī)視覺處理技術(shù)應(yīng)用的環(huán)境情況較為復(fù)雜,大多數(shù)應(yīng)用環(huán)境當(dāng)中均有光照的變化,并且部分計(jì)算機(jī)視覺處理設(shè)備還需要在露天環(huán)境下進(jìn)行工作,此時(shí)周圍環(huán)境中的風(fēng)、溫度、光照、氣候以及運(yùn)動(dòng)物體數(shù)量等對視頻圖像的采集均有著極大的影響。環(huán)境因素會(huì)使圖像采集的質(zhì)量大幅度降低,同時(shí)圖像當(dāng)中的噪點(diǎn)問題也難以避免,而噪點(diǎn)是視覺捕捉和圖像處理當(dāng)中最大的影響因素。因此,在基于OpenCV下的計(jì)算機(jī)視覺技術(shù)在捕捉視頻圖像之后先對其進(jìn)行預(yù)處理,然后再由系統(tǒng)對運(yùn)動(dòng)物體進(jìn)行分離、檢測和跟蹤。一般的預(yù)處理過程主要包括平滑度濾波、圖像填充、背景實(shí)時(shí)更新等。

1)圖像的平滑度濾波預(yù)處理技術(shù)

由于在實(shí)際計(jì)算機(jī)視覺捕捉過程中圖像噪點(diǎn)是難以避免的問題,以此在對圖像中運(yùn)動(dòng)物體進(jìn)行檢測前,應(yīng)該相對這些噪點(diǎn)進(jìn)行預(yù)處理,降低環(huán)境噪聲對圖像的影響。圖像的平滑度濾波處理共分為兩種方式,分別為線性和非線性。其中線性處理方式就是通過計(jì)算機(jī)處理設(shè)備的簡單運(yùn)算,對圖像當(dāng)中的噪點(diǎn)進(jìn)行直接清除,但這一技術(shù)使用后會(huì)造成截獲圖像模糊不清的情況,因此僅對噪點(diǎn)較少的圖像采用該處理方式;非線性濾波處理則是利用復(fù)雜的圖像處理運(yùn)算,將截獲圖像當(dāng)中的噪點(diǎn)無限縮小,使其不對圖像整體造成影響,并且可以有效保證圖像的局部調(diào)整,但這種處理方式在運(yùn)算時(shí)速度沒有線性濾波處理快,因此需應(yīng)用在噪點(diǎn)較多,圖像信息較復(fù)雜的處理當(dāng)中。

2)圖像的填充預(yù)處理技術(shù)

這一處理技術(shù)在使用過程中運(yùn)算速度較慢,主要是由于其需要對逐幀的圖像均進(jìn)行處理,也包括兩種處理方式,分別為邊緣填充和腐蝕膨脹處理。其中邊緣填充處理主要指的是在確定運(yùn)動(dòng)物體之后,利用計(jì)算機(jī)系統(tǒng)自身的邊緣檢測處理技術(shù),對物體的輪廓進(jìn)行辨識,并利用形態(tài)學(xué)上的漫水填充方式對運(yùn)動(dòng)物體周圍的噪點(diǎn)進(jìn)行顏色填充,減小其對畫面整體元素的影響。而腐蝕膨脹處理與邊緣填充處理原理相類似,但這種處理技術(shù)主要是針對于噪點(diǎn)進(jìn)行腐蝕和膨脹,使其在畫面當(dāng)中所占比例擴(kuò)大,但對運(yùn)動(dòng)物體本身不造成影響,這使運(yùn)動(dòng)物體和噪點(diǎn)之間的差異就會(huì)更加明顯,就可以將噪點(diǎn)的影響降到最低,但這種處理方法的效果和攝像機(jī)本身的性能、質(zhì)量等有著密切的關(guān)聯(lián)。

3)背景的實(shí)時(shí)更新預(yù)處理技術(shù)

在進(jìn)行運(yùn)動(dòng)物體和背景分離過程中,計(jì)算機(jī)系統(tǒng)需要對圖像上的背景元素進(jìn)行辨識,并對其開展初始化處理,這樣就能夠?yàn)楹笃趯?shí)時(shí)背景圖像的差異進(jìn)行凸顯,以增加前景圖像的效果,降低噪點(diǎn)對圖像的影響。在運(yùn)用這一技術(shù)時(shí),首先要先對第一幀的圖像進(jìn)行確定,并將第一幀圖像當(dāng)中的背景圖像元素進(jìn)行辨識,然后在后期圖像更新和運(yùn)動(dòng)物體檢測過程中對背景進(jìn)行實(shí)時(shí)更新處理。在更新的過程中其流程主要包括:首先,系統(tǒng)要對所讀取的畫面進(jìn)行有效的判斷,了解該圖像是否為第一幀;其次,將Opencv處理的圖像轉(zhuǎn)變?yōu)閱瓮ǖ阑叶戎?;第三,對轉(zhuǎn)變后的圖像進(jìn)行高斯平滑度濾波處理,將圖像當(dāng)中的噪點(diǎn)進(jìn)行去除;第四,采用形態(tài)學(xué)噪點(diǎn)填充技術(shù)對圖像當(dāng)中的噪點(diǎn)進(jìn)行二次處理,以獲得所需要更新的背景圖像。

3.3 前景運(yùn)動(dòng)物體的提取技術(shù)

在計(jì)算機(jī)視覺技術(shù)進(jìn)行運(yùn)動(dòng)物體的檢測時(shí),只有有效保障檢測流程的準(zhǔn)確度,才能夠有效保障對前景運(yùn)動(dòng)物體的跟蹤效果。其主要分為兩大步驟,其一是對二值化后的圖像數(shù)據(jù)進(jìn)行分割處理;其二是在圖像分析前對其進(jìn)行充分的填充處理,保證前景圖數(shù)據(jù)的完整性。同時(shí),在前景圖像提取的過程中也分為多個(gè)步驟,其包括:首先,對所提出的前景圖像和背景圖像進(jìn)行差分處理;其次,將差分處理后的圖像二值化處理;第三,對背景當(dāng)中前景物體的輪廓或邊緣進(jìn)行辨識,根據(jù)前景圖像的輪廓對其進(jìn)行填充。由于在實(shí)際操作過程中,攝像頭所處環(huán)境的變化較大,并且會(huì)在不同場所內(nèi)的不同角度捕捉畫面,因此就需要在前景圖像提取時(shí)有效提高背景圖像實(shí)時(shí)更新的效果。

利用閥值二值化的分割方式能夠有效將前景圖像和背景圖像分離開,從而使目標(biāo)運(yùn)動(dòng)物體能夠呈現(xiàn)獨(dú)立化,并且閥值分割方式開展前要相對每個(gè)像素點(diǎn)進(jìn)行確定,判斷其是否位于灰度值的范圍內(nèi)。而將該圖像的像素灰度和閥值進(jìn)行對比后會(huì)出現(xiàn)兩種結(jié)果,分別是灰度值低于或高于閥值。在實(shí)際應(yīng)用過程中,有效確定圖像的分割閥值T,就能夠降低環(huán)境當(dāng)中光照因素對圖像質(zhì)量的影響。

4 計(jì)算機(jī)視覺技術(shù)當(dāng)中的三維重建技術(shù)

1)三維重建的視覺系統(tǒng)

計(jì)算機(jī)視覺技術(shù)在對圖像進(jìn)行捕捉時(shí)可以視為是對大量的圖像信息進(jìn)行處理,從攝像機(jī)的視覺角度出發(fā),其所輸入的圖像一般為二維屬性,但輸出的信息確是三維數(shù)據(jù),而這種三維空間數(shù)據(jù)能夠提升對運(yùn)動(dòng)物體所處空間位置、距離等描述的準(zhǔn)確性。在三維重建視覺系統(tǒng)工作過程中,其相對基本的圖像數(shù)據(jù)框架進(jìn)行確定,然后利用一個(gè)坐標(biāo)點(diǎn)建立2.5D圖像數(shù)據(jù),即以此點(diǎn)為視角能夠觀察到的圖像數(shù)據(jù),再將2.5D圖像數(shù)據(jù)進(jìn)行整合從而建立三維圖像。

2)雙目視覺系統(tǒng)

當(dāng)人體利用雙眼在不同角度、同一時(shí)間內(nèi)觀察同一個(gè)物體時(shí),就可以利用算法來測量該物體和人體之間的距離,而這種方法也被稱為雙目立體感,其應(yīng)用的原理主要是人體視覺差所帶來的影響。同時(shí)利用兩臺(tái)攝像機(jī)對同一圖像從不同角度進(jìn)行觀察,就能夠獲得人體雙目觀察后的效果,因此這一三維重建技術(shù)也被稱為“雙目視覺系統(tǒng)”。兩臺(tái)不同的攝像機(jī)即可代表人體雙眼,其對圖像進(jìn)行逐幀捕獲,但由于角度不同和環(huán)境影響因素的差異,因此造成了圖像差異,必須對其捕捉的圖像進(jìn)行預(yù)處理。

3)三維重構(gòu)算法

在計(jì)算機(jī)視覺技術(shù)中對于視頻流的采集主要依靠的是彩色攝像機(jī)、紅外攝像機(jī)、紅外接收攝像頭等設(shè)備。還可以利用微軟所提供的Kinect設(shè)備,在進(jìn)行運(yùn)動(dòng)物體檢測前能夠?qū)UI進(jìn)行初始化處理,將系統(tǒng)內(nèi)函數(shù)的參數(shù)設(shè)定為用戶信息深度圖、彩圖、骨骼追蹤圖等數(shù)據(jù)。在使用Kinect設(shè)備對視頻流進(jìn)行打開時(shí),其可以遵循三個(gè)步驟,其一是彩色和深度數(shù)據(jù)的處理;其二是根據(jù)數(shù)據(jù)的索引添加顏色信息,并將其引入到深度圖數(shù)據(jù)當(dāng)中;其三是骨骼追蹤數(shù)據(jù)。

5 結(jié)束語

計(jì)算機(jī)視覺捕捉技術(shù)是現(xiàn)代計(jì)算機(jī)應(yīng)用當(dāng)中較為先進(jìn)的內(nèi)容,其應(yīng)用范圍較廣,對于運(yùn)動(dòng)物體的捕捉準(zhǔn)確度較高,能夠有效推進(jìn)現(xiàn)代計(jì)算機(jī)模擬技術(shù)的發(fā)展。

計(jì)算機(jī)視覺論文:基于計(jì)算機(jī)視覺的馬鈴薯外部品質(zhì)檢測的應(yīng)用研究

摘 要計(jì)算機(jī)視覺具有實(shí)時(shí)、客觀、無損的優(yōu)點(diǎn),能對馬鈴薯的表面外部品質(zhì)進(jìn)行快速有效的檢測。本文闡述了應(yīng)用計(jì)算機(jī)視覺技術(shù)對馬鈴薯進(jìn)行外部品質(zhì)檢測的必要性,并對基于計(jì)算機(jī)視覺的馬鈴薯的大小檢測、形狀檢測以及表面缺陷檢測的應(yīng)用進(jìn)行了研究。

【關(guān)鍵詞】計(jì)算機(jī)視覺技術(shù) 馬鈴薯外部品質(zhì) 檢測

隨著計(jì)算機(jī)技術(shù)的不斷發(fā)展,計(jì)算機(jī)視覺技術(shù)應(yīng)運(yùn)而生并在工業(yè)自動(dòng)化以及農(nóng)產(chǎn)品檢驗(yàn)檢測等領(lǐng)域成功應(yīng)用。其中,將計(jì)算機(jī)視覺技術(shù)用于以自動(dòng)化采集和品級分級為代表的果蔬商品化處理具有非常廣闊的發(fā)展空間。我國政府將“農(nóng)產(chǎn)品深加工技術(shù)與設(shè)備研究開發(fā)”列為我國“十五”重大科技攻關(guān)項(xiàng)目的第一項(xiàng),這標(biāo)志著計(jì)算機(jī)視覺技術(shù)在果蔬外部品質(zhì)檢測中會(huì)發(fā)揮越來越重要的作用。

馬鈴薯是世界上僅僅排在小麥、水稻和玉米之后的第四種主要農(nóng)作物,種植區(qū)域非常廣泛。馬鈴薯品質(zhì)檢測是馬鈴薯深加工的一個(gè)關(guān)鍵步驟,目前,該檢驗(yàn)過程多數(shù)采用人工檢測,不僅成本高、效率低,而且與檢驗(yàn)員的專業(yè)素質(zhì)有密切的關(guān)系,受到人為因素影響的程度較大,嚴(yán)重制約的馬鈴薯加工企業(yè)的發(fā)展。計(jì)算機(jī)視覺技術(shù)能對農(nóng)產(chǎn)品的某些特性變化和缺陷進(jìn)行識別,具有客觀、無損害等特點(diǎn)。本文對基于計(jì)算機(jī)視覺的馬鈴薯外部品質(zhì)檢測的應(yīng)用進(jìn)行了研究。

1 應(yīng)用計(jì)算機(jī)視覺技術(shù)對馬鈴薯進(jìn)行外部品質(zhì)檢測的必要性

隨著“麥當(dāng)勞”、“肯德基”的餐飲服務(wù)業(yè)的快速發(fā)展,炸薯?xiàng)l、炸薯片已經(jīng)成為一種休閑食品深受消費(fèi)者的喜愛,推動(dòng)了我國馬鈴薯產(chǎn)業(yè)的發(fā)展。然而,情況并不十分樂觀,與國外的馬鈴薯企業(yè)相比,我國馬鈴薯加工企業(yè)生產(chǎn)規(guī)模小、生產(chǎn)產(chǎn)品單一、技術(shù)設(shè)備落后、產(chǎn)品質(zhì)量不高的現(xiàn)象導(dǎo)致我國的馬鈴薯產(chǎn)品銷售困難,經(jīng)濟(jì)效益逐漸下滑。

基于以上現(xiàn)狀,對馬鈴薯的加工研究還有很長的一段路程。企業(yè)要擴(kuò)大生產(chǎn)規(guī)模,針對中國的消費(fèi)趨勢與消費(fèi)水平開發(fā)出新的馬鈴薯產(chǎn)品,從而提高我國馬鈴薯產(chǎn)品的競爭力。這就要求馬鈴薯加工企業(yè)要對馬鈴薯的加工技術(shù)進(jìn)行創(chuàng)新,保證產(chǎn)品質(zhì)量。其中,馬鈴薯外部品質(zhì)檢測對馬鈴薯產(chǎn)品的最終品質(zhì)起著決定性作用。當(dāng)前的人工檢測方式已經(jīng)不再適應(yīng)社會(huì)發(fā)展的要求,利用計(jì)算機(jī)視覺檢驗(yàn)代替人工檢驗(yàn)成為社會(huì)發(fā)展的必然趨勢,這是因?yàn)橛?jì)算機(jī)視覺技術(shù)具有以下優(yōu)點(diǎn):

(1)精度高,能夠進(jìn)行定量測量。

(2)自動(dòng)化程度高,一次就可完成包括大小、形狀、顏色以及缺陷在內(nèi)的檢測和分析,并能進(jìn)行綜合識別。

(3)無損檢測,計(jì)算機(jī)視覺檢測過程不需要接觸產(chǎn)品,是通過傳感器掃面獲取圖像的,不會(huì)造成產(chǎn)品的損傷。

(4)信息量大,可對大量信息進(jìn)行采集,對光譜的敏感范圍也很廣。

2 基于計(jì)算機(jī)視覺的馬鈴薯外部品質(zhì)檢測的應(yīng)用研究

2.1 馬鈴薯大小的檢測方法

馬鈴薯的大小檢測不僅影響馬鈴薯深加工的商業(yè)價(jià)值,在在遺傳和育種方面也有很高的應(yīng)用價(jià)值。

利用計(jì)算機(jī)視覺技術(shù)對馬鈴薯大小的檢測步驟如下:先從攝像機(jī)中獲取馬鈴薯的圖像信息,在圖像信息的基礎(chǔ)上對馬鈴薯三維空間的幾何信息進(jìn)行計(jì)算,并由此重建和識別馬鈴薯。而馬鈴薯物體表面某點(diǎn)的三維幾何位置與其在圖像中對應(yīng)點(diǎn)之間的相互關(guān)系是由攝像機(jī)成像的幾何模型決定的,這些幾何參數(shù)成為攝像機(jī)參數(shù)。要想準(zhǔn)確的獲取這些攝像機(jī)參數(shù),就必須將實(shí)驗(yàn)與計(jì)算相結(jié)合,此過程成為系統(tǒng)定標(biāo)。

系統(tǒng)定標(biāo)的基本步驟:根據(jù)設(shè)定好的攝像機(jī)模型和特定的實(shí)驗(yàn)條件包括形狀、尺寸等已知的定標(biāo)參照物,經(jīng)過對馬鈴薯圖像的處理,并利用一系列的數(shù)學(xué)轉(zhuǎn)換和計(jì)算方法將攝像機(jī)模型的內(nèi)部和外部參數(shù)計(jì)算出來,從而建立照片與實(shí)物的聯(lián)系推算出馬鈴薯的真實(shí)尺寸。

2.2 馬鈴薯形狀的檢測方法

根據(jù)《中國馬鈴薯栽培學(xué)》中的知識,我們可以把馬鈴薯的塊莖形狀分為三類,分別是圓形、長筒形和橢圓形,除了這三種形狀,其余都是這三種形狀的變形。此次研究將馬鈴薯分為圓形、橢圓形和長筒形,并且采用橢圓的短長軸比來模擬馬鈴薯的縱橫直徑之間的關(guān)系。

2.2.1 馬鈴薯形狀特征參數(shù)的提取

將馬鈴薯橢圓的短長軸比R作為形狀特征參數(shù),并按照R的大小將馬鈴薯進(jìn)行分類。當(dāng)R小于0.67時(shí),稱之為長筒馬鈴薯;當(dāng)R大于0.85時(shí),稱之為圓形馬鈴薯;當(dāng)R介于0.67到0.85之間時(shí),稱之為橢圓形馬鈴薯。

2.2.2 結(jié)果與分析

隨機(jī)抽取114塊馬鈴薯,對抽取的馬鈴薯進(jìn)行正反兩面拍照,挑選清晰度最高的228張圖片。人工分類后進(jìn)行計(jì)算機(jī)視覺分類,操作步驟具體如下:

(1)用DIPS預(yù)處理:B通道灰度化,中值濾波和Otsu分割;

(2)通過計(jì)算機(jī)視覺技術(shù)提取馬鈴薯圖片的短長軸比R;

(3)將人工分類與計(jì)算機(jī)視覺分類進(jìn)行對比,并得出正確率。

根據(jù)圖表,我們可以看出在228張僅有兩張圖片被分類錯(cuò)誤,正確率高達(dá)99.1%,而這兩個(gè)分類錯(cuò)誤的馬鈴薯的短長軸比處于0.67周圍,分別為0.667604 , 0.67193和0.671887, 0.661063,又因?yàn)閷︸R鈴薯形狀的分類不需要類似工業(yè)生產(chǎn)那樣精密,所以,當(dāng)正反兩面短長軸比接近時(shí)都可看作是橢圓形。

2.3 馬鈴薯的缺陷檢測

計(jì)算機(jī)視覺技術(shù)具有實(shí)時(shí)、客觀、無損的檢測特點(diǎn),能對馬鈴薯的表面缺陷和某些特征要素進(jìn)行快速檢測?;诖耍瑖鴥?nèi)外很多研究學(xué)者進(jìn)行了大量的實(shí)驗(yàn)研究,在1998年開發(fā)了利用PC機(jī)輔助的實(shí)時(shí)馬鈴薯檢測系統(tǒng),能夠?qū)︸R鈴薯的重量、顏色以及形狀進(jìn)行快速檢測;2000年,相關(guān)研究者在此基礎(chǔ)上建立了計(jì)算機(jī)視覺檢測系統(tǒng),不僅能實(shí)現(xiàn)大小、形狀的檢測,還能對馬鈴薯表面的生長裂縫、機(jī)械裂縫、綠皮等表面缺陷進(jìn)行檢測。當(dāng)前對馬鈴薯表面缺陷進(jìn)行檢測的主要計(jì)算機(jī)視覺技術(shù)包括缺陷分割法和缺陷識別法兩種方法。

3 結(jié)論

本文應(yīng)用計(jì)算機(jī)視覺技術(shù)對馬鈴薯的大小、形狀和表面缺陷等外部品質(zhì)進(jìn)行了檢測,但是還未能實(shí)現(xiàn)利用計(jì)算機(jī)視覺技術(shù)對馬鈴薯的表面缺陷進(jìn)行分類這一技術(shù)。因此,相關(guān)部門要加大研究力度,爭取早日完善計(jì)算機(jī)視覺技術(shù),從而推動(dòng)我國馬鈴薯加工企業(yè)快速高效的發(fā)展。

計(jì)算機(jī)視覺論文:基于計(jì)算機(jī)視覺的通訊機(jī)殼部件精密測量方法

摘要:為解決通訊機(jī)殼部件測量中遇到的圓擬合和邊緣提取不準(zhǔn)確的問題,提出了利用加權(quán)函數(shù)進(jìn)行修正的方法。首先,針對圓擬合過程中容易受到干擾點(diǎn)影響的情況,提出采用雙平方形式的加權(quán)函數(shù)對圓擬合過程進(jìn)行修正,去除了離群值較大的點(diǎn),從而使圓擬合更準(zhǔn)確。為了準(zhǔn)確的定位邊緣,提出了利用三角形模糊隸屬函數(shù)作為加權(quán)函數(shù),對邊緣選取過程進(jìn)行修正,從而達(dá)到準(zhǔn)確提取邊緣的目的。同時(shí),本文采用了魯棒性強(qiáng)的字符提取算法及支持向量機(jī)的字符檢測算法,實(shí)現(xiàn)了字符提取和識別。

關(guān)鍵詞:加權(quán)函數(shù);圓擬合;邊緣選?。蛔址麢z測

通訊天線設(shè)備的電性能直接與設(shè)備的各個(gè)零部件的精度相關(guān),通訊天線零部件的高精度是保障通信質(zhì)量的基本條件。通訊機(jī)殼零部件的尺寸精度、幾何形狀精度、相互位置精度、表面粗糙度等都有嚴(yán)格規(guī)范和公差范圍。在檢測過程中不但要高精度地測量幾何尺寸、幾何形狀和相互位置精度,同時(shí)還要識別零部件表面的各種符號、數(shù)字和字母等。本文以通訊機(jī)殼零部件測量為例,以滿足精度、提高可靠性為目的,研究了基于單目計(jì)算機(jī)視覺條件下滿足亞像素精度的檢測方法,其關(guān)鍵檢測技術(shù)主要有標(biāo)定技術(shù)、復(fù)雜輪廓的基元擬合技術(shù)、模糊測量技術(shù)和字符提取技術(shù)等。文中針對機(jī)殼部件測量中,存在圓擬合與邊緣提取不準(zhǔn)確的問題,提出了利用加權(quán)函數(shù)進(jìn)行修正的方法。該方法的基本思想是:圓擬合不準(zhǔn)確主要是由于受到較大的離群點(diǎn)影響,因此采用一種雙平方模式的加權(quán)函數(shù)來去除這些離群點(diǎn),從而得到準(zhǔn)確的擬合圓。邊緣提取不準(zhǔn)確也是由于提取到了不需要的邊緣,因此采用三角形模式的加權(quán)函數(shù)對不需要的邊緣進(jìn)行抑制,只允許正確的邊緣輸出,從而達(dá)到正確檢測目的。檢測結(jié)果表明,所提出的方法能夠滿足測量要求。由于機(jī)殼部件表面的字符也要求識別,因此本文根據(jù)字符及其背景,選擇了魯棒性強(qiáng)的動(dòng)態(tài)閥值分割算法和支持向量機(jī)分類器實(shí)現(xiàn)了字符的檢測和識別。

1 攝像機(jī)標(biāo)定技術(shù)

本文采用傳統(tǒng)的攝像機(jī)標(biāo)定方法,利用一個(gè)標(biāo)定板與其圖像的對應(yīng)約束關(guān)系來確定攝像機(jī)的內(nèi)參數(shù)和外參數(shù)。測量中,采用的是遠(yuǎn)心相機(jī)模型。從三維空間坐標(biāo)到二維圖像坐標(biāo)的映射關(guān)系可以使用一個(gè)固定數(shù)量的參數(shù)來表示:

2 最小二乘法的加權(quán)擬合

由于部件的邊界點(diǎn)組成的輪廓會(huì)產(chǎn)生大量的數(shù)據(jù),而我們所關(guān)心的是確定部件輪廓的位置信息,因此需要將輪廓擬合成直線、圓、橢圓等基元,進(jìn)而確定被測部件的形狀精度、相互位置精度等關(guān)鍵參數(shù)。本文提出一種圓擬合算法,該算法基于各個(gè)擬合點(diǎn)的權(quán)重值的大小對圓進(jìn)行擬合,使得到圓更為精確。

3 模糊測量

相對于經(jīng)典標(biāo)準(zhǔn)的測量方法,模糊測量對邊緣選擇更加靈活。它可以依據(jù)圖像的對比度、位置、尺寸及灰度值等信息實(shí)現(xiàn)測量。

設(shè)模糊集合記為;并在[0,1]閉區(qū)間的特征函數(shù)稱為隸屬函數(shù),記為,它表示對于的隸屬程度,用它來描述“亦此亦彼”的模糊概念。在經(jīng)典集合論中,集合元素要么屬于或不屬于集合,該集合的邊界是清晰的。模糊集理論則允許有關(guān)集合元素模糊漸進(jìn)評估,這就是通過隸屬函數(shù)來描述的。模糊集合的定義式為:

由于在圖像中的灰度值存在模糊性,其主要體現(xiàn)在物體的邊緣,因此適合用模糊理論對圖像邊緣的不確定性進(jìn)行描述。對單一不確定性測量,在量化的區(qū)域內(nèi),包含準(zhǔn)確的值,即在gray zone范圍內(nèi)[6]。對物體進(jìn)行測量前,要選擇模糊隸屬函數(shù)。常用的有Triangular、S-curve function、Z-function和Pi-function四種。其他隸屬函數(shù)可由這四種組合而成[7]。在實(shí)際的測量中,由于光照等因素影響,常導(dǎo)致邊緣檢測不準(zhǔn)確,進(jìn)而影響測量結(jié)果,圖2(a)所示為由于檢測出多個(gè)邊緣,其測量結(jié)果有多個(gè)。

5 結(jié)論

本文研究了基于單目計(jì)算機(jī)視覺的機(jī)殼測量方法。針對測量中圓擬合不準(zhǔn)確的問題,提出了圓擬合算法的改進(jìn),即對擬合過程中,先計(jì)算各個(gè)點(diǎn)的加權(quán)值,對大于指定值的視為離群點(diǎn),將其忽略已達(dá)到去除離群點(diǎn)的目的,從而得到更準(zhǔn)確的圓。對檢測到多個(gè)邊緣的問題,根據(jù)其正確的邊緣位置信息,設(shè)計(jì)相應(yīng)的加權(quán)函數(shù),只選擇需要的邊緣輸出,從而得到正確的測量結(jié)果。加權(quán)函數(shù)的方法的優(yōu)點(diǎn)是使檢測結(jié)果更準(zhǔn)確;其缺點(diǎn)是增加了計(jì)算量,從而使檢測時(shí)間加長。因此,對于檢測時(shí)間要求比較苛刻的場合,該方法還有進(jìn)一步改進(jìn)的空間。另外本文還根據(jù)檢測要求,運(yùn)用動(dòng)態(tài)閥值分割算法和SVM分類器對機(jī)殼表面的字符進(jìn)行了提取和識別。