本書(shū)以Python 為平臺(tái),以案例為載體,系統(tǒng)地介紹了機(jī)器視覺(jué)的基礎(chǔ)理論、關(guān)鍵技術(shù)及實(shí)際應(yīng)用。本書(shū)首先從機(jī)器視覺(jué)的背景知識(shí)、系統(tǒng)構(gòu)成及相關(guān)概念入手,奠定理論基礎(chǔ)。隨后詳細(xì)介紹了圖像處理的核心內(nèi)容,包括圖像采集與相機(jī)標(biāo)定、數(shù)字圖像預(yù)處理基礎(chǔ)、數(shù)學(xué)工具及特征提取技術(shù),并深入探討了雙目立體視覺(jué)的關(guān)鍵技術(shù)。最后聚焦于實(shí)踐應(yīng)用,涵蓋機(jī)器學(xué)習(xí)與深度學(xué)習(xí)在機(jī)器視覺(jué)中的具體實(shí)現(xiàn),以及該技術(shù)在工業(yè)檢測(cè)、智能識(shí)別等領(lǐng)域的典型應(yīng)用。為了幫助讀者更好地掌握相關(guān)知識(shí),各章節(jié)都是通過(guò)知識(shí)點(diǎn)與案例相結(jié)合的方式展開(kāi),讓讀者在掌握知識(shí)點(diǎn)的同時(shí)舉一反三,掌握程序設(shè)計(jì)的方法,利用程序設(shè)計(jì)解決實(shí)際問(wèn)題。
本書(shū)可供從事機(jī)器視覺(jué)技術(shù)研究與應(yīng)用的技術(shù)人員學(xué)習(xí)使用,也可供高等院校相關(guān)專業(yè)的師生學(xué)習(xí)參考。
在科技飛速發(fā)展的今天,機(jī)器視覺(jué)作為人工智能領(lǐng)域的一顆璀璨明珠,正以其獨(dú)特的魅力和無(wú)限的潛力,引領(lǐng)著新一輪的技術(shù)革命和產(chǎn)業(yè)變革。從智能制造到智慧城市,從醫(yī)療診斷到輔助駕駛,機(jī)器視覺(jué)技術(shù)以其高效、精準(zhǔn)、智能的特點(diǎn),在各行各業(yè)中發(fā)揮著越來(lái)越重要的作用。在過(guò)去的幾年里,機(jī)器視覺(jué)技術(shù)飛速發(fā)展,從最初的簡(jiǎn)單圖像識(shí)別到現(xiàn)在的復(fù)雜場(chǎng)景理解,從單一的算法應(yīng)用到多元化的技術(shù)融合,每一次進(jìn)步都讓我們感到無(wú)比的震撼和欣喜。
筆 者長(zhǎng)期致力于機(jī)器視覺(jué)技術(shù)的教學(xué)與研究,取得了一些成果。但在多年的研究與實(shí)踐過(guò)程中,深刻體會(huì)到機(jī)器視覺(jué)技術(shù)的復(fù)雜性和多樣性,因此,我們決心撰寫(xiě)一本既注重理論深度,又兼顧實(shí)踐應(yīng)用的機(jī)器視覺(jué)書(shū)籍,旨在為讀者提供一個(gè)全面、深入、實(shí)用的知識(shí)體系。
本 書(shū)在內(nèi)容設(shè)計(jì)上力求全面、系統(tǒng)、實(shí)用。全書(shū)從機(jī)器視覺(jué)的基本概念、發(fā)展歷程講起,逐步深入到圖像處理、特征提取、目標(biāo)檢測(cè)、圖像識(shí)別等核心技術(shù)。不僅詳細(xì)闡述了這些技術(shù)的數(shù)學(xué)原理與算法實(shí)現(xiàn),還通過(guò)豐富的案例和代碼示例,展示了如何在不同應(yīng)用場(chǎng)景中有效運(yùn)用機(jī)器視覺(jué)技術(shù)。此外,本書(shū)還特別關(guān)注了當(dāng)前機(jī)器視覺(jué)領(lǐng)域的最新進(jìn)展和前沿技術(shù),如深度學(xué)習(xí)、三維視覺(jué)等,力求讓讀者緊跟技術(shù)潮流,把握未來(lái)趨勢(shì)。
本書(shū)面向廣泛的讀者群體,無(wú)論是計(jì)算機(jī)視覺(jué)、人工智能領(lǐng)域的初學(xué)者,還是希望提升專業(yè)技能的工程師、科研人員,或是對(duì)機(jī)器視覺(jué)技術(shù)充滿好奇與向往的業(yè)余讀者,都能從中獲益。本書(shū)編寫(xiě)力求語(yǔ)言通俗易懂,解釋深入淺出,確保每位讀者都能找到適合自己的學(xué)習(xí)路徑。同時(shí),本書(shū)也注重實(shí)踐性和可操作性,通過(guò)大量的案例和代碼示例,幫助讀者快速掌握機(jī)器視覺(jué)技術(shù)的實(shí)際應(yīng)用。
本書(shū)是2024年天津市教委社科重大項(xiàng)目人工智能賦能雙師型職教師資培養(yǎng)的模式創(chuàng)新與實(shí)踐研究和天津職業(yè)技術(shù)師范大學(xué)產(chǎn)教融合教學(xué)工坊的建設(shè)成果。全書(shū)由天津職業(yè)技術(shù)師范大學(xué)楊麗規(guī)劃與統(tǒng)籌,第1、4、6章由天津職業(yè)技術(shù)師范大學(xué)段海龍編寫(xiě),第2章由天津職業(yè)技術(shù)師范大學(xué)郭庭航編寫(xiě),第3、5、7~9章由楊麗編寫(xiě),天津經(jīng)泓智能科技有限公司李鳳泉,天津職業(yè)技術(shù)師范大學(xué)楊晨晨、文碩怡、張婷婷、鄧靖威、李含笑、趙思敏也參與了編寫(xiě)工作,并測(cè)試了各章的代碼。
由于筆者水平有限,書(shū)中難免會(huì)有疏漏,敬請(qǐng)讀者批評(píng)指正。
編者
第1章 緒論001
1.1 機(jī)器視覺(jué)的發(fā)展及系統(tǒng)構(gòu)成001
1.1.1 機(jī)器視覺(jué)的發(fā)展001
1.1.2 機(jī)器視覺(jué)系統(tǒng)構(gòu)成002
1.1.3 機(jī)器視覺(jué)在各行各業(yè)的應(yīng)用004
1.2 Marr 視覺(jué)計(jì)算理論框架007
1.2.1 Marr 視覺(jué)計(jì)算理論概念007
1.2.2 視覺(jué)圖像的形成階段008
1.3 機(jī)器視覺(jué)任務(wù)009
1.4 機(jī)器視覺(jué)與人工智能013
1.4.1 人工智能的發(fā)展013
1.4.2 機(jī)器視覺(jué)和人工智能的融合015
第2章 圖像采集與相機(jī)標(biāo)定018
2.1 亮度與成像018
2.1.1 光度學(xué)018
2.1.2 亮度成像模型021
2.2 鏡頭022
2.2.1 針孔成像模型022
2.2.2 鏡頭畸變024
2.2.3 遠(yuǎn)心與景深026
2.3 攝像機(jī)028
2.3.1 CCD 傳感器029
2.3.2 CMOS 傳感器032
2.3.3 彩色成像034
2.3.4 傳感器尺寸036
2.3.5 攝像機(jī)性能036
2.3.6 深度相機(jī)037
2.4 相機(jī)標(biāo)定基礎(chǔ)040
2.4.1 空間坐標(biāo)系定義041
2.4.2 空間坐標(biāo)系變換041
2.5 相機(jī)標(biāo)定方法044
2.5.1 Tsai 兩步標(biāo)定法044
2.5.2 張正友標(biāo)定法049
第3章 數(shù)字圖像預(yù)處理基礎(chǔ)053
3.1 數(shù)字圖像簡(jiǎn)介053
3.1.1 數(shù)字圖像處理的發(fā)展及應(yīng)用053
3.1.2 圖像采樣和量化055
3.1.3 圖像的表示和可視化058
3.1.4 像素間的關(guān)系060
3.2 圖像濾波062
3.2.1 空間濾波基礎(chǔ)062
3.2.2 平滑和銳化處理062
3.2.3 頻域?yàn)V波基礎(chǔ)068
3.2.4 低通和高通濾波070
3.3 邊緣檢測(cè)073
3.3.1 邊緣檢測(cè)的定義073
3.3.2 幾種算子的比較073
3.4 圖像分割080
3.4.1 閾值分割的基本概念080
3.4.2 基于點(diǎn)的全局閾值選取方法081
3.4.3 基于區(qū)域的全局閾值選取方法081
3.4.4 局部閾值法和多閾值法083
3.4.5 圖像分割的評(píng)價(jià)085
3.5 彩色圖像處理086
3.5.1 彩色視覺(jué) 086
3.5.2 彩色模型087
3.5.3 彩色變換089
3.5.4 彩色圖像增強(qiáng)092
3.5.5 彩色圖像的平滑097
3.5.6 彩色圖像的銳化098
3.5.7 彩色圖像的分割099
第4章 數(shù)字圖像處理的數(shù)學(xué)工具103
4.1 傅里葉變換圖像處理103
4.1.1 傅里葉變換基礎(chǔ)103
4.1.2 傅里葉變換在圖像處理中的典型應(yīng)用104
4.2 離散余弦變換圖像處理110
4.2.1 離散余弦變換基礎(chǔ)110
4.2.2 離散余弦變換在圖像處理中的典型應(yīng)用111
4.3 偏微分方程圖像處理113
4.3.1 偏微分方程基礎(chǔ)113
4.3.2 偏微分方程在圖像處理中的典型應(yīng)用114
4.4 小波變換圖像處理121
4.4.1 小波變換基礎(chǔ)121
4.4.2 小波變換在圖像處理中的典型應(yīng)用124
4.5 形態(tài)學(xué)圖像處理128
4.5.1 形態(tài)學(xué)基礎(chǔ)128
4.5.2 形態(tài)學(xué)在圖像處理中的典型應(yīng)用131
第5章 圖像的特征提取137
5.1 圖像顏色特征提取137
5.1.1 顏色直方圖137
5.1.2 顏色矩141
5.1.3 顏色集143
5.1.4 顏色聚合向量144
5.1.5 顏色相關(guān)圖146
5.2 圖像紋理特征提取148
5.2.1 圖像的紋理148
5.2.2 紋理特征描述方法148
5.2.3 Laws 紋理能量測(cè)量法150
5.2.4 Gabor 變換151
5.2.5 局部二值模式154
5.3 圖像形狀特征提取157
5.3.1 簡(jiǎn)單形狀特征158
5.3.2 傅里葉描述符160
5.3.3 形狀無(wú)關(guān)矩162
5.4 圖像邊緣特征提取164
5.4.1 梯度邊緣檢測(cè)164
5.4.2 一階邊緣檢測(cè)算子165
5.4.3 二階邊緣檢測(cè)算子168
5.5 圖像點(diǎn)特征提取169
5.5.1 角點(diǎn)檢測(cè)169
5.5.2 SIFT 特征點(diǎn)173
5.5.3 SURF 特征點(diǎn)174
5.6 案例基于PCA 的人臉識(shí)別177
第6章 雙目立體視覺(jué)181
6.1 雙目立體視覺(jué)原理181
6.1.1 雙目立體視覺(jué)測(cè)深原理181
6.1.2 極線約束 184
6.2 雙目立體視覺(jué)系統(tǒng)185
6.2.1 雙目立體視覺(jué)系統(tǒng)體系185
6.2.2 雙目立體視覺(jué)的精度分析187
6.3 雙目立體視覺(jué)標(biāo)定和立體匹配192
6.3.1 雙目立體視覺(jué)標(biāo)定192
6.3.2 雙目立體視覺(jué)中的對(duì)應(yīng)點(diǎn)匹配 195
6.4 案例雙目立體視覺(jué)實(shí)現(xiàn)深度測(cè)量199
6.4.1 實(shí)驗(yàn)圖片采集和校正199
6.4.2 視差和深度計(jì)算201
6.4.3 計(jì)算三維坐標(biāo)并輸出三維空間位置202
第7章 機(jī)器學(xué)習(xí)在機(jī)器視覺(jué)中的應(yīng)用204
7.1 機(jī)器學(xué)習(xí)及相關(guān)數(shù)學(xué)知識(shí)204
7.1.1 機(jī)器學(xué)習(xí)簡(jiǎn)介204
7.1.2 機(jī)器學(xué)習(xí)的相關(guān)數(shù)學(xué)知識(shí)205
7.2 機(jī)器學(xué)習(xí)的主要方法216
7.2.1 線性分類(lèi)器216
7.2.2 支持向量機(jī)218
7.2.3 貝葉斯分類(lèi)器 222
7.2.4 K 均值聚類(lèi) 225
7.2.5 集成學(xué)習(xí)228
7.3 案例機(jī)器學(xué)習(xí)在目標(biāo)跟蹤中的應(yīng)用230
第8章 深度學(xué)習(xí)在機(jī)器視覺(jué)中的應(yīng)用235
8.1 深度學(xué)習(xí)基礎(chǔ)235
8.1.1 深度學(xué)習(xí)的崛起以及存在的問(wèn)題 235
8.1.2 神經(jīng)網(wǎng)絡(luò)的基本概念237
8.1.3 卷積神經(jīng)網(wǎng)絡(luò)原理238
8.1.4 卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)演化 239
8.2 基于深度學(xué)習(xí)的圖像分類(lèi)算法256
8.2.1 圖像分類(lèi)算法的發(fā)展256
8.2.2 CNN 的計(jì)算量與參數(shù)量257
8.2.3 案例基于深度學(xué)習(xí)的圖像分類(lèi)應(yīng)用258
8.3 基于深度學(xué)習(xí)的目標(biāo)檢測(cè)算法259
8.3.1 目標(biāo)檢測(cè)算法的發(fā)展259
8.3.2 目標(biāo)檢測(cè)的重要概念 260
8.3.3 Faster R-CNN 算法262
8.3.4 YOLO 檢測(cè)算法266
8.3.5 案例自然場(chǎng)景文字檢測(cè)276
第9章 機(jī)器視覺(jué)的典型應(yīng)用實(shí)戰(zhàn)278
9.1 寬度測(cè)量278
9.1.1 背景介紹278
9.1.2 環(huán)境準(zhǔn)備278
9.1.3 數(shù)據(jù)說(shuō)明與處理278
9.1.4 模型構(gòu)建與訓(xùn)練279
9.1.5 模型測(cè)試280
9.2 基于Keras 的卷積神經(jīng)網(wǎng)絡(luò)實(shí)現(xiàn)人臉面部表情識(shí)別280
9.2.1 背景介紹280
9.2.2 環(huán)境準(zhǔn)備281
9.2.3 數(shù)據(jù)說(shuō)明與處理281
9.2.4 模型構(gòu)建與訓(xùn)練281
9.2.5 模型測(cè)試284
9.3 基于卷積神經(jīng)網(wǎng)絡(luò)的皮膚病分類(lèi)286
9.3.1 背景介紹286
9.3.2 環(huán)境準(zhǔn)備286
9.3.3 數(shù)據(jù)說(shuō)明與處理287
9.3.4 模型構(gòu)建與訓(xùn)練289
9.3.5 模型測(cè)試291
9.4 基于深度學(xué)習(xí)的肝臟腫瘤分割293
9.4.1 背景介紹293
9.4.2 環(huán)境準(zhǔn)備294
9.4.3 數(shù)據(jù)說(shuō)明與處理294
9.4.4 模型構(gòu)建與訓(xùn)練295
9.4.5 模型測(cè)試297
9.5 人臉關(guān)鍵點(diǎn)檢測(cè)298
9.5.1 背景介紹298
9.5.2 環(huán)境準(zhǔn)備298
9.5.3 數(shù)據(jù)說(shuō)明與處理299
9.5.4 模型構(gòu)建與訓(xùn)練303
9.5.5 模型測(cè)試309
參考文獻(xiàn)311