全書共10章,內(nèi)容包括:緒論、語音產(chǎn)生與聽覺感知、語音信號特征、常用建模算法、語音編碼和質(zhì)量評估、語音識別、說話人識別、語音合成、語音增強、語音分離。
本書共分為9章,闡述了從單聲道到立體聲、多聲道環(huán)繞聲再到三維空間聲的技術(shù)變革歷程,并探討人耳對聲音定位的感知機制及影響因素。此外,還討論如何利用先進的錄音技術(shù)和算法來捕捉和重現(xiàn)真實的空間聲場,并分析不同的編碼格式和技術(shù),重點介紹空間音頻技術(shù)在虛擬現(xiàn)實(VR)、增強現(xiàn)實(AR)等環(huán)境下的運用,以提升用戶體驗的沉浸感,展示
本書系統(tǒng)地介紹了語音識別在大模型時代的新技術(shù)與新應(yīng)用。全書共16章,原理部分涵蓋聲學特征、隱馬爾可夫模型(HMM)、高斯混合模型(GMM)、深度神經(jīng)網(wǎng)絡(luò)(DNN)、語言模型和加權(quán)有限狀態(tài)轉(zhuǎn)換器(WFST)、語音大模型,重點描述了GMM-HMM、DNN-HMM和端到端(E2E)三種語音識別框架;應(yīng)用部分包含Kaldi、W
"近年來人工智能技術(shù)突飛猛進,以語音識別為代表的音頻處理技術(shù)取得了大量突破,但該領(lǐng)域內(nèi)理論結(jié)合實戰(zhàn)的入門書籍卻較為缺乏,本書旨在為有志學習音頻信號處理的讀者提供一本實用的入門書籍。本書共13章,第1章和第2章是基礎(chǔ)部分,包括聲學基礎(chǔ)知識及Python基礎(chǔ)等內(nèi)容;第3到4章介紹了音頻信號的獲取及分析方法;第5~8章介紹了
本書是一本Hi-Fi音響入門圖書。本書從技術(shù)和藝術(shù)的角度,全面介紹了Hi-Fi音響的相關(guān)知識,旨在為音樂、音響愛好者提供入門指導,幫助讀者提高音樂欣賞水平和音響設(shè)備的使用技能。本書包括電聲基礎(chǔ)、音響釋疑、音樂與欣賞3個部分。在電聲基礎(chǔ)部分,作者介紹了音響發(fā)燒的誤區(qū),如片面追求技術(shù)指標、忽視聽音環(huán)境等,強調(diào)了正確認識和欣
本書的撰寫主要分為四個章節(jié):第一章數(shù)字音頻藝術(shù)的基本藝術(shù)體系;第二章數(shù)字音頻藝術(shù)教育;第三章廣播劇與影視動漫聲音研究;第四章數(shù)字音頻的文化產(chǎn)業(yè)分析。主要內(nèi)容:1、理清數(shù)字音頻創(chuàng)意產(chǎn)業(yè)發(fā)展的脈絡(luò),建立數(shù)字音頻創(chuàng)意發(fā)展編年史。2、形成數(shù)字音頻創(chuàng)意教育引導機制的研究報告,提出音頻創(chuàng)意產(chǎn)業(yè)發(fā)展的咨詢報告。3、綜合性分析音頻創(chuàng)意
本書主要介紹三維聲的理論、三維菁彩聲(AudioVivid)的技術(shù)特點及使用場景,以及AudioVivid制作工具“花瓣三維聲”的設(shè)計理念、安裝調(diào)試、操作方式、制作流程等,讓讀者全面了解AudioVivid的內(nèi)容制作流程和方式。
這本書介紹了錄音的基本原理,包括聲音的傳播、拾音、錄音和混音等基本概念。它幫助讀者理解錄音過程中涉及的聲學原理和電子技術(shù),為后續(xù)的學習打下基礎(chǔ)。書中詳細介紹了各種錄音設(shè)備的工作原理和使用方法。這包括麥克風、調(diào)音臺、均衡器、效果器等設(shè)備的選擇、安裝和使用技巧。通過學習這些內(nèi)容,讀者可以了解如何正確使用這些設(shè)備,并掌握它們
本書以錄音藝術(shù)的相關(guān)內(nèi)容為指導,通過對一些經(jīng)典電影、電視以及游戲中的錄音內(nèi)容進行分析,闡明聲音設(shè)計的實踐理論,幫助讀者建立一套關(guān)于聲音設(shè)計的綜合而嚴謹?shù)母爬ㄐ钥蚣,結(jié)合實踐和學術(shù)兩方面的內(nèi)容,提供一整套的分析方法,并結(jié)合當下的應(yīng)用場景,分析未來聲音設(shè)計的發(fā)展方向。
本書提出的語義信息論,依據(jù)同義映射這一語義信息的本質(zhì)特征,構(gòu)建了語義信息的度量體系,引入新的數(shù)學工具,證明了語義編碼的基本定理,論證了語義通信系統(tǒng)的性能極限,揭示了未來語義通信的巨大性能潛力。