自然語言處理( natural language processing , NLP )是一種利用計算機對人類特有的書面和口頭自然語言進行分析、理解和生成的技術,旨在促進人與計算機及人與人之間的有效交流。自然語言處理是人工智能的一個重要分支,也是實現認知智能過程中的核心問題。
▲ 自然語言處理核心任務
隨著人工智能技術的迅速發展,自然語言處理作為其核心研究領域,不斷取得重要突破,尤其是在深度學習和大規模 預訓練 語言模型的推動下,自然語言處理的性能顯著提升,為未來的人工智能發展提供了前所未有的發展機遇。為幫助初學者、研究者以及從業者更好地了解這一領域的知識體系、技術變遷及發展趨勢,作者決定撰寫 這 本 《基于深度學習的自然語言處理基礎教程》 。
基于深度學習的自然語言處理基礎教程
胡玥等著
北京 :科學出版社, 2025. 6
(中國科學院大學研究生教材系列)
ISBN 978-7-03-081695-5
本書的內容源于作者所在的教學團隊在中國科學院大學開設多年的“自然語言處理基礎”課程的經驗積累。近年來,隨著自然語言處理領域技術的飛速發展,作者的授課內容經歷了從統計自然語言處理到深度學習自然語言處理的更迭,自然語言處理領域涵蓋眾多不同時期的技術和知識點,且各種處理技術層出不窮,如果對該領域知識缺乏系統性的了解和全面的認識,勢必會給學習造成困難。為此,作者按技術變遷的脈絡對自然語言處理的整體知識體系架構進行梳理,介紹各時期的技術特點及相應的基礎理論、技術方法、基礎技術、核心應用、數據資源等要素,旨在幫助讀者對龐大的自然語言處理領域的技術發展及體系架構有全面、系統的認識,為進一步學習奠定基礎。
▲ 自然語言處理體系整體架構
在本書撰寫過程中,作者充分兼顧了內容的深度與廣度。本書內容從基礎到進階,層層遞進,不僅能為初學者提供詳盡的基礎理論介紹,也能為具有一定經驗的研究者和從業者深入探討前沿技術提供依據。本書結合實際應用案例和任務示例,幫助讀者在學習理論的同時,理解自然語言處理技術在實際工作中的具體應用。
▲ 基于深度學習的自然語言處理的知識體系整體組織架構
在全面梳理自然語言處理體系架構的基礎上,本書將內容定位在當前主流的基于深度學習的自然語言處理方法。作者按知識間的支撐關系和技術范式變遷的時間順序,將整個體系架構縱向分為數據資源層、理論基礎層、基本概念層、基本任務層、核心應用任務層五個層次,橫向分為任務神經網絡方法階段(第二范式)、 預訓練 語言模型 + 精調階段(第三 范式)、 預訓練 語言模型(大語言模型) + 提示工程階段(第四 / 五范式)三個階段,構建基于深度學習的自然語言處理二 維知識 體系架構,確保教學內容的全面性和系統性。
感謝中國科學院大學教材出版中心的資助與支持,使本書能夠順利出版。本書與中國科學院大學網絡空間安全學院開設的“自然語言處理基礎”課程緊密配合,旨在為該課程提供系統化的教材支持。感謝中國科學院大學網絡空間安全學院作為本書的第一完成單位,為本書的撰寫工作提供的有力支持。希望本書能夠為廣大讀者提供有價值的參考,幫助大家掌握自然語言處理的基礎知識,并深入理解前沿技術的發展動態。
本文摘編自《 基于深度學習的自然語言處理基礎教程 》 ( 胡玥等著 . 北京 :科學出版社, 2025. 6 )一書“前言”,有 刪 修改,標題為編者所加。
(中國科學院大學研究生教材系列)
ISBN 978-7-03-081695-5
責任編輯: 郭 媛 孫伯元
本書作為基于深度學習的自然語言處理基礎教程,介紹基于深度學習的自然語言處理領域的各種技術范式以及相關概念,構建該領域的知識體系,幫助讀者對該領域知識有全面和系統的了解。全書共 12 章,分別介紹深度學習自然語言處理數據資源、常用的神經網絡模型、語言模型的基本概念、注意力機制的基本概念、自然語言處理基本任務及建模方法、 預訓練 語言模型,以及典型的自然語言處理核心任務模型。
本書的讀者對象為自然語言處理初學者、計算機科學專業的本科生或研究生、自然語言處理相關從業者等。
(本文編輯:劉四旦)
專業品質 學術價值
原創好讀 科學品位
一起閱讀科學
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.