多語自然語言處理 pdf epub mobi txt 電子書 下載 2024
☆☆☆☆☆
簡體網頁||
繁體網頁
Daniel M. Bikel
機械工業齣版社
2015-2-1
448
CNY 99.00
平裝
計算機科學叢書
9787111484912
圖書標籤:
自然語言處理
NLP
自然語言
CS
AI
2017
計算機科學
Corpus
喜歡 多語自然語言處理 的讀者還喜歡
下載链接在页面底部
點擊這裡下載
立刻按 ctrl+D收藏本頁
你會得到大驚喜!!
发表于2024-12-28
多語自然語言處理 epub 下載 mobi 下載 pdf 下載 txt 電子書 下載 2024
多語自然語言處理 epub 下載 mobi 下載 pdf 下載 txt 電子書 下載 2024
多語自然語言處理 pdf epub mobi txt 電子書 下載 2024
圖書描述
本書是第一本全麵闡述如何構建健壯和準確的多語自然語言處理係統的圖書,由兩位資深專傢編輯,集閤瞭該領域眾多尖端進展以及從廣泛的研究和産業實踐中總結齣的實用解決方案。第一部分介紹現代自然語言處理的核心概念和理論基礎,展示瞭如何理解單詞和文檔結構、分析語法、建模語言、識彆蘊涵和檢測冗餘。第二部分徹底闡述與構建真實應用有關的實際考量,包括信息抽取、機器翻譯、信息檢索、文摘、問答、提煉、處理流水綫等。
多語自然語言處理 下載 mobi epub pdf txt 電子書
著者簡介
Daniel M. Bikel 現為Google公司高級研究科學傢,正在開發用於自然語言處理和語音識彆的新方法。在IBM工作期間,他為IBM的GALE多語種信息抽取和自動應答係統構架瞭攔截係統。在賓夕法尼亞大學攻讀博士後期間,他建造瞭第一個可擴展的多語種語法分析引擎。
Imed Zitouni 現為微軟公司高級研究員。2004~2012年,他是IBM公司高級研究科學傢,領導IBM公司的阿拉伯語信息抽取和數據資源工作組。在此之前,他還曾領導DIALOCA的語音/自然語言處理組和Bell實驗室/阿爾卡特朗訊的語言建模和呼叫路由工作。他的研究涉及機器翻譯、自然語言處理和口語對話係統。
圖書目錄
齣版者的話
譯者序
前言
關於作者
第一部分 理論
第1章 找齣詞的結構
1.1 詞及其部件
1.1.1 詞元
1.1.2 詞形
1.1.3 詞素
1.1.4 類型學
1.2 問題和挑戰
1.2.1 不規則性
1.2.2 歧義性
1.2.3 能産性
1.3 形態模型
1.3.1 查詞典
1.3.2 有限狀態形態
1.3.3 基於閤一的形態
1.3.4 函數式形態
1.3.5 形態歸納
1.4 總結
第2章 找齣文檔的結構
2.1 概述
2.1.1 句子邊界檢測
2.1.2 主題邊界檢測
2.2 方法
2.2.1 生成序列分類方法
2.2.2 判彆性局部分類方法
2.2.3 判彆性序列分類方法
2.2.4 混閤方法
2.2.5 句子分割的全局建模擴展
2.3 方法的復雜度
2.4 方法的性能
2.5 特徵
2.5.1 同時用於文本與語音的特徵
2.5.2 隻用於文本的特徵
2.5.3 語音特徵
2.6 處理階段
2.7 討論
2.8 總結
第3章 句法
3.1 自然語言分析
3.2 樹庫:句法分析的數據驅動方法
3.3 句法結構的錶示
3.3.1 使用依存圖的句法分析
3.3.2 使用短語結構樹的句法分析
3.4 分析算法
3.4.1 移進歸約分析
3.4.2 超圖和綫圖分析
3.4.3 最小生成樹和依存分析
3.5 分析中的歧義消解模型
3.5.1 概率上下文無關文法
3.5.2 句法分析的生成模型
3.5.3 句法分析的判彆模型
3.6 多語言問題:什麼是詞元
3.6.1 詞元切分、實例和編碼
3.6.2 分詞
3.6.3 形態學
3.7 總結
第4章 語義分析
4.1 概述
4.2 語義解釋
4.2.1 結構歧義
4.2.2 詞義
4.2.3 實體與事件消解
4.2.4 謂詞 論元結構
4.2.5 意義錶示
4.3 係統範式
4.4 詞義
4.4.1 資源
4.4.2 係統
4.4.3 軟件
4.5 謂詞 論元結構
4.5.1 資源
4.5.2 係統
4.5.3 軟件
4.6 意義錶示
4.6.1 資源
4.6.2 係統
4.6.3 軟件
4.7 總結
4.7.1 詞義消歧
4.7.2 謂詞 論元結構
4.7.3 意義錶示
第5章 語言模型
5.1 概述
5.2 n元模型
5.3 語言模型評價
5.4 參數估計
5.4.1 最大似然估計和平滑
5.4.2 貝葉斯參數估計
5.4.3 大規模語言模型
5.5 語言模型適應
5.6 語言模型的類型
5.6.1 基於類的語言模型
5.6.2 變長語言模型
5.6.3 判彆式語言模型
5.6.4 基於句法的語言模型
5.6.5 最大熵語言模型
5.6.6 因子化語言模型
5.6.7 其他基於樹的語言模型
5.6.8 基於主題的貝葉斯語言模型
5.6.9 神經網絡語言模型
5.7 特定語言建模問題
5.7.1 形態豐富語言的建模
5.7.2 亞詞單元的選擇
5.7.3 形態類彆建模
5.7.4 無分詞語言
5.7.5 口語與書麵語言
5.8 多語言和跨語言建模
5.8.1 多語言建模
5.8.2 跨語言建模
5.9 總結
第6章 文本蘊涵識彆
6.1 概述
6.2 文本識彆蘊涵任務
6.2.1 問題定義
6.2.2 RTE的挑戰
6.2.3 評估文本蘊涵係統性能
6.2.4 文本蘊涵解決方案的應用
6.2.5 其他語言中的RTE研究
6.3 文本蘊涵識彆的框架
6.3.1 要求
6.3.2 分析
6.3.3 有用的組件
6.3.4 通用模型
6.3.5 實現
6.3.6 對齊
6.3.7 推理
6.3.8 訓練
6.4 案例分析
6.4.1 抽取語篇約束
6.4.2 基於編輯距離的RTE
6.4.3 基於轉換的方法
6.4.4 邏輯錶示及推理
6.4.5 獨立於蘊涵學習對齊
6.4.6 在RTE中利用多對齊
6.4.7 自然邏輯
6.4.8 句法樹核
6.4.9 使用有限依存上下文的全局相似度
6.4.10 RTE的潛在對齊推理
6.5 RTE的進一步研究
6.5.1 改進分析器
6.5.2 發明或解決新問題
6.5.3 開發知識庫
6.5.4 更好的RTE評價
6.6 有用資源
6.6.1 文獻
6.6.2 知識庫
6.6.3 自然語言處理包
6.7 總結
第7章 多語情感與主觀性分析
7.1 概述
7.2 定義
7.3 英語中的情感及主觀性分析
7.3.1 詞典
7.3.2 語料庫
7.3.3 工具
7.4 詞級和短語級標注
7.4.1 基於字典的方法
7.4.2 基於語料庫的方法
7.5 句子級標注
7.5.1 基於字典
7.5.2 基於語料庫
7.6 文檔級標注
7.6.1 基於字典
7.6.2 基於語料庫
7.7 什麼有效,什麼無效
7.7.1 最佳情況:已有人工標注的語料庫
7.7.2 次優情形:基於語料庫的跨語言映射
7.7.3 第三優情形:孳衍詞典
7.7.4 第四優情形:翻譯詞典
7.7.5 各種可行方法的比較
7.8 總結
第二部分 實踐
第8章 實體檢測和追蹤
8.1 概述
8.2 提及檢測
8.2.1 數據驅動的分類
8.2.2 搜索提及
8.2.3 提及檢測特徵
8.2.4 提及檢測實驗
8.3 共指消解
8.3.1 Bell樹的構建
8.3.2 共指模型:鏈接和引入模型
8.3.3 最大熵鏈接模型
8.3.4 共指消解實驗
8.4 總結
第9章 關係和事件
9.1 概述
9.2 關係與事件
9.3 關係類彆
9.4 將關係抽取視為分類
9.4.1 算法
9.4.2 特徵
9.4.3 分類器
9.5 關係抽取的其他方法
9.5.1 無監督和半監督方法
9.5.2 核方法
9.5.3 實體和關係檢測的聯閤方法
9.6 事件
9.7 事件抽取方法
9.8 超句
9.9 事件匹配
9.10 事件抽取的未來方嚮
9.11 總結
第10章 機器翻譯
10.1 機器翻譯現狀
10.2 機器翻譯評測
10.2.1 人工評測
10.2.2 自動評測
10.2.3 WER、BLEU、METEOR等
10.3 詞對齊
10.3.1 共現
10.3.2 IBM模型1
10.3.3 期望最大化
10.3.4 對齊模型
10.3.5 對稱化
10.3.6 作為機器學習問題的詞對齊
10.4 基於短語的翻譯模型
10.4.1 模型
10.4.2 訓練
10.4.3 解碼
10.4.4 立方剪枝
10.4.5 對數綫性模型和參數調節
10.4.6 控製模型的大小
10.5 基於樹的翻譯模型
10.5.1 層次短語翻譯模型
10.5.2 綫圖解碼
10.5.3 基於句法的模型
10.6 語言學挑戰
10.6.1 譯詞選擇
10.6.2 形態學
10.6.3 詞序
10.7 工具和數據資源
10.7.1 基本工具
10.7.2 機器翻譯係統
10.7.3 平行語料
10.8 未來的方嚮
10.9 總結
第11章 跨語言信息檢索
11.1 概述
11.2 文檔預處理
11.2.1 文檔句法和編碼
11.2.2 詞元化
11.2.3 規範化
11.2.4 預處理最佳實踐
11.3 單語信息檢索
11.3.1 文檔錶示
11.3.2 索引結構
11.3.3 檢索模型
11.3.4 查詢擴展
11.3.5 文檔先驗模型
11.3.6 模型選擇的最佳實踐
11.4 CLIR
11.4.1 基於翻譯的方法
11.4.2 機器翻譯
11.4.3 中間語言文檔錶示
11.4.4 最佳實踐
11.5 多語言信息檢索
11.5.1 語言識彆
11.5.2 MLIR的索引建立
11.5.3 翻譯查詢串
11.5.4 聚閤模型
11.5.5 最佳實踐
11.6 信息檢索的評價
11.6.1 建立實驗環境
11.6.2 相關性評估
11.6.3 評價指標
11.6.4 已有數據集
11.6.5 最佳實踐
11.7 工具、軟件和資源
11.8 總結
第12章 多語自動文摘
12.1 概述
12.2 自動文摘方法
12.2.1 傳統方法
12.2.2 基於圖的方法
12.2.3 學習如何做摘要
12.2.4 多語自動摘要
12.3 評測
12.3.1 人工評價
12.3.2 自動評價
12.3.3 自動文摘評測係統的近期發展
12.3.4 多語自動文摘的自動評測方法
12.4 如何搭建自動文摘係統
12.4.1 材料
12.4.2 工具
12.4.3 說明
12.5 評測競賽和數據集
12.5.1 評測競賽
12.5.2 數據集
12.6 總結
第13章 問答係統
13.1 概述和曆史
13.2 架構
13.3 源獲取和預處理
13.4 問題分析
13.5 搜索及候選抽取
13.5.1 非結構化資源搜索
13.5.2 非結構化源文本的候選抽取
13.5.3 結構化源文本的候選抽取
13.6 迴答評分
13.6.1 方法概述
13.6.2 證據結閤
13.6.3 擴展到列錶型問題
13.7 跨語言問答
13.8 案例研究
13.9 評測
13.9.1 評測任務
13.9.2 判斷答案正確性
13.9.3 性能度量
13.10 當前和未來的挑戰
13.11 總結和進一步閱讀
第14章 提煉
14.1 概述
14.2 示例
14.3 相關性和冗餘性
14.4 Rosetta Consortium 提煉係統
14.4.1 文檔和語料庫準備
14.4.2 索引
14.4.3 查詢迴答
14.5 其他提煉方法
14.5.1 係統架構
14.5.2 相關度
14.5.3 冗餘
14.5.4 多模態提煉
14.5.5 跨語言提煉
14.6 評測和指標
14.7 總結
第15章 口語對話係統
15.1 概述
15.2 口語對話係統
15.2.1 語音識彆和理解
15.2.2 語音生成
15.2.3 對話管理器
15.2.4 語音用戶接口
15.3 對話形式
15.4 自然語言呼叫路由選擇
15.5 三代對話應用
15.6 持續的改進循環
15.7 口語句子的轉錄和標注
15.8 口語對話係統的本地化
15.8.1 呼叫流程本地化
15.8.2 提示本地化
15.8.3 文法的本地化
15.8.4 源端數據
15.8.5 訓練
15.8.6 測試
15.9 總結
第16章 聚閤自然語言處理引擎
16.1 概述
16.2 聚閤語音和NLP引擎架構的期望屬性
16.2.1 靈活的分布式組件化
16.2.2 計算效率
16.2.3 數據操作功能
16.2.4 魯棒性處理
16.3 聚閤的架構
16.3.1 UIMA
16.3.2 GATE
16.3.3 InfoSphere Streams
16.4 案例研究
16.4.1 GALE 互操作性演示係統
16.4.2 跨語言自動語言開發係統
16.4.3 實時翻譯服務
16.5 經驗教訓
16.5.1 分割涉及延遲和精度之間的權衡
16.5.2 聯閤優化與互操作性
16.5.3 數據模型需要使用約定
16.5.4 性能評估的挑戰
16.5.5 引擎的前嚮波訓練
16.6 總結
16.7 UIMA樣本代碼
索引
· · · · · · (
收起)
多語自然語言處理 pdf epub mobi txt 電子書 下載
用戶評價
評分
☆☆☆☆☆
版本比較舊瞭,英語版2012年齣的,濃厚翻譯味暫且不論,就統計自然語言處理來說,宗成慶的書更好些吧
評分
☆☆☆☆☆
厚重的翻譯味,不過母語好處還是可以飛快地掃
評分
☆☆☆☆☆
版本比較舊瞭,英語版2012年齣的,濃厚翻譯味暫且不論,就統計自然語言處理來說,宗成慶的書更好些吧
評分
☆☆☆☆☆
厚重的翻譯味,不過母語好處還是可以飛快地掃
評分
☆☆☆☆☆
版本比較舊瞭,英語版2012年齣的,濃厚翻譯味暫且不論,就統計自然語言處理來說,宗成慶的書更好些吧
讀後感
評分
☆☆☆☆☆
評分
☆☆☆☆☆
評分
☆☆☆☆☆
評分
☆☆☆☆☆
評分
☆☆☆☆☆
類似圖書 點擊查看全場最低價
多語自然語言處理 pdf epub mobi txt 電子書 下載 2024