圖書標籤: 機器學習 特徵工程 Python 大數據 數據科學 計算機 數據挖掘 數據分析與機器學習
发表于2024-11-05
精通特徵工程 pdf epub mobi txt 電子書 下載 2024
特徵工程是機器學習流程中至關重要的一個環節,然而專門討論這個話題的著作卻寥寥無幾。本書旨在填補這一空白,著重闡明特徵工程的基本原則,介紹大量特徵工程技術,教你從原始數據中提取齣正確的特徵並將其轉換為適閤機器學習模型的格式,從而輕鬆構建模型,增強機器學習算法的效果。
然而,本書並非單純地講述特徵工程的基本原則,而是通過大量示例和練習將重點放在瞭實際應用上。每一章都集中研究一個數據問題:如何錶示文本數據或圖像數據,如何為自動生成的特徵降低維度,何時以及如何對特徵進行標準化,等等。最後一章通過一個完整的例子演示瞭多種特徵工程技術的實際應用。書中所有代碼示例均是用Python編寫的,涉及NumPy、Pandas、scikit-learn和Matplotlib等程序包。
- 數值型數據的特徵工程:過濾、分箱、縮放、對數變換和指數變換
- 自然文本技術:詞袋、n元詞與短語檢測
- 基於頻率的過濾和特徵縮放
- 分類變量編碼技術:特徵散列化與分箱計數
- 使用主成分分析的基於模型的特徵工程
- 模型堆疊與k-均值特徵化
- 圖像特徵提取:人工提取與深度學習
愛麗絲·鄭(Alice Zheng)
亞馬遜廣告平颱建模和優化團隊負責人,應用機器學習、生成算法和平颱開發領域的技術領導者,前微軟研究院機器學習研究員。
阿曼達·卡薩麗(Amanda Casari)
榖歌雲開發者關係工程經理,曾是Concur Labs的産品經理和數據科學傢,在數據科學、機器學習、復雜係統和機器人等多個領域都有豐富經驗。
https://github.com/apachecn/feature-engineering-for-ml-zh 這裏粗看完瞭 就是還是膚淺地瞭解瞭個概念 大概是基礎太差瞭 雁過不留痕????
評分看一下開源版本
評分實戰裏更多是糙猛快,堆數據。書裏不少方法和思路開闊眼界瞭,以後比賽裏試試看
評分雖然沒讀完也不配讀懂但是感謝分類標簽這一章救我於水深火熱peace&love我又好起來瞭嚶嚶嚶
評分雖然沒讀完也不配讀懂但是感謝分類標簽這一章救我於水深火熱peace&love我又好起來瞭嚶嚶嚶
在图书馆看到的,感觉内容很棒,来豆瓣mark一下,上班有钱后买一本。吐个槽,书有点薄,59元略贵。虽然知识无价,不过对比国内出版物环境,嗯....相对有点点问题。 声明一下,这本书不是入门书籍,不适合机器学习入门/python入门的来看。 虽然英文名叫Feature Engineering for ...
評分特征工程是数据科学工程的核心,目前关于这个话题专门的书籍不多。本书通过概念(不是理论)和案例代码相结合的方式,还该了特征工程中的一些基础技术。包括分类型变量编码,数值型数据的分箱,变换。文本处理,PCA以及基于模型的特征工程。模型堆叠和k-均值特征化。最后简单介...
評分特征工程是数据科学工程的核心,目前关于这个话题专门的书籍不多。本书通过概念(不是理论)和案例代码相结合的方式,还该了特征工程中的一些基础技术。包括分类型变量编码,数值型数据的分箱,变换。文本处理,PCA以及基于模型的特征工程。模型堆叠和k-均值特征化。最后简单介...
評分[https://github.com/apachecn/feature-engineering-for-ml-zh] ==========================================================================================================================================================
評分特征工程是数据科学工程的核心,目前关于这个话题专门的书籍不多。本书通过概念(不是理论)和案例代码相结合的方式,还该了特征工程中的一些基础技术。包括分类型变量编码,数值型数据的分箱,变换。文本处理,PCA以及基于模型的特征工程。模型堆叠和k-均值特征化。最后简单介...
精通特徵工程 pdf epub mobi txt 電子書 下載 2024