機器學習 A-Z

這些參考學習書籍將會幫助你全面建立機器學習的知識架構，並且在Python和R里構建不同的機器學習模型。

通過這些參考學習書籍的學習，你將能夠學習到以下技能，提升你的職場競爭力：

完全掌握機器學習及在Python和R里的應用
深刻理解各種機器學習的模型
做出準確的預測和強大的分析
利用機器學習創造更多價值
利用機器學習解決私人問題
掌握並熟練處理強大的算法，例如強化學習，自然語言處理，還有深度學習
掌握並熟練處理先進的技術，例如對降低數據維度
了解對不同的問題怎樣選擇合適的機器學習模型
建立起強大的機器學習知識架構，並且知道如何創建和運用不同的模型來解決任何問題
掌握 Python 和 R 上的機器學習
對許多機器學習模型有很好的直覺
做出準確的預測和強大的分析
創建可靠的機器學習模型
為您的業務創造強大的附加值
將機器學習用於個人目的
處理特定主題，如強化學習、NLP 和深度學習
處理降維等高級技術
了解為每種類型的問題選擇哪種機器學習模型
構建強大的機器學習模型大軍，並知道如何將它們組合起來解決任何問題

如果你對機器學習領域感興趣？那麼這些參考學習書籍將適合你！

這些參考學習書籍由專業數據科學家設計，在書中他們在分享他們的專業知識，並以簡單的方式幫助您學習複雜的理論、算法和編碼庫。

這些書籍將逐步引導您進入機器學習的世界。通過每一本書的學習，您將發展新技能並提高您對數據科學這個具有挑戰性但利潤豐厚的子領域的理解。

這些書籍既有趣又令人興奮，但與此同時，我們深入研究了機器學習。它的結構如下：

第 1 部分 - 數據預處理
第 2 部分 - 回歸：簡單線性回歸、多元線性回歸、多項式回歸
第 3 部分 - 分類：邏輯回歸、SVM、核 SVM、樸素貝葉斯、決策樹分類、隨機森林分類
第 4 部分 - 聚類：K 均值
第 5 部分 - 關聯規則學習：先驗
第 6 部分 - 強化學習：置信上限，湯普森抽樣
第 7 部分 - 自然語言處理：NLP 的詞袋模型和算法
第 8 部分 - 深度學習：人工神經網絡、卷積神經網絡
第 9 部分 - 降維：PCA、內核 PCA
第 10 部分 - 模型選擇和提升：k 摺疊交叉驗證，網格搜索。

此外，有些書籍中還包含基於現實生活中示例的實踐練習。因此，您不僅可以學習理論，還可以獲得一些構建自己的模型的動手實踐。

這些參考學習書籍面向哪些人：

所有對機器學習感興趣的人
任何有高中數學知識並且想開始學習機器學習的學生
任何有機器學習基本知識並想了解更多這個領域的人
任何不太了解編程但對機器學習感興趣，並希望將機器學習應用在數據上的人
任何想進入數據科學領域的大學生
任何想提高機器學習技能的數據分析師
任何對目前工作不滿意並想成為數據科學家的人
任何希望運用強大的機器學習工具擴大自己事業的人
任何對機器學習感興趣的人。
至少具有高中數學知識並希望開始學習機器學習的學生。
任何了解機器學習基礎知識的中級人員，包括線性回歸或邏輯回歸等經典算法，但想要了解更多並探索機器學習的所有不同領域。
任何對編碼不太熟悉但對機器學習感興趣並希望將其輕鬆應用於數據集的人。
任何想要開始數據科學職業生涯的大學學生。
任何想要在機器學習中升級的數據分析師。
任何對自己的工作不滿意並想成為數據科學家的人。
任何想要通過使用強大的機器學習工具為其業務創造附加值的人。

機器學習的參考學習書籍介紹：

《土木工程師的概率機器學習》

為土木工程專業的學生和專業人士介紹概率機器學習的關鍵概念和技術;有許多分步示例、插圖和練習。

本書向土木工程專業的學生和專業人士介紹了概率機器學習概念，本書以一種沒有統計學或者計算機科學專業背景的讀者能夠理解的方式介紹關鍵方法和技術。它通過分步示例、插圖和練習清晰直接地介紹了不同的方法。掌握了這些材料後，讀者將能夠理解本書所借鑑的更高級的機器學習文獻。

本書介紹了概率機器學習三個子領域的關鍵方法：監督學習、無監督學習和強化學習。它首先涵蓋了理解機器學習所需的背景知識，包括線性代數和概率論。它繼續提出貝葉斯估計，這是監督和無監督學習方法的制定背後的理論，以及馬爾可夫鏈蒙特卡羅方法，它在某些複雜情況下能夠進行貝葉斯估計。然後，本書介紹了與監督學習相關的方法，包括回歸方法和分類方法，以及與無監督學習相關的概念，包括聚類、降維、貝葉斯網絡、狀態空間模型和模型校準。最後，本書介紹了不確定背景下的理性決策和不確定和順序背景下的理性決策的基本概念。在此基礎上，本書描述了強化學習的基礎知識，虛擬代理在與環境交互時學習如何通過反覆試驗來做出最佳決策。

《機器學習在高風險中的應用：負責任的AI技術》

過去十年見證了人工智慧和機器學習（AI/ML）技術的廣泛採用。然而，由於缺乏對廣泛實施的監督，導致了有害後果，而這些後果本來可以通過適當的監督來避免。在我們實現AI / ML的真正好處之前，從業者必須了解如何降低其風險。

本書介紹了負責任的AI，這是一種改進AI / ML技術，業務流程和文化能力的整體方法，它建立在風險管理，網絡安全，數據隱私和應用社會科學方面的最佳實踐之上。這是一項雄心勃勃的事業，需要多樣化的才能、經驗和觀點。數據科學家和非技術監督人員都需要被招募並授權來審計和評估高影響力的 AI/ML 系統。作者派屈克·霍爾（Patrick Hall）為新一代審計員和評估員創建了本指南，他們希望使AI系統更好地為組織，消費者和廣大公眾服務。

本書的主要內容：

了解如何創建成功且有影響力的負責任的AI實踐
獲取有關採用 AI 技術的現有標準、法律和評估的指南
了解公司的現有角色如何演變以納入負責任的AI
檢查實施負責任 AI 的業務最佳實踐和建議
了解在系統開發的各個階段實現負責任 AI 的技術方法

《機器學習在地下能源資源管理中的應用：最新技術和未來預測》

在許多應用科學和工程學科（包括地能源）中，利用機器學習（ML）技術來理解隱藏模式並從複雜的多變量數據集構建數據驅動的預測模型正在迅速增加。在這些發展的推動下，《地下能源資源管理中的機器學習應用》展示了管理地下能源資源（例如石油和天然氣、地質碳封存和地熱能）的 ML 應用程式的最新技術和未來前景的當前快照。

本書的關鍵特色：

涵蓋多個應用領域（油藏表徵、鑽井、生產、油藏建模和預測性維護）的 ML 應用

提供代表運營公司、大學和研究機構的作者的各種觀點

提供一系列案例研究，說明幾種 ML 技術的最新應用

包括每個應用領域的文獻綜述和未來展望

本書面向有興趣廣泛了解多個地下領域的ML應用的實踐石油工程師或地球科學家。它還旨在作為研究生課程的補充閱讀，也將吸引從事水文地質學和核廢料處理的專業人員和研究人員。

《使用Spark擴展機器學習：使用 MLlib、TensorFlow 和 PyTorch的分布式機器學習》

快速了解 Apache Spark，這是用於大規模數據處理（包括機器學習和分析）的流行引擎。如果您希望使用 MLlib、分布式 PyTorch 和分布式 TensorFlow 擴展您的技能組合或在可擴展機器學習方面推進您的職業生涯，那麼本實用指南適合您。

使用 Spark 作為主要數據處理平台，您將發現幾種為豐富 Spark 的 ML 功能而設計和構建的開源技術。《Scaling Machine Learning with Spark（使用Spark擴展機器學習）》研究了基於 Apache Spark 生態系統構建端到端分布式 ML 工作流的各種技術，包括 Spark MLlib、MLFlow、TensorFlow、PyTorch 和 Petastorm。

本書向您展示了何時使用每種技術以及為什麼使用。如果你是一名使用機器學習的數據科學家，你將學習到如何：

構建實用的分布式機器學習工作流，包括特徵工程和數據格式
通過橋接到分布式 TensorFlow 和 PyTorch 將深度學習功能擴展到 Spark 之外
使用 MLFlow 管理機器學習試驗生命周期
使用 Petastorm 作為存儲層，將數據從 Spark 橋接到 TensorFlow 和 PyTorch
使用機器學習術語來理解分布策略

《使用 Scikit-Learn、Keras 和 TensorFlow 動手的機器學習：構建智能系統的概念、工具和技術，第3版》

通過最近的一系列突破，深度學習推動了整個機器學習領域的發展。現在，即使是對這項技術幾乎一無所知的程式設計師也可以使用簡單、高效的工具來實現能夠從數據中學習的程序。這本暢銷書使用具體的例子、最小的理論和生產就緒的 Python 框架——scikit-learn、Keras 和 TensorFlow——來幫助你直觀地理解構建智能系統的概念和工具。

在更新的第三版中，作者Aurelien Geron探索了一系列技術，從簡單的線性回歸開始，發展到深度神經網絡。本書中的大量代碼示例和練習可幫助您應用所學知識。編程經驗是入門所需的全部內容。

本書的主要內容：

使用 scikit-learn 端到端跟蹤示例機器學習項目
探索多種模型，包括支持向量機、決策樹、隨機森林和集成方法
利用無監督學習技術，如降維、聚類和異常檢測
深入了解神經網絡架構，包括卷積網絡、循環網絡、生成對抗網絡和轉換器
使用 TensorFlow 和 Keras 為計算機構建和訓練神經網絡視覺、自然語言處理、生成模型和深度強化學習
使用多個 GPU 訓練神經網絡，並使用 Google 的 Vertex AI 大規模部署它們

《可再生能源和現代混合動力系統的物聯網、機器學習和區塊鏈技術》

這本經過編輯的書籍包括描述可再生能源和現代混合動力系統的物聯網、機器學習和區塊鏈技術的章節，並附有仿真示例和案例研究。

閱讀本書後，用戶將通過仿真實例和案例研究，了解物聯網、機器學習技術、區塊鏈技術等最新技術，以及這些技術在可再生能源資源和現代混合動力系統中的應用。

《Python 中的動手數據預處理：了解如何有效地為成功的數據分析準備數據》

清理原始數據並準備好進行處理，以設計更好的數據分析解決方案

本書的主要特點

培養執行數據清理、數據集成、數據縮減和數據轉換的技能
通過強大的數據轉換和處理技術充分利用原始數據
執行徹底的數據清理，包括處理缺失值和異常值

本書的內容簡介

動手數據預處理是一本關於最佳數據清理和預處理技術的入門書，由一位開發過數據預處理和相關主題的大學水平課程的專家撰寫。

通過本書，您將從多個角度配備最佳的數據預處理技術，確保您從數據中獲得最佳見解。

您將了解數據預處理的不同技術和分析方面 - 數據收集，數據清理，數據集成，數據縮減和數據轉換 - 並掌握使用開源Python編程環境實現它們。

動手示例和易於遵循的章節將幫助您全面闡明數據預處理、原因和方式，並確定數據分析可以導致更有效決策的機會。隨著本章的深入，您還將了解數據管理系統和技術在有效分析中的作用，以及如何使用 API 提取數據。

在你學習這本 Python 數據預處理書籍結束時，您將能夠使用 Python 來讀取、操作和分析數據;執行數據清理、集成、縮減和轉換技術，並處理異常值或缺失值，以便有效地為分析工具準備數據。

你將學到什麼

使用 Python 對數據執行分析功能
了解資料庫的角色以及如何有效地從資料庫中提取數據
執行由分析目標定義的數據預處理步驟
識別並解決數據集成挑戰
確定數據縮減的需求並執行它
發現通過數據轉換改進分析的機會

這本書是為誰寫的

本書面向希望對大量數據進行預處理和數據清理的初級和高級數據分析師、商業智能專業人員、工程本科生和數據愛好者。您不需要任何數據預處理經驗即可開始使用本書。但是，基本的編程技能（例如使用變量、條件和循環）以及 Python 的初學者知識和簡單的分析經驗是先決條件。

本書的目錄

回顧NumPy和Pandas的核心模塊
回顧另一個核心模塊 - Matplotlib
數據 – 它到底是什麼？
資料庫
數據可視化
預測
分類
聚類分析
數據清理級別 I - 清理表
數據清理級別 II - 解包、重組和重新制定表
數據清理級別 III - 缺失值、異常值和錯誤
數據融合與數據集成
數據縮減
數據轉換和處理
案例研究 1 - 科技行業的心理健康
案例研究 2 - 預測 COVID-19 住院情況
案例研究3：美國縣聚類分析
總結、實踐案例研究和結論

《自然語言處理精裝的深度學習研究應用》

人類擁有最先進的交流方式，即自然語言。雖然人類可以使用計算機相互發送語音和文本消息，但計算機天生不知道如何處理自然語言。近年來，深度學習主要改變了人工智慧（AI）各個領域的觀點，包括語音、視覺和自然語言處理（NLP）。深度學習在各種應用中的廣泛成功已成為人工智慧許多下游任務的基準。

近年來，由於深度學習和神經網絡的進步，計算機視覺領域取得了巨大的飛躍，在與檢測和標記對象相關的任務中超過了人類。《自然語言處理的深度學習研究應用》解釋了自然語言處理（NLP），語音和計算機視覺領域的概念和最先進的研究。它提供了將 Python 中的工具和庫用於實際應用程式的見解。涵蓋深度學習算法、神經網絡和高級預測等主題，這個首要的參考書籍是計算語言學家、軟體工程師、IT 經理、計算機科學家、高等教育學生和教師、圖書館、研究人員和院士的絕佳資源。

《自然語言處理項目：使用 AI 技術構建下一代 NLP 應用程式》

利用機器學習和深度學習技術構建成熟的自然語言處理（NLP）項目。本書中的項目越來越複雜，並展示了解決各種業務問題的方法、優化提示和技巧。您將使用現代 Python 庫和算法來構建端到端 NLP 項目。

本書首先概述了自然語言處理（NLP）和人工智慧，以快速複習算法。接下來，它涵蓋了從傳統算法開始的端到端 NLP 項目和項目，例如客戶評論情緒和情感檢測、主題建模和文檔聚類。從那裡，它深入研究與電子商務相關的項目，例如使用產品描述進行產品分類，檢索相關內容的搜尋引擎以及基於內容的推薦系統以增強用戶體驗。展望未來，它解釋了如何使用上下文嵌入構建系統來查找相似的句子，使用遞歸神經網絡（RNN）總結大量文檔，使用長短期記憶網絡（LSTM）自動單詞建議，以及如何使用遷移學習構建聊天機器人。最後，它探索了研究領域的下一代人工智慧和算法。

在本書結束時，您將掌握使用NLP技術解決各種業務問題所需的知識。
通過本書您將學到什麼：

使用 Python 實現成熟的智能 NLP 應用程式
使用 NLP 技術翻譯文本數據上的實際業務問題
利用機器學習和深度學習技術執行智能語言處理
獲得實施端到端搜尋引擎信息檢索、文本摘要、聊天機器人、文本生成、文檔聚類和產品分類等的實踐經驗

本書適合的讀者對象：

希望使用 Python構建自然語言應用程式的數據科學家、機器學習工程師和深度學習專業人員

《自動駕駛汽車的應用深度學習和計算機視覺：使用深度神經網絡和行為克隆技術構建自動駕駛汽車》

使用深度學習和人工智慧技術和庫（如 TensorFlow、Keras 和 OpenCV）來探索自動駕駛汽車技術；