圖書標籤: 分布式係統 計算機 分布式 數據庫 架構 計算機科學 數據 大數據
发表于2025-01-31
數據密集型應用係統設計 pdf epub mobi txt 電子書 下載 2025
全書分為三大部分:
第一部分,主要討論有關增強數據密集型應用係統所需的若乾基本原則。首先開篇第1章即瞄準目標:可靠性、可擴展性與可維護性,如何認識這些問題以及如何達成目標。第2章我們比較瞭多種不同的數據模型和查詢語言,討論各自的適用場景。接下來第3章主要針對存儲引擎,即數據庫是如何安排磁盤結構從而提高檢索效率。第4章轉嚮數據編碼(序列化)方麵,包括常見模式的演化曆程。
第二部分,我們將從單機的數據存儲轉嚮跨機器的分布式係統,這是擴展性的重要一步,但隨之而來的是各種挑戰。所以將依次討論數據遠程復製(第5章)、數據分區(第6章)以及事務(第7章)。接下來的第8章包括分布式係統的更多細節,以及分布式環境如何達成一緻性與共識(第9章)。
第三部分,主要針對産生派生數據的係統,所謂派生數據主要指在異構係統中,如果無法用一個數據源來解決所有問題,那麼一種自然的方式就是集成多個不同的數據庫、緩存模塊以及索引模塊等。首先第10章以批處理開始來處理派生數據,緊接著第11章采用流式處理。第12章總結之前介紹的多種技術,並分析討論未來構建可靠、可擴展和可維護應用係統可能的新方嚮或方法。
作者簡介
Martin Kleppmann是英國劍橋大學分布式係統方嚮的研究員。此前,他曾是LinkedIn和Rapportive等互聯網公司的軟件工程師,負責大規模數據基礎設施建設。在此過程中他遇到過一些睏難,因此他希望這本書能夠幫助讀者避免重蹈覆轍。Martin還是一位活躍的會議演講者、博主和開源貢獻者。他認為,每個人都應該學習深刻的技術理念,對技術的深入理解能幫助我們開發齣更好的軟件。
譯者簡介
趙軍平, 大數據存儲與分析資深開發者與推廣者(EMC 10餘年),GPU異構計算的親曆者。中國計算機協會專傢委員,DELL EMC資深架構師。12年係統研發、創新與團隊管理經驗,擅長數據存儲與保護, 雲計算與大數據實時分析,GPU異構加速優化等。相關領域已申請中、美技術專利100餘項,並多次在SNIA,LinuxConf,Hadoop Summit, Nvidia GPU Tech Conf等做技術分享,持續關注數據密集和計算密集相關技術的演進、融閤與賦能推廣。
呂雲鬆,北京大學計算機碩士,碩士及DELL EMC中國研究院實習期間專注於大數據實時流式處理相關的研究。現就職於華為2012中軟院黎曼實驗室,主要從事深度學習的研發。
耿煜,DELL EMC架構師兼GTM負責人,緻力於推廣企業級數字化轉型方案。深耕分布式架構以及雲計算12年,先後任職於ChinaCache,Sun Microsystems以及EMC等公司。
李三平,美國麻省大學計算機工程專業博士,DELL EMC中國研究院首席科學傢,研究方嚮為機器學習、深度學習、智能運維、遙感影像等。已在IEEE Transactions期刊和會議上發錶論文數十篇,申請美國專利20餘項。推崇簡約,熱衷機器學習。
書是好書,但是對我有點超綱瞭,有幾章雲裏霧裏;吐槽第三部分很多錯彆字、翻譯不通順;當做是第一遍通讀一下。
評分涵蓋數據集成、處理、存儲的全貌,粗讀瞭第一遍,然後又二刷瞭一遍,分布式領域涉及很多艱深的理論,需要大量理論學習。單機存儲到分布式存儲完全梳理瞭一下,收獲頗豐。p.s.最後一章翻譯太差,各種錯彆字,落字
評分涵蓋數據集成、處理、存儲的全貌,粗讀瞭第一遍,然後又二刷瞭一遍,分布式領域涉及很多艱深的理論,需要大量理論學習。單機存儲到分布式存儲完全梳理瞭一下,收獲頗豐。p.s.最後一章翻譯太差,各種錯彆字,落字
評分花瞭一個多月終於讀完瞭,被作者的高屋建瓴所摺服,這本書偏嚮於學院派,但不乏工程上的指導意義。很多東西需要反復得讀甚至去查看每章後麵的文獻纔能加深理解。第二部分關於分布式共識、一緻性的內容非常精彩,我甚至拿它在團隊做瞭技術分享。最後發現作者是個比特幣懷疑論者。
評分20190815第一遍。啃瞭大半個月纔啃完,一二部分對我很有幫助,基本上梳理並討論瞭現有工業界分布式係統的各種理論及其實現細節。這本書應該作為後端架構的必讀書目,對很多籠罩著光環的各種架構服務很有祛媚效果。每章後麵的參考文獻是個大寶藏,需要好好閱讀。
摘要,后面再读补总结。字数还说不能少于140 字[捂脸哭]简直了。 书中比较详细描述了数据库,从数据库衍生派生数据,批处理,流处理等衍生。主要是问题-思路-问题的方式,但其问题角度考虑极端,分布式也正是这些极端场景的发源地。对自己是一个比较全面的分布式认知,对于很多...
評分 評分从高层视角系统的介绍了数据在存储和读取中的方方面面,非常有助于建立自己的知识体系。书中很多内容都是平时会接触到的一些问题,但是在实际工作中未必能够把这些零碎的东西串起来,形成体系框架。这本书可以让你整理你自己的知识,让他们连接在一起,变成一个树结构,后面你...
評分从高层视角系统的介绍了数据在存储和读取中的方方面面,非常有助于建立自己的知识体系。书中很多内容都是平时会接触到的一些问题,但是在实际工作中未必能够把这些零碎的东西串起来,形成体系框架。这本书可以让你整理你自己的知识,让他们连接在一起,变成一个树结构,后面你...
評分这本书从数据的产生、传输、存储、检索、更新等方方面面,介绍了一个后台系统使用到的种种存储技术,包括了数据库、缓存、检索引擎、批处理、流处理。对于每一种技术,作者介绍了它们的基本原理、使用场景、优势和不足,并附带了大量的扩展阅读书目。对于后台开发、运维人员,...
數據密集型應用係統設計 pdf epub mobi txt 電子書 下載 2025