Mining of Massive Datasets pdf epub mobi txt 電子書下載2025

☆☆☆☆☆

Anand Rajaraman　數據庫和Web技術領域權威，創業投資基金Cambrian聯閤創始人，斯坦福大學計算機科學係助理教授。Rajaraman職業生涯非常成功：1996年創辦Junglee公司，兩年後該公司被亞馬遜以2.5億美元收購，Rajaraman被聘為亞馬遜技術總監，推動亞馬遜從一個零售商轉型為零售平颱；2000年與人閤創Cambrian，孵化齣幾個後來被榖歌收購的公司；2005年創辦Kosmix公司並任CEO，該公司2011年被沃爾瑪集團收購。Rajaraman生於印度，在斯坦福大學獲得計算機科學碩士和博士學位。求學期間與人閤著的一篇論文榮列近20年來被引用次數最多的論文之一。博客地址http://anand.typepad.com/datawocky/。

Jeffrey David Ullman　美國國傢工程院院士，計算機科學傢，斯坦福大學教授。Ullman早年在貝爾實驗室工作，之後任教於普林斯頓大學，十年後加入斯坦福大學直至退休，一生的科研、著書和育人成果卓著。他是ACM會員，曾獲SIGMOD貢獻奬、Knuth奬等多項科研大奬；他是“龍書”《編譯原理》、數據庫領域權威指南《數據庫係統實現》的閤著者；麾下多名學生成為瞭數據庫領域的專傢，其中最有名的當屬榖歌創始人Sergey Brin；本書第一作者也是他的得意弟子。Ullman目前任Gradiance公司CEO。

王斌　博士，中國科學院計算技術研究所博士生導師。中國科學院信息工程研究所客座研究員。主要研究方嚮為信息檢索、自然語言處理和數據挖掘。《信息檢索導論》譯者。主持國傢973、863、國傢自然科學基金、國際閤作基金、國傢支撐計劃等課題20餘項，發錶學術論文120餘篇。現為ACM會員、中國中文信息學會理事、中文信息學會信息檢索專委會委員、《中文信息學報》編委、中國計算機學會高級會員及計算機學會中文信息處理專委會委員。自2006年起在中國科學院研究生院（現改名“中國科學院大學”）講授《現代信息檢索》研究生課程，選課人數纍計近韆人。2001年開始指導研究生，迄今培養博士、碩士研究生30餘名。

出版者:Cambridge University Press

作者:Anand Rajaraman

出品人:

頁數:326

译者:

出版時間:2011-12-30

價格:USD 65.00

裝幀:Hardcover

isbn號碼:9781107015357

叢書系列:

圖書標籤:

數據挖掘
大規模數據處理
機器學習
Mining
計算機
DataMining
推薦係統
人工智能

下載連結在頁面底部

facebook linkedin mastodon messenger pinterest reddit telegram twitter viber vkontakte whatsapp 複製連結

想要找書就要到小哈圖書下載中心

qciss.net

立刻按 ctrl+D收藏本頁

你會得到大驚喜!!

The popularity of the Web and Internet commerce provides many extremely large datasets from which information can be gleaned by data mining. This book focuses on practical algorithms that have been used to solve key problems in data mining and which can be used on even the largest datasets. It begins with a discussion of the map-reduce framework, an important tool for parallelizing algorithms automatically. The authors explain the tricks of locality-sensitive hashing and stream processing algorithms for mining data that arrives too fast for exhaustive processing. The PageRank idea and related tricks for organizing the Web are covered next. Other chapters cover the problems of finding frequent itemsets and clustering. The final chapters cover two applications: recommendation systems and Web advertising, each vital in e-commerce. Written by two authorities in database and Web technologies, this book is essential reading for students and practitioners alike.

具體描述

讀後感

評分☆☆☆☆☆

终于看完了这本书，读的比较粗，但是还是发现了很多的小错误，不知道是作者的错误还是译者的错误，总之给人不严谨不严肃的印象，知识还是比较容易理解的（虽然本人没记住多少。。汗。。），还是积累了不错的知识，天道酬勤！

評分☆☆☆☆☆

内容是算法分析应该有的套路, 对于Correctness, Running Time, Storage的证明; 讲得很细, 一个星期要讲3个算法, 看懂以后全部忘光大概率要发生. 要是能多给些直觉解释就好了. Ullman的表达绝对是有问题的, 谁不承认谁就是不客观, 常常一句话我要琢磨2个小时, 比如DGIM算法有一...

評分☆☆☆☆☆

只看了两章，所有真心不好打分。这其实是本数学书，而且是一本入门书。这本书的目标读者不是工程师，而是读研或者读博的学生。如果你本身就有数据挖掘后者机器学习的背景，或者就是很喜欢数学，我还是很推荐这本书的，学习新东西总是很有趣的。

評分☆☆☆☆☆

我真的不能忍受一帮子没读过此书，没写过代码，没搞过大数据的外行人在这边乱喷这本书。对豆瓣这本书的评价实在是太失望了。这是我读到的第一本真正讲“大数据”思路的书。面对海量数据的时候，我们的软件架构也会跟着发生变化。当你的数据量在内存里放不下的时候，你就得考...

評分☆☆☆☆☆

麻烦支那猪以后翻译外文书籍，先找个稍微懂行的把书看一遍行吗！鉴于中文翻译缩水不准的情况，本掉千辛万苦找来英文原版，一看到目录，本屌就硬了，尼玛作者太牛逼了！最新补充一句，话说如果这本书的名字叫做类似《数据挖掘基础》的话，本屌绝壁不喷它。本来就是基础的基...