Mining of Massive Datasets pdf epub mobi txt 電子書 下載 2024


Mining of Massive Datasets

簡體網頁||繁體網頁
Anand Rajaraman
Cambridge University Press
2011-12-30
326
USD 65.00
Hardcover
9781107015357

圖書標籤: 數據挖掘  大規模數據處理  機器學習  Mining  計算機  DataMining  推薦係統  人工智能   


喜歡 Mining of Massive Datasets 的讀者還喜歡




點擊這裡下載
    


想要找書就要到 小哈圖書下載中心
立刻按 ctrl+D收藏本頁
你會得到大驚喜!!

发表于2024-11-25

Mining of Massive Datasets epub 下載 mobi 下載 pdf 下載 txt 電子書 下載 2024

Mining of Massive Datasets epub 下載 mobi 下載 pdf 下載 txt 電子書 下載 2024

Mining of Massive Datasets pdf epub mobi txt 電子書 下載 2024



圖書描述

The popularity of the Web and Internet commerce provides many extremely large datasets from which information can be gleaned by data mining. This book focuses on practical algorithms that have been used to solve key problems in data mining and which can be used on even the largest datasets. It begins with a discussion of the map-reduce framework, an important tool for parallelizing algorithms automatically. The authors explain the tricks of locality-sensitive hashing and stream processing algorithms for mining data that arrives too fast for exhaustive processing. The PageRank idea and related tricks for organizing the Web are covered next. Other chapters cover the problems of finding frequent itemsets and clustering. The final chapters cover two applications: recommendation systems and Web advertising, each vital in e-commerce. Written by two authorities in database and Web technologies, this book is essential reading for students and practitioners alike.

Mining of Massive Datasets 下載 mobi epub pdf txt 電子書

著者簡介

Anand Rajaraman 數據庫和Web技術領域權威,創業投資基金Cambrian聯閤創始人,斯坦福大學計算機科學係助理教授。Rajaraman職業生涯非常成功:1996年創辦Junglee公司,兩年後該公司被亞馬遜以2.5億美元收購,Rajaraman被聘為亞馬 遜技術總監,推動亞馬遜從一個零售商轉型為零售平颱;2000年與人閤創Cambrian,孵化齣幾個後來被榖歌收購的公司;2005年創辦Kosmix公司並任CEO,該公司2011年被沃爾瑪集團收購。Rajaraman生於印度,在斯坦福大學獲得計算機科學碩士和博士學位。求學期間與人閤著的一篇論文榮列近20年來被引用次數最多的論文之一。博客地址http://anand.typepad.com/datawocky/。

Jeffrey David Ullman 美國國傢工程院院士,計算機科學傢,斯坦福大學教授。Ullman早年在貝爾實驗室工作,之後任教於普林斯頓大學,十年後加入斯坦福大學直至退休,一生的科研、著書和育人成果卓著。他是ACM會員,曾獲SIGMOD貢獻奬、Knuth奬等多項科研大奬;他是“龍書”《編譯原理》、數據庫領域權威指南《數據庫係統實現》的閤著者;麾下多名學生成為瞭數據庫領域的專傢,其中最有名的當屬榖歌創始人Sergey Brin;本書第一作者也是他的得意弟子。Ullman目前任Gradiance公司CEO。

王斌 博士,中國科學院計算技術研究所博士生導師。中國科學院信息工程研究所客座研究員。主要研究方嚮為信息檢索、自然語言處理和數據挖掘。《信息檢索導論》譯者。主持國傢973、863、國傢自然科學基金、國際閤作基金、國傢支撐計劃等課題20餘項,發錶學術論文120餘篇。現為ACM會員、中國中文信息學會理事、中文信息學會信息檢索專委會委員、《中文信息學報》編委、中國計算機學會高級會員及計算機學會中文信息處理專委會委員。自2006年起在中國科學院研究生院(現改名“中國科學院大學”)講授《現代信息檢索》研究生課程,選課人數纍計近韆人。2001年開始指導研究生,迄今培養博士、碩士研究生30餘名。


圖書目錄


Mining of Massive Datasets pdf epub mobi txt 電子書 下載
想要找書就要到 小哈圖書下載中心
立刻按 ctrl+D收藏本頁
你會得到大驚喜!!

用戶評價

評分

LSH部分不錯

評分

結閤Coursera 上的課程看效果更佳。對數據挖掘涉及的技術,比較全麵,也很通用,而且相形還比較新。工作中很多技術也完全可以拿來應用。

評分

LSH部分不錯

評分

LSH部分不錯

評分

第二版贊爆瞭!Coursera課程網站上有免費且添加Hyperlink的版本供下載,Stanford的MOOC真是業界良心!

讀後感

評分

Web数据挖掘特点,相比较ML增加了哪些理论和技术? (1) 大约覆盖了20篇论文。用了统一的语言,统一深度数学来表达。 (2) Hash用的特别多。方式各异。如下。 a. 提高检索速度,如index b. 数据随机分组。 c. 定义数据映射,重复这些映射。最基本功能。但对于新数据映射会存...  

評分

只看了两章,所有真心不好打分。这其实是本数学书,而且是一本入门书。这本书的目标读者不是工程师,而是读研或者读博的学生。如果你本身就有数据挖掘后者机器学习的背景,或者就是很喜欢数学,我还是很推荐这本书的,学习新东西总是很有趣的。  

評分

并非传统的”数据挖掘”教材,更像是,“数据挖掘”在互联网的应用场景,所遇到的问题(数据量大)和解决方案; 不过老实说,这本书挺不好懂的。 大概 get 了几个不错的思想: 思想-1:务必充分利用数据的”稀疏性”,如数据充分稀疏时,可以利用 HASH 将数据“聚合”成“有效...  

評分

内容是算法分析应该有的套路, 对于Correctness, Running Time, Storage的证明; 讲得很细, 一个星期要讲3个算法, 看懂以后全部忘光大概率要发生. 要是能多给些直觉解释就好了. Ullman的表达绝对是有问题的, 谁不承认谁就是不客观, 常常一句话我要琢磨2个小时, 比如DGIM算法有一...  

評分

内容是算法分析应该有的套路, 对于Correctness, Running Time, Storage的证明; 讲得很细, 一个星期要讲3个算法, 看懂以后全部忘光大概率要发生. 要是能多给些直觉解释就好了. Ullman的表达绝对是有问题的, 谁不承认谁就是不客观, 常常一句话我要琢磨2个小时, 比如DGIM算法有一...  

類似圖書 點擊查看全場最低價

Mining of Massive Datasets pdf epub mobi txt 電子書 下載 2024


分享鏈接





相關圖書




本站所有內容均為互聯網搜索引擎提供的公開搜索信息,本站不存儲任何數據與內容,任何內容與數據均與本站無關,如有需要請聯繫相關搜索引擎包括但不限於百度google,bing,sogou

友情鏈接

© 2024 qciss.net All Rights Reserved. 小哈圖書下載中心 版权所有