图书标签: 搜索引擎 rails java 搜索 互联网 计算机 Ruby红宝石 Programming
发表于2024-11-07
搜索引擎零距离 pdf epub mobi txt 电子书 下载 2024
随着网络信息资源的急剧增长,人们越来越多地关注如何快速有效地从海量的网络信息中,抽取出潜在的、有价值的信息,使之有效地在管理和决策中发挥作用。搜索引擎技术解决了用户检索网络信息的困难,目前搜索引擎技术正成为计算机科学界和信息产业界争相研究、开发的对象。.
本书的作者是一位资深的搜索引擎开发人员,书中对数据获取(网络信息挖掘)与数据检索(搜索引擎)两个方面作了深入的介绍。本书首先提出了一套“网络数据挖掘”的完整理论,并给出一个实际的智能爬虫系统,通过理论与实际的完整呈现,使读者能够对“网络数据挖掘”有一个比较具体的认识,然后介绍了一个专用程序语言IRS,并给出了这个语言的编译器以及虚拟机的实现方法。本书还通过对多个开源搜索引擎项目抽丝剥茧的细致分析,引出搜索引擎的一些基本原理与开发方法,并介绍了一个商业化搜索引擎的实例。本书的最后还结合一个Java框架介绍了一些软件设计思想。..
本书涉及网络数据挖掘、搜索引擎原理、编译原理、数据库原理、正则表达式、软件工程、设计模式、Ruby语言、HTTP协议等计算机科学与技术的知识,适合搜索引擎开发人员作为参考,也适合有一定计算机基础的读者阅读,以扩展视野。
本书的内容中,既有教科书式的理论阐述,也有“七天入门”式的实例解析,还有《Linux内核情景分析》风格的细致的代码分析,甚至还有一些英语文献翻译,从初学者到有一定经验的搜索引擎开发人员,各个层次的读者都能找到一些适合自己阅读的章节
王亮,主持或参与过多个大中型搜索引擎开发与运营,具有丰富的搜索引擎算法理论知识与实际开发运营经验.曾任职于爱立信.cSmarter.com.c上海网村.上海迈众,12009年创立上海睿驿信息技术有限公司并任CEO,致力于提供搜索引擎相关的产品和服务.
值得一读
评分值得一读
评分值得一读
评分翻了就想退的书...
评分贴太多代码从来就不会是一本好的技术书
今天中午拿到书,下午就激动的看了。结果.... 第一章,内容不明不白的就过去了,真的可以称为是浅尝辄止,都不知道讲了些什么就完了。。。 第二章,讲爬虫,莫名其妙的,哎。 第三章,IRS语言....原来是自己开发的。。。介绍缺乏逻辑,没有层次更没有足够的示例,一句话,没表...
评分今天中午拿到书,下午就激动的看了。结果.... 第一章,内容不明不白的就过去了,真的可以称为是浅尝辄止,都不知道讲了些什么就完了。。。 第二章,讲爬虫,莫名其妙的,哎。 第三章,IRS语言....原来是自己开发的。。。介绍缺乏逻辑,没有层次更没有足够的示例,一句话,没表...
评分今天中午拿到书,下午就激动的看了。结果.... 第一章,内容不明不白的就过去了,真的可以称为是浅尝辄止,都不知道讲了些什么就完了。。。 第二章,讲爬虫,莫名其妙的,哎。 第三章,IRS语言....原来是自己开发的。。。介绍缺乏逻辑,没有层次更没有足够的示例,一句话,没表...
评分今天中午拿到书,下午就激动的看了。结果.... 第一章,内容不明不白的就过去了,真的可以称为是浅尝辄止,都不知道讲了些什么就完了。。。 第二章,讲爬虫,莫名其妙的,哎。 第三章,IRS语言....原来是自己开发的。。。介绍缺乏逻辑,没有层次更没有足够的示例,一句话,没表...
评分今天中午拿到书,下午就激动的看了。结果.... 第一章,内容不明不白的就过去了,真的可以称为是浅尝辄止,都不知道讲了些什么就完了。。。 第二章,讲爬虫,莫名其妙的,哎。 第三章,IRS语言....原来是自己开发的。。。介绍缺乏逻辑,没有层次更没有足够的示例,一句话,没表...
搜索引擎零距离 pdf epub mobi txt 电子书 下载 2024