圖書標籤: 搜索引擎 解密搜索引擎技術實戰 互聯網 web 計算機網絡 計算機 電子工業 同學!
发表于2025-01-24
解密搜索引擎技術實戰 pdf epub mobi txt 電子書 下載 2025
本書是獵兔搜索開發團隊的軟件研發和教學實踐的經驗匯總。
本書總結搜索引擎相關理論與實際解決方案,並給齣瞭Java實現,其中利用瞭流行的開源項目Lucene和Solr,而且還包括原創的實現。
主要包括總體介紹部分、爬蟲部分、自然語言處理部分、全文檢索部分以及相關案例分析。
爬蟲部分介紹瞭網頁遍曆方法和如何實現增量抓取。並介紹瞭從網頁等各種格式的文檔中提取主要內容的方法。
自然語言處理部分從統計機器學習的原理齣發,包括瞭中文分詞與詞性標注的理論與實現以及在搜索引擎中的實用等細節。
同時對文檔排重、文本分類、自動聚類、句法分析樹、拼寫檢查等自然語言處理領域的經典問題做齣瞭深入淺齣的介紹並總結瞭實現方法。
在全文檢索部分,結閤Lucene3.0介紹瞭搜索引擎的原理與進展。用簡單的例子介紹瞭Lucene的最新應用方法。包括完整的搜索實現過程:從完成索引到搜索用戶界麵的實現。本書還進一步介紹瞭實現準實時搜索的方法。
展示瞭Solr1.4版本的用法以及實現分布式搜索服務集群的方法。
最後介紹瞭在地理信息係統領域和戶外活動搜索領域的應用。
獵兔搜索(http://www.lietu.com)創始人,當前獵兔搜索在北京和上海均設有研發部。帶領獵兔搜索技術開發團隊先後開發齣獵兔中文分詞係統、獵兔信息提取係統、獵兔智能垂直搜索係統以及網絡信息監測係統等,實現互聯網信息的采集、過濾、搜索和實時監測。
做搜索引擎可以看看,反正畢設跟他也差不多。
評分做搜索引擎可以看看,反正畢設跟他也差不多。
評分做搜索引擎可以看看,反正畢設跟他也差不多。
評分做搜索引擎可以看看,反正畢設跟他也差不多。
評分做搜索引擎可以看看,反正畢設跟他也差不多。
一本太装的书,看着目录还行,看看里面的内容,就受不了了。。。 大部分内容没有深度,这个倒不算什么大问题 毕竟是实战嘛 很多地方 标题和内容根本对不上 不少地方语句之间衔接不起来 粗制滥造啊 拜托以后不要再写这种书了 首先要端正态度啊
評分一本太装的书,看着目录还行,看看里面的内容,就受不了了。。。 大部分内容没有深度,这个倒不算什么大问题 毕竟是实战嘛 很多地方 标题和内容根本对不上 不少地方语句之间衔接不起来 粗制滥造啊 拜托以后不要再写这种书了 首先要端正态度啊
評分搞一堆术语,本来很装逼的书... 结果,Struts2什么ajax都扯进来... 掉价... 个人认为是堆砌的书... 不值得购买... 当然....初学者嘛..还是值得看看入门的... 邮件列表更加有参考价值... 这书不专....求太广了.....就不太可能变的精...
評分对搜索引擎技术讲解的比较全面,读了之后对搜索引擎技术能了解得比较全面。同时对于Lucene的介绍也是传承了本书的特点:细致、全面。看了之后对Lucene,还有起相关的组件Solar啊等等也有了初步的认识。对于初学者还是值得读一下的。对于搜索引擎技术和Lucene能够建立起立体全面...
評分对搜索引擎技术讲解的比较全面,读了之后对搜索引擎技术能了解得比较全面。同时对于Lucene的介绍也是传承了本书的特点:细致、全面。看了之后对Lucene,还有起相关的组件Solar啊等等也有了初步的认识。对于初学者还是值得读一下的。对于搜索引擎技术和Lucene能够建立起立体全面...
解密搜索引擎技術實戰 pdf epub mobi txt 電子書 下載 2025