搜索引擎技術及趨勢
2006/2/22 13:08:00
隨著因特網的迅猛發展、WEB信息的增加,用戶要在信息海洋里查找信息,就象大海撈針一樣, 搜索引擎技術恰好解決了這一難題(它可以為用戶提供信息檢索服務)。目前,搜索引擎技術正成為計算機工業界和學術界爭相研究、開發的對象。
李曉明:1982年畢業于哈爾濱工業大學,1986年畢業于美國史蒂文斯理工學院計算機系,獲博士學位。現任北京大學計算機科學技術系教授,博士生導師,系主任. 研究方向為計算機并行與分布處理。
劉建國:北京大學計算機系副教授。
搜索引擎(Search Engine)是隨著WEB信息的迅速增加,從1995年開始逐漸發展起來的技術。據發表在《科學》雜志1999年7月的文章《WEB信息的可訪問性》估計,全球目前的網頁超過8億,有效數據超過9T,并且仍以每4個月翻一番的速度增長。用戶要在如此浩瀚的信息海洋里尋找信息,必然會"大海撈針"無功而返。搜索引擎正是為了解決這個"迷航"問題而出現的技術。搜索引擎以一定的策略在互聯網中搜集、發現信息,對信息進行理解、提取、組織和處理,并為用戶提供檢索服務,從而起到信息導航的目的。搜索引擎提供的導航服務已經成為互聯網上非常重要的網絡服務,搜索引擎站點也被美譽為"網絡門戶"。搜索引擎技術因而成為計算機工業界和學術界爭相研究、開發的對象。本文旨在對搜索引擎的關鍵技術進行簡單的介紹,以起到拋磚引玉的作用。
分 類
按照信息搜集方法和服務提供方式的不同,搜索引擎系統可以分為三大類:
1.目錄式搜索引擎:以人工方式或半自動方式搜集信息,由編輯員查看信息之后,人工形成信息摘要,并將信息置于事先確定的分類框架中。信息大多面向網站,提供目錄瀏覽服務和直接檢索服務。該類搜索引擎因為加入了人的智能,所以信息準確、導航質量高,缺點是需要人工介入、維護量大、信息量少、信息更新不及時。這類搜索引擎的代表是: YAHOO、Open Directory、Go Guide等。
2.機器人搜索引擎:由一個稱為蜘蛛(Spider)的機器人程序以某種策略自動地在互聯網中搜集和發現信息,由索引器為搜集到的信息建立索引,由檢索器根據用戶的查詢輸入檢索索引庫,并將查詢結果返回給用戶。服務方式是面向網頁的全文檢索服務。該類搜索引擎的優點是信息量大、更新及時、毋需人工干預,缺點是返回信息過多,有很多無關信息,用戶必須從結果中進行篩選。這類搜索引擎的代表是: 、Northern Light、Excite、Infoseek、FAST、 Lycos、GOOGLE;國內代表為:"天網"、悠游、OpenFind等。
3.元搜索引擎:這類搜索引擎沒有自己的數據,而是將用戶的查詢請求同時向多個搜索引擎遞交,將返回的結果進行重復排除、重新排序等處理后,作為自己的結果返回給用戶。服務方式為面向網頁的全文檢索。這類搜索引擎的優點是返回結果的信息量更大、更全,缺點是不能夠充分使用所使用搜索引擎的功能,用戶需要做更多的篩選。這類搜索引擎的代表是WebCrawler、InfoMarket等。
性 能 指 標
我們可以將WEB信息的搜索看作一個信息檢索問題,即在由WEB網頁組成的文檔庫中檢索出與用戶查詢相關的文檔。所以我們可以用衡量傳統信息檢索系統的性能參數-召回率(Recall)和精度(Pricision)衡量一個搜索引擎的性能。
召回率是檢索出的相關文檔數和文檔庫中所有的相關文檔數的比率,衡量的是檢索系統(搜索引擎)的查全率;精度是檢索出的相關文檔數與檢索出的文檔總數的比率,衡量的是檢索系統(搜索引擎)的查準率。對于一個檢索系統來講,召回率和精度不可能兩全其美:召回率高時,精度低,精度高時,召回率低。所以常常用11種召回率下11種精度的平均值(即11點平均精度)來衡量一個檢索系統的精度。對于搜索引擎系統來講,因為沒有一個搜索引擎系統能夠搜集
下一頁
返回列表
返回首頁
主站蜘蛛池模板:
男生被男生到爽动漫|
2020国产精品自拍|
日本5级床片全免费|
亚洲中文精品久久久久久不卡|
99这里只有精品|
欧美性色欧美a在线播放|
免费视频爱爱太爽了|
最色网在线观看|
天天射天天爱天天干|
中文字幕国语对白在线电影|
日韩欧美一区二区三区免费观看
|
精品一区二区三区在线视频|
国产亚洲女在线精品|
黄+色+性+人免费|
国产精品线在线精品|
baoyu116.永久免费视频|
成人欧美一区二区三区的电影|
久久综合九色综合欧美狠狠|
欧美性xxxxx极品|
亚洲欧美日韩精品专区|
玩弄放荡人妻少妇系列视频|
午夜福利AV无码一区二区|
色婷婷五月综合丁香中文字幕
|
国产人妖ts在线视频播放|
欧美人与物videos另|
国产精品国产三级国产普通话
|
4480新热播影院|
在线天堂av影院|
jizzjizz成熟丰满舒服|
成人人观看的免费毛片|
丰满熟女高潮毛茸茸欧洲|
欧美精品偷自拍另类在线观看|
免费国内精品久久久久影院|
精品视频在线观看你懂的一区|
国产一卡二卡3卡4卡四卡在线
|
日韩精品欧美国产精品亚|
亚洲人成人网站在线观看|
欧美日韩视频在线播放|
亚洲精品成人久久|
熟妇人妻va精品中文字幕|
伊人久久大香线蕉综合电影网
|