什么是垂直搜索?
2006/2/21 20:41:00
  垂直搜索是針對某一個行業的專業搜索引擎,是搜索引擎的細分和延伸,是對網頁庫中的某類專門的信息進行一次整合,定向分字段抽取出需要的數據進行處理后再以某種形式返回給用戶。
   垂直搜索引擎和普通的網頁搜索引擎的最大區別是對網頁信息進行了結構化信息抽取,也就是將網頁的非結構化數據抽取成特定的結構化信息數據,好比網頁搜索是以網頁為最小單位,基于視覺的網頁塊分析是以網頁塊為最小單位,而垂直搜索是以結構化數據為最小單位。然后將這些數據存儲到數據庫,進行進一步的加工處理,如:去重、分類等,最后分詞、索引再以搜索的方式滿足用戶的需求。
  整個過程中,數據由非結構化數據抽取成結構化數據,經過深度加工處理后以非結構化的方式和結構化的方式返回給用戶。
    垂直搜索引擎的應用方向很多,比如企業庫搜索、供求信息搜索引擎、購物搜索、房產搜索、人才搜索、地圖搜索、mp3搜索、圖片搜索……幾乎各行各業各類信息都可以進一步細化成各類的垂直搜索引擎。
    舉個例子來說明會更容易理解,比如購物搜索引擎,整體流程大致如下:抓取網頁后,對網頁商品信息進行抽取,抽取出商品名稱、價格、簡介……甚至可以進一步將筆記本簡介細分成“品牌、型號、CPU、內存、硬盤、顯示屏、……”然后對信息進行清洗、去重、分類、分析比較、數據挖掘,最后通過分詞索引提供用戶搜索、通過分析挖掘提供市場行情報告。
  垂直搜索引擎大體上需要以下技術
    1.Spider
    2.網頁結構化信息抽取技術或元數據采集技術
    3.分詞、索引
    4.其他信息處理技術

  垂直搜索引擎的技術評估應從以下幾點來判斷
    1.全面性
    2.更新性
    3.準確性
    4.功能性
  垂直搜索的進入門檻很低,但是競爭的門檻很高。沒有專注的精神和精湛的技術是不行的。行業門戶網站具備行業優勢但他們又是沒有技術優勢的,絕對不要想像著招幾個人就可以搞定垂直搜索的全部技術,作為一個需要持續改進可運營的產品而不是一個項目來說對技術的把握控制程度又是垂直搜索成功的重要因素之一。

返回列表
返回首頁 主站蜘蛛池模板: 欧美精品久久天天躁| 欧美日韩另类综合| 日产精品卡一卡2卡三卡乱码工厂| 亚洲国产综合网| 男人j插入女人p| 国产91热爆ts人妖在线| 精品香蕉在线观看免费| 毛片让我看一下毛片| 同学麻麻下面好紧第一次| 高清无码视频直接看| 国产精品久久自在自线观看 | 野花社区在线播放| 国产精品jizz在线观看老狼| 97精品依人久久久大香线蕉97| 好吊视频一区二区三区| 中文字幕亚洲日韩无线码| 日本理论片午午伦夜理片2021| 亚洲av之男人的天堂网站| 欧美成人性动漫在线观看| 亚洲精品无码久久久久| 看全免费的一级毛片| 可以免费看污视频的网站| 蜜桃精品免费久久久久影院| 国产性夜夜春夜夜爽三级| 色香蕉在线观看| 国产精品国三级国产aⅴ| 91精品国产自产在线观看高清| 天堂在线免费观看mv| √天堂资源最新版中文种子| 成人国产精品2021| 丰满少妇人妻无码| 日本免费一二区在线电影| 久久精品国产亚洲av成人| 朝桐光亚洲专区在线中文字幕 | 在线精品一区二区三区电影| japanesexxxxhd熟睡直播| 宅男66lu国产乱在线观看| 丫头稚嫩紧窄小缝| 无码人妻丰满熟妇区五十路百度 | 亚洲一级片免费看| 欧美性色黄大片www喷水|