企業(yè)級(jí)搜索概念整合內(nèi)外部信息
當(dāng)企業(yè)信息化做的差不多了,ERP、OA、CRM也都上了,信息生成后該怎么管理?找不到信息就跟沒(méi)有信息一樣。在這種需求下,企業(yè)搜索應(yīng)運(yùn)而生。它是信息管理中最好的一個(gè)管理方式。
企業(yè)搜索是一個(gè)過(guò)濾器
自人類進(jìn)入信息化時(shí)代以來(lái),信息總量正在飛速增長(zhǎng)。有專家進(jìn)行測(cè)算發(fā)現(xiàn),人類的知識(shí),19世紀(jì)每50年增加1倍,20世紀(jì)中葉每10年增加1倍,70年代每5年增加1倍,目前已達(dá)到每年增加100%。
信息量的急劇膨脹,使得信息的搜索工作變得極為繁重起來(lái)。據(jù)調(diào)查統(tǒng)計(jì),人們?cè)谄綍r(shí)的工作中,有70%的時(shí)間都花費(fèi)在信息搜索上,而僅有30%的時(shí)間用于創(chuàng)造價(jià)值的工作上。由此,如何提高人們搜索信息的效率成為眾多企業(yè)為之努力的方向。當(dāng)互聯(lián)網(wǎng)在大眾當(dāng)中逐漸得到普及,搜索引擎工具的推出,使得“Search”這個(gè)賦予其新意義的詞語(yǔ)成為這一社會(huì)歷史階段的時(shí)髦之物,人們的工作生活方式也因此發(fā)生了新的變化。
但是,互聯(lián)網(wǎng)搜索引擎工具只解決了公眾信息查詢的問(wèn)題,對(duì)于企業(yè)而言,查找企業(yè)內(nèi)部的信息資源依然存在一定的難度。因?yàn)殡S著我國(guó)信息化建設(shè)的推進(jìn),企業(yè)內(nèi)部的信息基礎(chǔ)也有了很大的變化。據(jù)統(tǒng)計(jì),企業(yè)數(shù)據(jù)每年以200%的速度增長(zhǎng),其中 80%的數(shù)據(jù)以文件、郵件、圖片等非結(jié)構(gòu)化數(shù)據(jù)存放在企業(yè)內(nèi)計(jì)算機(jī)系統(tǒng)中的各個(gè)角落。而且這些數(shù)據(jù)總量遠(yuǎn)遠(yuǎn)超過(guò)了互聯(lián)網(wǎng)信息的總量。有數(shù)據(jù)表明,企業(yè)發(fā)布到互聯(lián)網(wǎng)的信息只占到信息量的1%~2%,而98%以上的信息是存儲(chǔ)在企業(yè)內(nèi)部的。
把搜索的概念引入到企業(yè)內(nèi)外部信息的整合,并采用自動(dòng)的方式進(jìn)行搜索,這樣便形成了企業(yè)搜索。
與互聯(lián)網(wǎng)搜索的差別
企業(yè)搜索的英文是“Enterprise Search”, 把搜索的概念引入到企業(yè)內(nèi)外部信息的整合,并采用自動(dòng)的方式進(jìn)行搜索,這樣便形成了企業(yè)搜索。
不需要進(jìn)入公司的內(nèi)網(wǎng),只需在搜索框中輸入某個(gè)關(guān)鍵詞,與此相關(guān)的所有內(nèi)容,從互聯(lián)網(wǎng)到公司局域網(wǎng)直至公司分部(國(guó)外和外省市)局域網(wǎng),從公司內(nèi)部職員個(gè)人電腦上的各種文檔到公司內(nèi)部的數(shù)據(jù)庫(kù)以及內(nèi)部系統(tǒng)中以各種文件和數(shù)據(jù)格式存儲(chǔ)的大量資料,都可以輕而易舉地在幾秒鐘之內(nèi)被查詢出來(lái)。就像使用Google和百度等搜索工具那樣,可以輕松、便捷地搜索企業(yè)內(nèi)的所有文件和數(shù)據(jù),這聽(tīng)起來(lái)多少讓人感到有些玄乎,但實(shí)際上,國(guó)內(nèi)已有不少企業(yè)開(kāi)始享受到企業(yè)搜索工具為他們查詢企業(yè)內(nèi)部浩瀚信息時(shí)所帶來(lái)的便利和快捷。發(fā)現(xiàn)會(huì)有營(yíng)業(yè)員做引導(dǎo),會(huì)有專家?guī)湍阃扑],各個(gè)書(shū)架也進(jìn)行了非常細(xì)致的分類。整個(gè)找書(shū)的過(guò)程可能只需花20分鐘,而去書(shū)市買同一本書(shū),恐怕你至少得花三、四個(gè)小時(shí)還未必能夠找到。去書(shū)店買書(shū)和去書(shū)市買書(shū)的體驗(yàn)是完全不同的,而企業(yè)搜索就是要帶給你這種完全不同的搜索體驗(yàn):除了查詢以外,還有信息的分類、關(guān)聯(lián)以及專家的推薦,這樣一個(gè)系統(tǒng)和簡(jiǎn)單的互聯(lián)網(wǎng)查詢是完全不同的。
搜索引擎
隨著搜索引擎技術(shù)和市場(chǎng)的不斷發(fā)展,出現(xiàn)了多種不同類型的搜索引擎,各類媒體上有關(guān)搜索引擎的名詞也越來(lái)越多,甚至產(chǎn)生讓人眼花繚亂的感覺(jué),如交互式搜索引擎、第三代搜索引擎、第四代搜索引擎、桌面搜索、地址欄搜索、本地搜索、個(gè)性化搜索引擎、專家型搜索引擎、購(gòu)物搜索引擎、自然語(yǔ)言搜索引擎、新聞搜索引擎、 MP3搜索引擎、圖片搜索引擎……
盡管搜索引擎有各種不同的表現(xiàn)形式和應(yīng)用領(lǐng)域,如果從搜索引擎的工作原理來(lái)區(qū)分,搜索引擎有兩種基本類型:一類是純技術(shù)型的全文檢索搜索引擎,如 google、AltaVista、Inktomi等,其原理是通過(guò)機(jī)器手(即Spider程序)到各個(gè)網(wǎng)站收集、存儲(chǔ)信息,并建立索引數(shù)據(jù)庫(kù)供用戶查詢。需要說(shuō)明的是,這些信息并不是搜索引擎即時(shí)從互聯(lián)網(wǎng)上檢索得到的,通常
其中的“企業(yè)”二字并非指單純的企業(yè),政府、教育、科研、媒體、醫(yī)療、軍隊(duì)等機(jī)構(gòu)都可以歸入到它的應(yīng)用范疇。因此,很多時(shí)候,人們會(huì)稱其為“企業(yè)級(jí)搜索”。
企業(yè)搜索雖然與互聯(lián)網(wǎng)搜索同為搜索工具,然而其背后的需求和技術(shù)的復(fù)雜程度卻有很大的差別;ヂ(lián)網(wǎng)搜索是要找到一兩條信息,一般人們?cè)谑褂没ヂ?lián)網(wǎng)搜索時(shí),通常只會(huì)翻前面的一兩頁(yè)。而企業(yè)搜索是不僅要找到這些最基礎(chǔ)的信息,而且要從這些信息的關(guān)聯(lián)中找到新的信息。
企業(yè)內(nèi)部的信息很多都是相互關(guān)聯(lián)的,只有把這些信息組織管理起來(lái),才能更有效的加以利用。而企業(yè)搜索就是一種組織形式,是將企業(yè)內(nèi)部信息組織化、管理化。對(duì)企業(yè)搜索來(lái)說(shuō),找到信息是第一步,而更重要的是找到信息之間的關(guān)聯(lián)。
搜索需求的差別化使得企業(yè)搜索與互聯(lián)網(wǎng)搜索相互區(qū)分開(kāi)來(lái)。其中典型的一個(gè)區(qū)別是,企業(yè)搜索更具有個(gè)性化和智能化,而互聯(lián)網(wǎng)搜索則強(qiáng)調(diào)“人人平等”在互聯(lián)網(wǎng)搜索面前,人們沒(méi)有職業(yè)的差別,也沒(méi)有高低貴賤之分,更不受個(gè)人喜好的絲毫影響,只要輸入的是相同的關(guān)鍵詞,任何人所搜索到的結(jié)果肯定是相同的。人們只能在所搜索的結(jié)果之上,再通過(guò)手工篩選,才能得到與自己搜索需求相同或相近的資料。
與此不同的是,企業(yè)搜索的要求卻遠(yuǎn)遠(yuǎn)要高于互聯(lián)網(wǎng)搜索。因?yàn)槠髽I(yè)用戶需要查找的信息專業(yè)性強(qiáng),概念復(fù)雜,對(duì)查詢的查全率和查準(zhǔn)率有很高的要求。企業(yè)內(nèi)部的信息也并不像互聯(lián)網(wǎng)上那么泛濫無(wú)邊,一旦有所遺漏,有可能會(huì)對(duì)企業(yè)用戶的應(yīng)用和決策造成影響,所以企業(yè)搜索必須對(duì)企業(yè)內(nèi)部每個(gè)需要提供服務(wù)的信息進(jìn)行搜索,在保障效率的前提下達(dá)到全面搜索的要求。
其次,企業(yè)內(nèi)部的信息內(nèi)容帶有明顯的“等級(jí)”特性。什么樣的信息可以提供給什么樣的人看,這在企業(yè)內(nèi)部都有嚴(yán)格的劃分。
“這一點(diǎn)在與國(guó)家安全有關(guān)的部門(mén),甚
至一般的企業(yè)中都有明顯的需求:一個(gè)政府機(jī)構(gòu)或是企業(yè)在實(shí)現(xiàn)信息化、信息系統(tǒng)共享的過(guò)程中,絕對(duì)不能以犧牲保密信息的安全性為代價(jià)!泵绹(guó)Verity公司大中華區(qū)首席代表黃浩對(duì)記者這樣解釋。
因此,針對(duì)企業(yè)內(nèi)部信息系統(tǒng)中,不同的用戶使用權(quán)限不同的這一特點(diǎn),企業(yè)搜索必須具備對(duì)用戶、對(duì)資源進(jìn)行權(quán)限分級(jí)管理和控制。這樣一來(lái),防止信息外漏對(duì)企業(yè)搜索的“安全”性能也有很高的要求。因搜索的結(jié)果泄漏了企業(yè)的機(jī)密,這是任何企業(yè)都不愿意看到的事情。所以企業(yè)搜索必須確保企業(yè)內(nèi)部信息系統(tǒng)的安全。
此外,由于企業(yè)內(nèi)部的搜索服務(wù)帶有鮮明的業(yè)務(wù)特性,不像互聯(lián)網(wǎng)搜索那樣僅僅起到提供信息參考的作用,而是將直接參與到企業(yè)的運(yùn)營(yíng)和決策中,所以,對(duì)于企業(yè)搜索的結(jié)果處理,會(huì)采用相關(guān)智能技術(shù),如相關(guān)度分析技術(shù)等,以達(dá)到迅速、準(zhǔn)確的搜索效果。
企業(yè)搜索與互聯(lián)網(wǎng)搜索還有一個(gè)顯著不同的地方是,互聯(lián)網(wǎng)上搜索的數(shù)據(jù)一般都是以HTML為基礎(chǔ)的網(wǎng)頁(yè),而企業(yè)搜索的數(shù)據(jù)除了互聯(lián)網(wǎng)和內(nèi)部網(wǎng)站上的網(wǎng)頁(yè),還有企業(yè)內(nèi)部的數(shù)據(jù)庫(kù)形式、Word、Excel、PDF等非結(jié)構(gòu)化和半結(jié)構(gòu)化的數(shù)據(jù),這些不同形式的數(shù)據(jù)分布在不同介質(zhì)的載體上。因此,企業(yè)搜索必須具備對(duì)這些復(fù)雜結(jié)構(gòu)數(shù)據(jù)進(jìn)行搜索的能力。
企業(yè)搜索其實(shí)起到把信息源從書(shū)市的狀態(tài)變成書(shū)店?duì)顟B(tài)的作用。去書(shū)店買書(shū),你
鏈接
三種搜索引擎工具的對(duì)比
對(duì)象
網(wǎng)頁(yè)、圖像及MP3等部分類型的多媒體文件
PC內(nèi)部的所有文檔信息
企業(yè)內(nèi)部所有的信息資源,
以及部分外部資源
企業(yè)資料庫(kù)、目錄、幫助文本、源代碼信息庫(kù)、新聞組等,如網(wǎng)頁(yè)、電子郵件、office文件、pdf文件、圖片、音視頻多媒體文件、圖表、公文、研究報(bào)告等
專業(yè)、定向的搜索,注重結(jié)果的準(zhǔn)確性和高度匹配性,并且是一種信息安全的搜索。
個(gè)人桌面搜索搜索引擎
所說(shuō)的搜索引擎,其實(shí)是一個(gè)收集了大量網(wǎng)站/網(wǎng)頁(yè)資料并按照一定規(guī)則建立索引的在線數(shù)據(jù)庫(kù),如2004年3月底google收錄的網(wǎng)頁(yè)數(shù)量已經(jīng)超過(guò)42億個(gè),這樣,當(dāng)用戶檢索時(shí)才可以在很短的時(shí)間內(nèi)反饋大量的結(jié)果。
另一類稱為分類目錄,這種“搜索引擎”并不采集網(wǎng)站的任何信息,而是利用各網(wǎng)站向“搜索引擎”提交網(wǎng)站信息時(shí)填寫(xiě)的關(guān)鍵詞和網(wǎng)站描述等資料,經(jīng)過(guò)人工審核編輯后,如果符合網(wǎng)站登錄的條件,則輸入數(shù)據(jù)庫(kù)以供查詢。yahoo是分類目錄的典型代表,國(guó)內(nèi)的搜狐、新浪等搜索引擎也是從分類目錄發(fā)展起來(lái)的。分類目錄的好處是,用戶可以根據(jù)目錄有針對(duì)性地逐級(jí)查詢自己需要的信息,而不是像技術(shù)性搜索引擎一樣同時(shí)反饋大量的信息,而這些信息之間的關(guān)聯(lián)性并不一定符合用戶的期望。
從實(shí)質(zhì)上看,利用機(jī)器手自動(dòng)檢索網(wǎng)頁(yè)信息的搜索引擎才是真正意義上的搜索引擎。但從用戶應(yīng)用的角度來(lái)看,無(wú)論通過(guò)技術(shù)性的搜索引擎,還是人工分類目錄型的搜索引擎,都能實(shí)現(xiàn)自己查詢信息的目的(兩種形式可以獲得的信息不同,分類目錄通常只能檢索到相關(guān)網(wǎng)站的網(wǎng)址,而搜索引擎則可以直接檢索相關(guān)內(nèi)容的網(wǎng)頁(yè)),因此習(xí)慣上沒(méi)有必要嚴(yán)格區(qū)分這兩個(gè)概念,而是通稱為搜索引擎。不過(guò)要注意的是,由于兩種類型的搜索引擎原理不同,導(dǎo)致各種搜索引擎營(yíng)銷方式的差異,需要針對(duì)不同的搜索引擎采用不同的搜索引擎營(yíng)銷策略,因而處于網(wǎng)絡(luò)營(yíng)銷研究和應(yīng)用,有必要從概念和原理上給予區(qū)分。
現(xiàn)有各種新出現(xiàn)的搜索引擎都是在這兩種搜索引擎基本類型基礎(chǔ)上的技術(shù)革新、應(yīng)用方式變革、或者應(yīng)用領(lǐng)域的細(xì)分,例如購(gòu)物搜索引擎,可以理解為搜索引擎在網(wǎng)上購(gòu)物領(lǐng)域的一個(gè)分支,這個(gè)搜索引擎僅僅在網(wǎng)上購(gòu)物網(wǎng)站中收集各種信息,而不考慮其他領(lǐng)域的信息,這樣可以做到更強(qiáng)的針對(duì)性和專業(yè)性。
提供企業(yè)搜索服務(wù)的知名公司
Autonomy: Autonomy公司是世界上最為先進(jìn)的非結(jié)構(gòu)化信息處理平臺(tái)提供商之一。它為用戶提供安全穩(wěn)定的信息檢索、分析、管理、加工等信息服務(wù)和系統(tǒng)構(gòu)造服務(wù)。Autonomy 公司正在服務(wù)于全球近千家大客戶,在世界上擁有超過(guò)130家合作伙伴構(gòu)成的服務(wù)網(wǎng)絡(luò),快速地將Autonomy公司最新技術(shù)應(yīng)用于各個(gè)實(shí)際的領(lǐng)域。2003年3月,Autonomy公司正式進(jìn)入中國(guó)市場(chǎng),目前主要集中在電信和政府市場(chǎng)。
FAST: FAST創(chuàng)造了實(shí)時(shí)搜索和過(guò)濾技術(shù)方案,它們?cè)谀缓鬄楸姸嗍澜缰窘鉀Q了最為棘手的搜索難題。FAST靈活、可升級(jí)的一體化技術(shù)平臺(tái)提升了企業(yè)客戶的搜索能力,讓忽視媒介的情況下,把人們連接到他們所搜索相關(guān)的信息。通過(guò)有效地利用IT體系結(jié)構(gòu),這帶來(lái)了收入的增加和總所有權(quán)費(fèi)用的下降。FAST強(qiáng)大的企業(yè)搜索技術(shù)解決方案正被廣泛的全球客戶和合作伙伴所使用,包括:AT & T、Cardinal Health、CareerBuilder.com、Charles Schwab & Co.、Chordiant、CIGNA、CNET、Dell、Fidelity Investments、Rakuten、Reed Elsevier、Reuters、Tenet Healthcare、T-Online、US Army、Virgilio(意大利電信公司)等。
TRS: 北京拓爾思(TRS)信息技術(shù)有限公司成立于1993年,十年來(lái)公司始終專注于具有自主核心技術(shù)和知識(shí)產(chǎn)權(quán)的企業(yè)級(jí)應(yīng)用軟件產(chǎn)品研發(fā),并為行業(yè)用戶提供高質(zhì)量的應(yīng)用軟件系統(tǒng)設(shè)計(jì)、集成和開(kāi)發(fā)服務(wù),公司是信息檢索、內(nèi)容管理和知識(shí)挖掘領(lǐng)域的領(lǐng)導(dǎo)廠商。 TRS產(chǎn)品廣泛應(yīng)用于電子政府、數(shù)字化傳媒、企業(yè)內(nèi)容管理、數(shù)字圖書(shū)館和信息資源管理等領(lǐng)域,獲得1500家國(guó)內(nèi)外企業(yè)級(jí)用戶的青睞和認(rèn)可。公司總部設(shè)在北京,在上海、廣州、成都和湖南等地設(shè)有分公司或辦事處,現(xiàn)有員工近200人,是中國(guó)最具實(shí)力的軟件開(kāi)發(fā)商之一。研究、開(kāi)發(fā)和服務(wù)的無(wú)縫融合是TRS公司服務(wù)于客戶和被用戶信賴的核心競(jìng)爭(zhēng)力,公司的發(fā)展目標(biāo)是成為中國(guó)軟件產(chǎn)業(yè)的領(lǐng)軍企業(yè)之一。
Google: 互聯(lián)網(wǎng)搜索巨頭Google正在采取更加積極的措施,以把該公司面向個(gè)人消費(fèi)者的搜索服務(wù)提供給企業(yè)。自從Google兩年推出面向企業(yè)用戶的Google搜索設(shè)備以來(lái),目前已經(jīng)有超過(guò)500家的企業(yè)選擇使用該公司的這款軟硬件結(jié)合的解決方案。Google企業(yè)業(yè)務(wù)的客戶使用該公司的搜索設(shè)備可以對(duì)公共網(wǎng)站和企業(yè)內(nèi)部網(wǎng)站進(jìn)行搜索,在配合 Google的網(wǎng)站使用后,用戶可以獲得一種全面的搜索體驗(yàn)。Google搜索設(shè)備所使用的技術(shù)都是該公司為Google網(wǎng)站開(kāi)發(fā)的,隨著Google繼續(xù)擴(kuò)大其企業(yè)業(yè)務(wù),該公司還將繼續(xù)這一模式,即不斷把該公司為Google網(wǎng)站開(kāi)發(fā)的技術(shù)轉(zhuǎn)移到搜索設(shè)備中來(lái)。