劉佳秋 李鵬
對(duì)文獻(xiàn)分布的掌握程度決定了專利分析的精準(zhǔn)程度,正確的文獻(xiàn)數(shù)據(jù)是專利分析的前提,檢索系統(tǒng)是獲得文獻(xiàn)數(shù)據(jù)的基礎(chǔ),因此檢索系統(tǒng)是決定專利分析正確與否的關(guān)鍵因素之一。
在專利檢索、數(shù)據(jù)分析方面,歐專局有著絕對(duì)的權(quán)威性,這離不開(kāi)歐專局專業(yè)的檢索系統(tǒng)。EPOQUE NET 4.5是歐專局近期主用的一個(gè)在線檢索系統(tǒng),可檢索專利文獻(xiàn)和非專利文獻(xiàn),筆者通過(guò)與歐專局的專項(xiàng)交流,學(xué)習(xí)和了解了一些EPOQUE NET 4.5系統(tǒng)的新功能,簡(jiǎn)單介紹如下,供檢索人員參考。
一、COMBI(聯(lián)合檢索)
COMBI是同族和相關(guān)文獻(xiàn)的聯(lián)合檢索。COMBI主要功能是查找參考文獻(xiàn),包括查找同族、引證和被引證文獻(xiàn)等。其中查找同族,包括查找廣義同族和精細(xì)查找狹義同族,同時(shí)可以根據(jù)需要將廣義同族和狹義同族進(jìn)行區(qū)分。對(duì)于引證和被引證文獻(xiàn),COMBI的追蹤十分全面,給出的文獻(xiàn)信息也較以往檢索系統(tǒng)的結(jié)果更為完整,例如給出了文獻(xiàn)的分類號(hào)和它們出現(xiàn)的頻率,其中的分類號(hào)可以鏈接到+Cla分類模塊用以查看分類含義。COMBI的作用主要體現(xiàn)在預(yù)檢索功能上,用于在檢索開(kāi)始階段或者檢索過(guò)程中,追蹤輸入文獻(xiàn)及其同族的引用文獻(xiàn)、引用該輸入文獻(xiàn)或其同族的文獻(xiàn)、申請(qǐng)人引用的文獻(xiàn)、以及其他引用文獻(xiàn)等,并提供這些文獻(xiàn)的分類號(hào)以便審查員檢索時(shí)使用。
COMBI不僅給出輸入文獻(xiàn)及其同族在EPODOC庫(kù)和NPL庫(kù)中的引用和被引用文獻(xiàn),還給出了申請(qǐng)人引用的文獻(xiàn)以及在申請(qǐng)人引用里面引用了輸入文獻(xiàn)的文獻(xiàn)以及輸入文獻(xiàn)及其同族之外的所有其他文獻(xiàn)引用或被引用文獻(xiàn)。
如圖1所示,COMBI還可以將追蹤到的文獻(xiàn)進(jìn)行拆分和排序。拆分(split)時(shí),通過(guò)限定優(yōu)先權(quán)日和申請(qǐng)日,將追蹤到的文獻(xiàn)區(qū)分成現(xiàn)有技術(shù)、中間文件和在后文件,還可以進(jìn)一步利用其它條件(例如是否包含某一分類號(hào))做拆分。
排序(rank)時(shí),可以按照文獻(xiàn)或者其族成員的公開(kāi)日(publication date)、相關(guān)性(relevance(number of hits))或者文獻(xiàn)在EP申請(qǐng)中被引用的頻率(the frequency of a document as cited document in EP applications)來(lái)進(jìn)行排序,以便將可能更重要的文獻(xiàn)優(yōu)先顯示給用戶。
二、X-Full(全文檢索)
X-Full是全文檢索模塊,它支持同時(shí)在多個(gè)數(shù)據(jù)庫(kù)中進(jìn)行檢索,并且可以在不同的分類號(hào)、不同的語(yǔ)言和不同的數(shù)據(jù)庫(kù)之間進(jìn)行并行檢索,這種方式的優(yōu)勢(shì)在于大大減少了檢索人員輸入檢索式的次數(shù),由此提高檢索效率。
如圖2所示,X-Full界面縱向分成三欄,其中第一欄(最左面一欄)最左面各種檢索條件之間的關(guān)系為“OR”運(yùn)算;第二欄(中間一欄)檢索人員可根據(jù)需要輸入檢索詞,該輸入支持三種語(yǔ)言:英語(yǔ)、法語(yǔ)和德語(yǔ),各檢索詞之間的關(guān)系是“OR”運(yùn)算,不同語(yǔ)言的檢索詞之間也是“OR”運(yùn)算;第一欄的檢索條件與第二欄的檢索條件之間是“AND”運(yùn)算關(guān)系,檢索歷史和檢索命中數(shù)在第三欄顯示。
X-Full分為常規(guī)檢索和面檢索兩種方式。常規(guī)檢索就是在上面的三欄中輸入相應(yīng)的檢索信息,按照用戶輸入的指令進(jìn)行檢索;面檢索是根據(jù)用戶輸入的各個(gè)概念組成檢索要素自動(dòng)進(jìn)行檢索要素之間的組合嘗試,給出不同檢索組合的結(jié)果。
也就是說(shuō),面檢索(Facet search),是通過(guò)建立多個(gè)概念(Concept),即構(gòu)建多個(gè)“塊”,通過(guò)系統(tǒng)進(jìn)對(duì)這些塊的組合進(jìn)行檢索。例如,構(gòu)建了3個(gè)塊,那么系統(tǒng)就會(huì)給出,同時(shí)包含3個(gè)塊的檢索結(jié)果、只包含其中2個(gè)塊的檢索結(jié)果、只包含1個(gè)塊的檢索結(jié)果,由此減少人工輸入,提高檢索效率。
三、Figure link(附圖鏈接)
在多數(shù)的現(xiàn)有附圖瀏覽方式中,我們無(wú)法通過(guò)附圖直接獲得附圖標(biāo)記的含義,而是要通過(guò)閱讀摘要或者全文獲得這方面的信息,這大大增大了瀏覽和篩選文獻(xiàn)的成本。在EPOQUE NET 4.5中,檢索人員通過(guò)viewer進(jìn)行附圖瀏覽時(shí)即可同時(shí)獲得附圖標(biāo)記的含義,即如圖3所示,附圖中可以同時(shí)顯示附圖標(biāo)記所指代的部件名稱,并且還可以在左邊文本欄內(nèi),高亮顯示出現(xiàn)該部件名稱的位置(如圖4紅色高亮所示)。這有助于檢索人員直接獲得與該附圖標(biāo)記相關(guān)的段落文字內(nèi)容,而省去了拖動(dòng)和瀏覽全文尋找相關(guān)段落的時(shí)間,由此提高文件瀏覽和篩選速度。
四、算符 UG和OG
在歐專局提供給我國(guó)的SEA2013的檢索系統(tǒng)中,審查員常用的“與”檢索包括使用“and”的粗檢索和利用同在算符“w ”和“d”進(jìn)行的絕對(duì)精細(xì)檢索,但沒(méi)有關(guān)于在數(shù)據(jù)標(biāo)引層面上的檢索算符的介紹。EPOQUE NET 4.5中的算符
例如:
20UG semiconductor, junction, surface
表示把在20個(gè)幀/窗口的數(shù)據(jù)庫(kù)句子中同時(shí)出現(xiàn)semiconductor, junction, surface這三個(gè)詞(不管這三個(gè)詞哪個(gè)詞先出現(xiàn),也不管它們的出現(xiàn)順序)的文獻(xiàn)檢索出來(lái)。
可見(jiàn),用UG和OG檢索比用算符AND檢索的結(jié)果更精準(zhǔn),噪聲更少,檢索出來(lái)的文獻(xiàn)相關(guān)度也會(huì)相應(yīng)高些,另外算符UG和OG比算符W/D、P/L的限制少,那么滿足檢索條件的檢索的結(jié)果更多,由此可以減小漏檢的幾率。因此,利用UG和OG檢索,是介于粗檢和絕對(duì)精檢之間的檢索方式,有助于獲得更真實(shí)的檢索數(shù)據(jù)。
五、T-fly(在線文獻(xiàn)翻譯)
T-fly是指在線的多國(guó)語(yǔ)言之間的互譯,用于彌補(bǔ)語(yǔ)言上的障礙?!癟-fly”用于實(shí)現(xiàn)31種語(yǔ)言與英語(yǔ)之間的互譯、以及28種語(yǔ)言(除中文、日文、韓文)與德語(yǔ)/法語(yǔ)之間的互譯、還包括從Google、SIPO、JPO和KIPO外網(wǎng)提供的翻譯軟件獲得譯文。但是目前多數(shù)文獻(xiàn)還不能自動(dòng)翻譯為中文,這一點(diǎn)有些遺憾。
通過(guò)使用EPOQUE NET 4.5可以發(fā)現(xiàn),EPOQUE NET 4.5中的COMBI、X-FULL等功能的設(shè)計(jì)確實(shí)為檢索人員提供了便捷的檢索方式,期待有越來(lái)越多的人使用EPOQUE NET 4.5,也希望能出現(xiàn)越來(lái)越多的優(yōu)秀檢索系統(tǒng)共檢索人員選擇和使用,以利于更精準(zhǔn)的做出專利分析和預(yù)警。
總之,EPOQUE NET 4.5采用的是通過(guò)互聯(lián)網(wǎng)進(jìn)行在線信息收集收取檢索費(fèi)用的方式,目前基于“使用中用戶數(shù)量(the number of active users)”和“執(zhí)行的數(shù)量(the number of transactions)”兩個(gè)因素進(jìn)行收費(fèi)?!笆褂弥杏脩魯?shù)量”指的是,在一個(gè)年度里,訪問(wèn)檢索系統(tǒng)的已注冊(cè)用戶數(shù)量。該項(xiàng)數(shù)據(jù)主要根據(jù)用戶ID(user ID)來(lái)計(jì)算,系統(tǒng)不支持同一個(gè)用戶ID同時(shí)在不同機(jī)器上登錄?!皥?zhí)行的數(shù)量”包括“檢索交互的數(shù)量(query interactions)”和“其他交互的數(shù)量(other interactions)” 。15個(gè)“其他交互”的費(fèi)用等同于1個(gè)“檢索交互”的費(fèi)用?!皺z索交互的數(shù)量”通常是指檢索式的數(shù)量?!捌渌换サ臄?shù)量”通常指輸入的命令,例如,顯示數(shù)據(jù)庫(kù)列表或者限制檢索范圍的命令。這些計(jì)費(fèi)方式為我國(guó)檢索系統(tǒng)計(jì)費(fèi)標(biāo)準(zhǔn)的制定提供了很好的參考和借鑒。