Derwent Innovation 的 AI 科技- Smart Search 智能檢索

Smart Search 是如何發展出來的?

Derwent Innovation (DI) 是一個與眾不同的專利資料庫。一般商業專利資料庫,會收錄各國官方的專利公開資料,但 Derwent Innovation 特別之處在於另提供 DWPI  專利加值資料庫,這是由數百位專家將收錄進資料庫的官方專利公開資料全篇閱讀後,進行翻譯、重點摘要改寫、內容除錯、專利權人正規化等作業,並將改寫及正規化後的資料收錄至資料庫中,等於是一個集合專利內容精華的來源。

 

 

無論您是哪一種資料庫的使用者都應該要了解到,您在資料庫上操作的每個功能,對應的都是後台的資料。因此,在提供更強大的檢索或分析功能之虞,也不能忽視後台資料的品質與完整度。 Derwent Innovation 的使用者在這個平台的每個操作,都會同時檢索收錄的官方專利公開資料以及 DWPI 專利加值資料庫,得到更完善的結果,這也是 Derwent Innovation 的獨特之處。

 

根據WIPO 2016年發布的報告顯示,2015年全球一共有290萬件專利申請,您可以想像,我們每年收錄全球的專利公開資料,並已累積近60年的DWPI專利加值資料,隨著專利數量逐年增加,就算DWPI有數百人的專家團隊,不眠不休的將專利逐篇閱讀並改寫,仍然是一個龐大且難以消化的工作量。因此,早在十多年前我們便開始引進了機器輔助人力的系統,由機器先對收錄的資料進行翻譯、判讀並指派給對應的DWPI專家來做人工校正與改寫作業。也因此累積了多年的機器輔助人力進行專利內容判讀的技術能力,得以將這些專利公開資料及DWPI加值資料作為機器學習的數據源,並應用在資料庫功能加強上,進而開發出目前許多DI使用者都在使用的 Smart Search 智能檢索 專利生命預測 (Predictive data) 等功能。

 

 

為何要開發 Smart Search ?

並非每個人都是專利檢索專家,如何讓即使是非專利檢索專業的人員也能輕鬆檢索專利,花費更少精力卻能獲得更好的檢索結果?

 

非IP專業的使用者的心聲

“我只是有時候想快點找到相關的專利…而不想花很多時間下複雜的檢索式…“

 

我們時常聽到非IP專業的客戶 (例如R&D) 跟我們這樣說: 「我喜歡你們的系統以及DWPI,但專利的欄位真的太多,怎樣檢索效果最好我也不確定」 「有沒有簡單又強大的檢索功能?」「最好像Google一樣簡單…」

這個困擾只有非IP的客戶才會有嗎?再與各位分享另一個情況,即使是檢索專家如您,僅靠有限的線索如何更快速的找到相關專利?我們聽到IP專業的客戶也跟我們這樣說: 「我的客戶是各公司的研發人員(發明人)他們常提出需求請我幫忙檢索,但….」 「有時候標的是他們拿過來的專利或論文」「最有時候是他們自己的研發紀錄或產品規格」「大多時候,只是他們口述的技術特徵,而我得上網再去找定義」

我該如何將片面的技術描述,快速轉化成完備的專利檢索?

 

 

Smart Search 的原理

無論您的標的是專利上看到的一段說明

 

或是R&D的研發記錄

 

還是論文上看到的科學研究

網站上看到的產品敘述

source: Amazon

 

或是一段技術定義

 

請您大膽「複製」這一段技術描述

再大膽貼上 Derwent Innovation 的 Smart Search 搜尋欄位中

 

Smart Search 會透過語意分析字串並自動拓展關鍵字,再經過多個步驟的演算,包括分類號加權、引用加權等,找出與您輸入的技術描述相關的專利。文法在此並非那麼重要,因為 Smart Search 會去除描述中的連接詞、介係詞等,只保留下技術關鍵字描述(*註)。因此,技術描述用字是否精確或是否參雜雜過多不必要的技術條件對檢索結果的影響更甚於文法。

最簡單的做法當然只需要複製貼上即可,但更好的做法,是由使用者來判斷哪些技術關鍵字或描述不是您所想要的,並手動去除在進行 Smart Search 檢索,系統便能避免運算那些關鍵字演算出更趨近於您想要的結果。

 

註: Smart Search只能用來檢索技術描述,任何公司名稱、發明人等字元輸入均會被當成技術描述來檢索,而非公司名稱或發明人名檢索。

 

Smart Search 目的在於快速找到標的,排序越前面與輸入的技術描述越相關,若講求「完全不漏」則適合用一般的專利檢索手法。Smart Search 結果顯示的是前1000件與您輸入的技術描述最相關的專利。使用者能快速的從這1000件專利中找到感興趣的專利並記錄下來做後續的應用。

 

邊做邊調 越找越像

若 Smart Search 分析字串後留下的關鍵字並非您所想要的,或您認為 Smart Search 第一次找出來的結果不符需求。透過「手動調整」,包括在檢索窗格中加入新的關鍵字  (使用雙引號” 關鍵字 “),或去除可能是雜訊的關鍵字,讓 Smart Search 重新計算出新結果(Regenerate)。經過數次的調整後,Smart Search 的結果會更接近您想要的。

除初始畫面可以使用 Smart Search ,您也可以在完整的欄位檢索中找到 Smart Search的選項,搭配其他檢索欄位使用。特別說明, Smart Search 的運算邏輯不同於其它檢索功能欄位,一旦其中一個欄位使用 Smart Search,便會以 Smart Search 的運算機制下去檢索,即顯示前1000件最相關的專利。但加入一般欄位的差異在於,您所指定的其他欄位條件將會是演算過程中優先考量的必要條件。

 

如何將 Smart Search 使用得更好?

Smart Search不同於一般的專利檢索邏輯,而是透過多個條件交叉比對分析出來的結果,檢索結果與您輸入的文字描述高度相關。但與一般檢索也有類似的道理,條件打得太簡單(例如: LED),它仍然能為您呈現前1000筆最相關的專利,但很可能會有很多LED相關但不是您感興趣的專利,因為系統無法從”LED”猜測出您具體想要看的是哪一塊?

而條件給太多有時候效果也不一定會更好,如下方從維基百科上找到LED的技術描述,將整篇複製貼上 Smart Search 進行檢索,同樣能找到前1000篇最相關的專利。然而,這一段描述中除技術關鍵字外,很可能包含許多不相關的描述。因此,將您最感興趣的技術的關鍵字保留,盡量減少不必要的關鍵字(雜訊),才能讓Smart Search檢索出來的結果更符合您期待。

 

我們不時聽到這樣的詢問

「是不是不管我複製貼上什麼,機器都能準確呈現我心中所想的目標?」

「能不能檢索出來還能順帶把評語及結論給產出?」

「可不可以一切答案都只需按個鍵就得到?」

「為什麼Smart Search還要我另外告訴他我心理想要什麼?」

Smart Search 會是我們檢索專利的絕佳輔助,但絕對無法完全取代我們的「人為判斷」,而且它「無法讀心」。使用者的角色仍非常重要,必須告訴 Smart Search 您想找什麼? 決定如何調整、如何往下延伸。因為無論如何訓練、學習,機器仍難理解實際發生什麼事情及「人類心中真正的想法」。李開復先生曾提到AI將如何改變人類的工作:

「AI 是人類的工具,我們如何運用技術開創新的機會,才是當前最重要的事」 「未來會是人類和機器共存,協作完成各類工作的新時代」 ─ 李開複

最後也附上幾個本人的使用心得與各位分享

  • Smart Search無法讀心,「心裡的話(檢索條件)」一定要跟Smart Search講清楚
  • 複製貼上很簡單,但最好可以手動將「雜訊」先清掉,避免雜訊也被加入運算邏輯
  • 檢索前請確保您想要的技術關鍵字有涵蓋在描述中檢索後仍可以加入新條件
  • 若Smart Search的結果並非您所想要的可變換條件重新運算一次,或利用Sub-search功能進行條件限縮
  • Smart Search可以組合一般檢索欄位或多個Smart Search交叉運算(但連結不同Smart Search檢索欄位不是用AND而是用OR)
  • Smart Search檢索出來的結果預設是前1000筆,您可透過檢索結果畫面右上角的圖標找到Retrieve all smart search results獲得全部的檢索結果

 

 

(全文完)

 

 

Henry Chiu 邱明峻

智權與品牌保護解決方案顧問

科睿唯安