導讀:人工智能和機器學習算法對于美國專利商標局的工作是至關重要的,但同時,這家政府機構(gòu)的指導原則是在開發(fā)和使用這些技術以改進和擴展各項計劃的時候,采用一種以人為本的方法。
與很多洞察驅(qū)動型組織一樣,美國專利商標局(USPTO)利用數(shù)據(jù)分析、人工智能和機器學習等技術來提高自身的運營效率和績效,以及改善系統(tǒng)和流程的質(zhì)量。
人工智能和機器學習算法對于美國專利商標局的工作是至關重要的,但同時,這家政府機構(gòu)的指導原則是在開發(fā)和使用這些技術以改進和擴展各項計劃的時候,采用一種以人為本的方法。美國專利商標局首席信息官Jamie Holcombe指出,人工智能和機器學習工具有助于增強人類專家的工作能力并增強他們在工作中的獨創(chuàng)性,在這一點上,這種工具與人類思維的細微差別或者推理能力是無法匹敵。
美國專利商標局首席信息官 Jamie Holcombe
為了進一步補充完善該技術,美國專利商標局通過被動和主動捕獲的方式,借助來自數(shù)千名經(jīng)驗豐富的員工的輸入,訓練和改進人工智能驅(qū)動的模型,以確保技術實現(xiàn)預期的結(jié)果。美國專利商標局自成立以來已經(jīng)授予了超過1100萬項專利,擁有超過12000名員工,其中包括工程師、律師、分析師和計算機專家。不僅如此,來自前線專利審查員的持續(xù)反饋也被用于改進人工智能/機器學習模型,以推動新產(chǎn)品的開發(fā)并支持兩個關鍵領域的活動:專利搜索和分類。
Holcombe指出,鑒于當前數(shù)據(jù)量的爆炸式增長和“現(xiàn)有技術”的潛在來源,進行全面的專利檢索可能是頗具挑戰(zhàn)性的。為了應對這一挑戰(zhàn),美國專利商標局的技術團隊正在一種新的專利搜索工具中采用人工智能技術,幫助審查員在審查申請的時候,找到他們所需的最相關來源。這一點很重要,因為美國專利商標局每年會收到超過60萬份申請,平均每一份申請包含大約20頁的文本和圖片,或者有大約10000個描述性單詞。美國專利商標局的IT部門還開發(fā)并部署了一個分類工具,可以從超過25萬個可能的類別中識別和匹配與該項發(fā)明相關的分類符號。
在這兩種情況下,模型都是由人類專家開發(fā)并且通過這些專家提供的反饋進行持續(xù)增強的,這些專家通過人為操作來判斷某事物是全新的還是新穎的,然后運用法律、事實和專業(yè)知識來做出決定。
在信息流中探索人才渠道
從審查員專家和其他人那里獲得源源不斷的反饋,這可能是一種優(yōu)勢,但并不是美國專利商標局為了確定創(chuàng)新和全球?qū)I(yè)知識的新渠道、幫助解決重要挑戰(zhàn)和擴展人工智能所采取的唯一途徑。今年早些時候,美國專利商標局求助于人工智能研究社區(qū)和Google Kaggle。Kaggle是一個為數(shù)據(jù)科學家和其他人交流思想和想法搭建的技術和社交平臺,每年3月Kaggle會舉行全球性的全球編碼競賽,提供2.5萬美元的獎金,呼吁人工智能研究人員和數(shù)據(jù)科學家編寫代碼來評估短語的語義相似性。
今年這項比賽在6月30日結(jié)束之前收到了42900份參賽作品,涉及1800多個全球團隊共同致力于利用公開可用的專利數(shù)據(jù)源。Holcombe解釋說,比賽的目標是為了推動借助AI幫助機構(gòu)和專利社區(qū)更好地理解專利語言。他說:“結(jié)果不僅是為專利搜索提供更好的短語算法,而且還讓獲勝的模型被公共領域所采用?!?/p>
美國專利商標局還利用了其他的公共信息資源,例如Golden,這是2019年推出的一個免費“維基風”人工智能/機器學習驅(qū)動型平臺,可以通過網(wǎng)絡搜索將主題與相關數(shù)據(jù)和可用數(shù)據(jù)進行匹配,并將其整合成一個信息流,背后運行的AI算法啟動之后可以持續(xù)添加相關的數(shù)據(jù),任何人都可以搜索有關公司、公司專利和資金來源(如風險投資)的信息。
人工智能/人類聯(lián)盟的A、B、C指南
雖然我們看到有非常多的技術專欄都是關于技術融合的,但鑒于人性的多樣性和復雜性,采用“以人為本”的方法來開發(fā)人人工智能和機器學習可能是頗具挑戰(zhàn)性的。因此,美國專利商標局在Holcombe的帶領下,制定了從試點到原型、再到生產(chǎn)的指南,概括成A、B、C指南:
A 代表一致性:Holcombe認為,業(yè)務人員和IT人員之間必須有緊密的聯(lián)系?!白詈玫目缏毮軋F隊由和業(yè)務代表并肩工作的技術人員組成,所有人都身處于一個能夠促進計劃、執(zhí)行、檢查和調(diào)整的敏捷環(huán)境中?!泵艚莺虳evSecOps實踐依賴于快速行動、透明度和產(chǎn)品思維,為了最大限度地取得進展,領導者要盡早地、經(jīng)常地與他們的團隊和利益相關者進行溝通。
B 代表業(yè)務價值:你可以從對于核心戰(zhàn)略運營具有明顯價值的業(yè)務案例開始著手,這些案例可以解決那些讓人工智能和機器學習派上用場的挑戰(zhàn)。Holcombe指出:“作為一家100%收費的機構(gòu),我們在嚴格的業(yè)務和投資回報率下應對技術挑戰(zhàn)?!?/p>
C 代表客戶(也就是員工):人工智能/機器學習解決方案旨在為審查員和其他領域?qū)<姨峁┲?,而不是要取代他們。因此,新興技術團隊會在任何發(fā)布之前、之中和之后與內(nèi)部客戶一起進行測試和調(diào)整。這些產(chǎn)品使用者可以幫助推動人工智能創(chuàng)新,其中一些使用者很“注重細節(jié)”,并且和CIO都是C級高管,提供的意見很重要。Holcombe指出:“由于我們盡早地把客戶引入了流程中,所以我們獲得了很有力的反饋,這有助于推動技術的采用。而且,客戶能夠讓我們在部署對機構(gòu)專家和公眾負責任的人工智能時候保持坦誠?!?/p>