導(dǎo)讀:研究人員采用了一個由兩個知識驅(qū)動策略和兩個數(shù)據(jù)驅(qū)動策略組成的AI代理從而以最佳方式利用當前決策的已知和未知信息來最佳估計后續(xù)決策。
幾十年來,解決游戲的努力一直局限于解決雙人游戲,即棋盤游戲如跳棋、類似國際象棋的游戲等,其通過應(yīng)用一些人工智能(AI)搜索技術(shù)和收集大量的游戲統(tǒng)計數(shù)據(jù)來正確并有效地預(yù)測游戲結(jié)果。然而這樣的方法和技術(shù)并不能直接應(yīng)用于解謎領(lǐng)域,因為解謎一般都是單獨玩的單人游戲且有獨特的特點如隨機或隱藏信息。
因此,這里出現(xiàn)了一個問題,即AI技術(shù)如何能保持其在解決雙人游戲方面的性能但又能應(yīng)用于單人游戲?
多年來,謎題和游戲一直被認為是可以互換的或者說是對方的一個部分。事實上,情況可能并非一直如此。從現(xiàn)實世界的角度來看,“游戲”是我們每天都要面對的東西,處理的是未知的東西。而“謎題”是指已知的東西,甚至有些東西是隱藏的還沒有被揭開的。那么在解謎的背景下,“謎題”和“游戲”之間的邊界是怎樣的?
來自日本高級科學(xué)技術(shù)研究所的Hiroyuki Iida教授及其同事在發(fā)表于《Knowledge-based Systems》的最新研究文章中試圖回答這兩個問題。據(jù)悉,這項研究的重點是兩個重要的貢獻:(1)通過掃雷測試平臺定義了單人游戲背景下的謎題的可解性;(2)提出了一種新AI代理,其使用四種策略的統(tǒng)一組合--PAFG解算器。通過利用掃雷謎題的已知信息和未知信息,所提出的結(jié)算器在解決該謎題方面取得了跟最先進的研究相當?shù)男阅堋?/p>
研究人員采用了一個由兩個知識驅(qū)動策略和兩個數(shù)據(jù)驅(qū)動策略組成的AI代理從而以最佳方式利用當前決策的已知和未知信息來最佳估計后續(xù)決策。因此,對于像掃雷這樣的單人隨機謎題可以建立起謎題和游戲范式之間的界限。
這樣的條件在現(xiàn)實世界的問題中起著特別重要的作用,因為在這些問題中,已知和未知之間的界限通常是模糊且非常難以識別的。Iida教授指出:“隨著AI代理提高解謎性能的能力,可解性的邊界變得明顯。這樣的情況允許明確定義‘謎題’和‘游戲’的條件,通常在許多現(xiàn)實生活中發(fā)現(xiàn),如確定高風(fēng)險投資、評估重要決策的風(fēng)險水平等等?!?/p>
隨著現(xiàn)有技術(shù)和新的計算范式的面世,存在許多不確定因素,如物聯(lián)網(wǎng)、基于云的服務(wù)、邊緣計算、神經(jīng)形態(tài)計算等。這種情況對人(即技術(shù)承受力)、社區(qū)(即技術(shù)接受度)、社會(即文化和規(guī)范)甚至國家層面(即政策和規(guī)則變化)都可能是如此?!叭祟惷刻斓幕顒佣忌婕昂芏唷螒颉汀i題’條件。然而,在規(guī)模上映射可解性范式,可以建立已知和未知之間的邊界條件從而使未知的風(fēng)險最小化并使已知的利益最大化,”這項研究的論文第一作者Chang Liu說道,“這樣的壯舉是通過將知識驅(qū)動的技術(shù)、人工智能技術(shù)和可衡量的不確定性(如獲勝率、成功率、進度率等)推向高潮,同時仍保持謎題的趣味性和挑戰(zhàn)性來實現(xiàn)的。”