dikw模型(模型diy)

隨著互聯網大數據的興起,信息爆炸式增長,深度學習等機器學習算法在互聯網領域的廣泛應用,人工智能再次進入快速發展時期。那么怎么測試AI軟件,可能將成為測試的熱點問題。
人工智能定量評測目前面臨兩個重要挑戰:第一是人工智能系統目前沒有形成統一的模型,第二是人工智能系統與人類為代表的生命體之間目前沒有形成統一的模型。
這兩個挑戰都指向了同一個問題,即對于所有的人工智能系統和所有生命體(特別是以人類為代表的生命體)需要有一個統一模型進行描述,只有這樣才能在這個模型上建立智力測量方法并進行測試,從而形成統一的,可進行相互比較的智力發展水平評價結果。
對于這個問題,前人研究者已經從不同方向進行了深入研究,這些研究為我們建立智能系統的標準模型奠定了基礎:
馮?諾伊曼結構給予我們的啟發是:標準智能系統模型應包含輸入輸出系統,能夠從外界獲取信息,能夠將內部產生的結果反饋給外部世界,只有這樣,標準智能系統才能成為“活”的系統。
戴維.韋克斯勒關于人類智能的定義給予我們最大的啟示是:智力能力是由多個要素組成,而非圖靈測試或視覺圖靈測試那樣只關注智力能力的一個方面。
DIKW模型體系給予我們的啟發是:智慧是一種解決問題,積累知識的能力;知識是人類不斷與外界交互后沉淀下來結構化的數據和信息,這提醒我們,一個智能系統不僅僅體現出知識的掌握,更重要的還有關于解決問題的創新能力。
這種關于知識的掌握能力,知識的創新能力與戴維.韋克斯勒理論、馮.諾依曼架構結合,就可以形成智能系統智力能力的多層次結構。綜上所述,我們得出智能系統的標準模型應該具備一下特點:
第一、具有輸入輸出的功能,即可以與外界通過數據、信息和知識進行交互的能力。
第二、具有存儲數據、信息、知識的能力,即將外界數據、信息和知識化為自身資源的能力。
第三、具有生成新數據、信息和知識的能力,即基于自身擁有的知識,在新數據或信息的啟發下,對數據、信息和知識進行創新從而產生新的數據、信息和知識的能力,如圖1.4所示(為了簡化,本圖中數據、信息、知識統一用知識描述)。
智能系統標準模型示意圖如下:

我們可以提出如下標準智能系統定義:
無論系統(包括人工智能系統,人類等生命系統等),如果符合如下特征,就可以認為這個系統屬于標準智能系統(Standard Intelligent System):
特征1 能夠通過聲音、圖像、文字等方式(包括但不僅限于這三種方式)從外界獲取數據,信息和知識的能力。
特征2 能夠將從外界獲取的數據、信息和知識轉化為系統掌握知識的能力。
特征3 能夠根據外界數據、信息和知識所產生的需求,通過運用所掌握的知識進行創新的能力,這些能力包括但不僅限于聯想、創作、猜測、發現規律等,這種能力運用的結果可以形成自身掌握的新的知識。
特征4 能夠通過聲音、圖像、文字等方式(包括但不僅限于這三種方式)將系統產生數據,信息和知識反饋給外界或對外界進行改造。
AI軟件最初的測試,就是看它有沒有學習能力,本質上,就是算法的驗證,即對啟發式算法(heuristic algorithm)、啟發式搜索算法(heuristic searchalgorithm)、元搜索算法(Meta-heuristicalgorithm)、強化學習和深度強化學習或具體的算法(如遺傳算法、模擬退火算法、神經網絡、深度神經網絡、禁忌搜索、演化算法、蟻群算法)等中某些算法或算法的組合進行驗證。算法的驗證,主要是通過實驗進行(雖然也可以通過數學、模型等演化進行證明),借助大量數據進行普適性驗證。例如,比較有名的圖像識別算法驗證,就借助ImageNet提供的大量圖片進行驗證。

AI軟件的測試,更多的是靠“試驗”進行驗證,這和“Test”倒是更吻合,Test本質上就是“樣本性的試驗驗證活動”。AI軟件的測試還依賴大數據,基于大數據自動產生、分析、呈現等技術,更有效地驗證AI軟件的合理性。與AI軟件比賽是最有效的測試手段之一,如:圍棋人機大戰——阿法狗(AlphaGo)和李世石(俗稱:小李子)之戰。

一些傳統的測試方法也會在AI軟件測試中用到,如在代碼級的單元測試就沒什么區別,性能測試、可伸縮性測試、安全性測試也是要進行的。
當然,AI軟件測試沒那么容易,這里只是通俗易懂地解釋如何對AI軟件進行測試。實際工作中,AI軟件的前期測試還是很困難的。例如,為了測試Numenta(工作模式更接近人的大腦的AI軟件),IBM資深研究員Winfried Wilcke帶領著一百人的團隊來測試它的算法。如果我們面對俄羅斯的控制機器人集群的智能軟件包Unicum,又如何測試呢?它可是說是“機器人之上的機器人”,可以獨立分配集群內部的機器人角色、確定集群中的核心、替換脫離的單位,還會自動占據有利位置,搜尋目標,并在自動模式下向操縱員申請作戰與摧毀目標的許可。
未來測試精英需要進一步了解AI軟件,進一步提升數學能力,更好理解各種啟發式搜索算法、并行算法、分布式架構等技術,才能有更好的對策和方法應對AI軟件的測試挑戰。
本文由51ste.com網友編輯,未經授權,不得轉載使用上述作品盈利;個人轉載,需標明作者及出處。
繼續閱讀
- 暫無推薦