王超 楊景照 谷學(xué)強(qiáng)
摘要智能規(guī)劃與決策課程對(duì)于培養(yǎng)學(xué)生運(yùn)用科學(xué)方法和模型解決運(yùn)動(dòng)規(guī)劃、任務(wù)規(guī)劃和方案決策問(wèn)題具有重要意義。本文在對(duì)課程定位與學(xué)情進(jìn)行分析的基礎(chǔ)上,梳理智能規(guī)劃與決策課程的知識(shí)結(jié)構(gòu)與實(shí)驗(yàn)設(shè)置,并提出了課程教學(xué)的建議和方法。
關(guān)鍵詞 智能規(guī)劃與決策 知識(shí)體系 教學(xué)方法
中圖分類號(hào):G424文獻(xiàn)標(biāo)識(shí)碼:ADOI:10.16400/j.cnki.kjdk.2021.13.036
Thoughts on the Instructional Design of the Intelligent Planning and Decision-making Curriculum
WANG Chao, YANG Jingzhao, GU Xueqiang
(Department of Intelligent Science and Technology, College of Intelligence Science and Technology, National University of Defense Technology, Changsha, Hunan 410073)
AbstractThe Intelligent Planning and Decision-making Curriculum plays an important role in cultivating the students to manipulate scientific methods and models to solve motion planning, task planning and decision-making problems. Based on the analysis of the course orientation and learning situation, this paper combs the knowledge structure and experiment setting of intelligent planning and decision-making course,and puts forward some suggestions and methods of course teaching.
Keywordsintelligent planning and decision-making; knowledge architecture; teaching methods
0概述
智能規(guī)劃與決策是人工智能的核心關(guān)鍵研究領(lǐng)域之一,其研究如何運(yùn)用人工智能技術(shù)來(lái)輔助人類解決復(fù)雜的規(guī)劃和決策問(wèn)題,是機(jī)器人、無(wú)人機(jī)、無(wú)人車(chē)、智能彈藥、無(wú)人艇等自主系統(tǒng),以及模擬仿真系統(tǒng)、作戰(zhàn)任務(wù)規(guī)劃系統(tǒng)等軟件智能體所需的核心關(guān)鍵技術(shù)。
近年來(lái),針對(duì)相關(guān)專業(yè)人才培養(yǎng)要求,我校教師開(kāi)展相關(guān)教學(xué)設(shè)計(jì)與實(shí)踐研究。[1-4]劉鴻福等以建構(gòu)主義學(xué)習(xí)理論為指導(dǎo),提出了智能規(guī)劃研究生課程的教學(xué)目標(biāo)和知識(shí)體系;李杰等在分析無(wú)人機(jī)系統(tǒng)專業(yè)課程體系在智能決策問(wèn)題教學(xué)設(shè)計(jì)和實(shí)踐中的不足,提出了相應(yīng)的對(duì)策;牛軼峰等就無(wú)人機(jī)系統(tǒng)專業(yè)人才培養(yǎng),以智能為核心開(kāi)展課程體系、課程模塊設(shè)計(jì)及其實(shí)施建議。
隨著無(wú)人系統(tǒng)和軍事智能化的發(fā)展,在本科階段開(kāi)設(shè)智能規(guī)劃與決策課程,系統(tǒng)性開(kāi)展相關(guān)基礎(chǔ)理論教學(xué)和方法實(shí)踐,能夠使學(xué)生學(xué)會(huì)運(yùn)用科學(xué)的理論和模型來(lái)表達(dá)有關(guān)智能體規(guī)劃與決策方面的問(wèn)題,并通過(guò)求解數(shù)學(xué)模型尋求優(yōu)化的運(yùn)動(dòng)與行為的規(guī)劃與決策方案,建立運(yùn)用智能體模型解決實(shí)際規(guī)劃與決策問(wèn)題的觀念,并具備一定的實(shí)際問(wèn)題分析、建模、求解和應(yīng)用能力,奠定進(jìn)一步學(xué)習(xí)相關(guān)課程以及從事無(wú)人系統(tǒng)、各類智能系統(tǒng)等相關(guān)實(shí)際工作的基礎(chǔ)。
1課程定位與學(xué)情分析
智能規(guī)劃與決策課程是我校人工智能系列課程群的核心課程之一,是人工智能本科專業(yè)的學(xué)科基礎(chǔ)課程。該課程主要圍繞智能體在環(huán)境中如何利用感知的信息,自主地做出運(yùn)動(dòng)與行為的規(guī)劃與決策,達(dá)到某個(gè)給定的任務(wù)目標(biāo),同時(shí)使得效能最優(yōu)等目標(biāo)開(kāi)展教學(xué),是學(xué)習(xí)和研究機(jī)器人、無(wú)人車(chē)、無(wú)人機(jī)等無(wú)人系統(tǒng)和任務(wù)規(guī)劃、任務(wù)調(diào)度、指揮控制系統(tǒng)等智能系統(tǒng)所必需的基礎(chǔ)課程。
該課程設(shè)置在本科三年級(jí),在軟件技術(shù)基礎(chǔ)、自動(dòng)控制原理和人工智能基礎(chǔ)等課程之后開(kāi)課,學(xué)生通過(guò)前期課程的學(xué)習(xí)已經(jīng)掌握了人工智能的搜索算法、知識(shí)表示、機(jī)器學(xué)習(xí)、智能Agent等基礎(chǔ)理論和算法,迫切需要一門(mén)課程將其所具備的基礎(chǔ)知識(shí)理論和其實(shí)際所在的無(wú)人機(jī)、機(jī)器人、人工智能等專業(yè)課程進(jìn)行銜接,架起理論算法與實(shí)際應(yīng)用之間的橋梁。
2智能規(guī)劃與決策課程體系
針對(duì)大三年級(jí)本科生已掌握的基礎(chǔ)知識(shí),該課程突出基礎(chǔ)性和實(shí)踐性的原則,通過(guò)學(xué)習(xí)該課程,能夠使學(xué)生了解智能規(guī)劃與決策的基本概念、不同類型平臺(tái)的運(yùn)動(dòng)規(guī)劃、行動(dòng)方案的自動(dòng)規(guī)劃和行動(dòng)方案分析技術(shù)和不確定性環(huán)境下的規(guī)劃和決策技術(shù),能夠針對(duì)典型的規(guī)劃決策問(wèn)題,熟悉基本的解決思路和思維方式,掌握智能規(guī)劃決策方法在軍事問(wèn)題和民用問(wèn)題上的應(yīng)用過(guò)程。對(duì)此,目前智能規(guī)劃與決策課程設(shè)計(jì)的總學(xué)時(shí)為32學(xué)時(shí),2學(xué)分,其中理論教學(xué)26個(gè)學(xué)時(shí),實(shí)驗(yàn)教學(xué)與實(shí)施環(huán)節(jié)6個(gè)學(xué)時(shí)。
2.1知識(shí)體系設(shè)計(jì)
本課程的知識(shí)目標(biāo)主要包括以下主要的知識(shí)單元,即智能規(guī)劃與決策緒論、運(yùn)動(dòng)規(guī)劃、行動(dòng)方案自動(dòng)規(guī)劃、行動(dòng)方案決策分析、不確定性規(guī)劃與決策,學(xué)員應(yīng)熟悉、了解或掌握不同知識(shí)單元的具體內(nèi)容,達(dá)成課程標(biāo)準(zhǔn)的相應(yīng)要求。
2.1.1智能規(guī)劃與決策緒論
該部分內(nèi)容主要包括:①智能規(guī)劃與決策的概念;②無(wú)人裝備的規(guī)劃決策實(shí)例分析;③作戰(zhàn)過(guò)程中的規(guī)劃決策問(wèn)題概述;④作戰(zhàn)規(guī)劃決策技術(shù)的發(fā)展歷史;⑤課程內(nèi)容及要求等。該部分的學(xué)習(xí)目標(biāo)是使學(xué)生理解智能規(guī)劃與決策的基本概念、發(fā)展歷程及趨勢(shì)和典型應(yīng)用,了解課程整體架構(gòu)和學(xué)習(xí)要求。
2.1.2運(yùn)動(dòng)規(guī)劃
該部分內(nèi)容主要對(duì)運(yùn)動(dòng)規(guī)劃的基本概念和典型運(yùn)動(dòng)體的運(yùn)動(dòng)規(guī)劃方法進(jìn)行介紹,主要包括運(yùn)動(dòng)規(guī)劃概述、智能導(dǎo)彈的運(yùn)動(dòng)規(guī)劃和智能車(chē)的運(yùn)動(dòng)規(guī)劃。
運(yùn)動(dòng)規(guī)劃概述包括:①基本概念,含運(yùn)動(dòng)規(guī)劃、路徑規(guī)劃和軌跡規(guī)劃的概念與對(duì)比,典型應(yīng)用場(chǎng)景,基本思路和運(yùn)動(dòng)規(guī)劃系統(tǒng);②典型運(yùn)動(dòng)體綜述;③運(yùn)動(dòng)規(guī)劃問(wèn)題的數(shù)學(xué)描述,含環(huán)境模型、運(yùn)動(dòng)模型、規(guī)劃指標(biāo)、約束條件和任務(wù)需求等。
智能導(dǎo)彈運(yùn)動(dòng)規(guī)劃包括:①智能導(dǎo)彈運(yùn)動(dòng)規(guī)劃問(wèn)題描述;②智能導(dǎo)彈任務(wù)路徑規(guī)劃方法,含單元分解法、人工勢(shì)場(chǎng)法、遺傳算法等;③智能導(dǎo)彈彈道軌跡規(guī)劃方法,含基于標(biāo)準(zhǔn)剖面、基于動(dòng)力學(xué)逆和基于優(yōu)化算法的規(guī)劃方法。
智能車(chē)運(yùn)動(dòng)規(guī)劃包括:①智能車(chē)運(yùn)動(dòng)規(guī)劃問(wèn)題描述;②智能車(chē)運(yùn)動(dòng)規(guī)劃方法流程;③基于(Probabilistic Roadmap Method, PRM)的智能車(chē)運(yùn)動(dòng)規(guī)劃方法。
2.1.3行動(dòng)方案自動(dòng)規(guī)劃
該部分主要介紹行動(dòng)方案自動(dòng)規(guī)劃的基本概念、規(guī)劃語(yǔ)言、基本的規(guī)劃算法和典型規(guī)劃器等內(nèi)容。[5]
經(jīng)典自動(dòng)規(guī)劃部分包括:①基本概念,含規(guī)劃的定義、研究范疇、概念模型等;②規(guī)劃問(wèn)題描述模型,含形式化定義方法、規(guī)劃問(wèn)題描述語(yǔ)言等;③發(fā)展歷程,含國(guó)際規(guī)劃大賽綜述和典型規(guī)劃器等。
主要的規(guī)劃方法包括:①狀態(tài)空間規(guī)劃,含前向搜索方法、后向搜索方法和搜索啟發(fā)式構(gòu)建方法;②偏序規(guī)劃;③圖規(guī)劃技術(shù);④分層任務(wù)網(wǎng)絡(luò)規(guī)劃等。
2.1.4行動(dòng)方案決策分析
該部分主要介紹行動(dòng)方案決策分析的基本概念和典型決策分析方法進(jìn)行介紹,主要包括行動(dòng)方案決策分析概述、風(fēng)險(xiǎn)型決策分析方法和多目標(biāo)決策分析方法。
行動(dòng)方案決策分析概述部分包括:①?zèng)Q策問(wèn)題及基本概念;②決策分析的分類;③決策分析的實(shí)施。
風(fēng)險(xiǎn)型決策分析方法部分包括:①概述;②期望益損值準(zhǔn)則;③決策樹(shù)分析方法等。
多目標(biāo)決策分析方法部分包括:①準(zhǔn)則體系;②層次分析法,含基本概念、分析模型和判斷矩陣構(gòu)建、層次結(jié)構(gòu)權(quán)重排序等。
2.1.5不確定性規(guī)劃與決策
該部分內(nèi)容主要介紹不確定環(huán)境下的規(guī)劃與決策基本概念和典型方法,主要包括概述、馬爾科夫方法和貝葉斯網(wǎng)絡(luò)方法。
不確定性規(guī)劃與決策概述部分包括:①基本概念、內(nèi)涵與意義;②不確定性規(guī)劃與決策研究現(xiàn)狀;③效用理論。
馬爾科夫方法部分包括:①馬爾科夫方法基本概念;②策略迭代、價(jià)值迭代;③部分可觀馬爾科夫決策。
貝葉斯網(wǎng)絡(luò)方法部分包括:①貝葉斯網(wǎng)絡(luò)方法基本概念與原理;②貝葉斯網(wǎng)絡(luò)構(gòu)建基本方法,貝葉斯網(wǎng)絡(luò)決策方法及其應(yīng)用。
2.2課程實(shí)驗(yàn)設(shè)置
智能規(guī)劃與決策是一門(mén)理論聯(lián)系應(yīng)用的課程,本課程的實(shí)驗(yàn)以智能規(guī)劃與決策方法的應(yīng)用能力培養(yǎng)為總體考慮,設(shè)計(jì)三個(gè)實(shí)驗(yàn),通過(guò)三個(gè)實(shí)驗(yàn)的實(shí)施,在技術(shù)目標(biāo)上,一是讓學(xué)生使用自己熟悉的編程語(yǔ)言實(shí)現(xiàn)運(yùn)動(dòng)規(guī)劃算法的程序,達(dá)成流程清晰、結(jié)果較優(yōu)的目標(biāo);二是讓學(xué)生完成Jshop2規(guī)劃器的部署運(yùn)用,達(dá)到領(lǐng)域和問(wèn)題建模合理、求解結(jié)果正確、可應(yīng)用的目標(biāo);三是讓學(xué)生完成不確定條件下的機(jī)器人自主規(guī)劃決策應(yīng)用,使用自己熟悉的編程語(yǔ)言實(shí)現(xiàn)馬爾科夫決策過(guò)程建模和模型求解的計(jì)算機(jī)程序,學(xué)會(huì)實(shí)際問(wèn)題的求解方法,提高解決實(shí)際問(wèn)題的能力。
在能力目標(biāo)培養(yǎng)方面,主要培養(yǎng)學(xué)員分析和解決現(xiàn)實(shí)問(wèn)題的能力,包括三個(gè)方面:一是對(duì)實(shí)際問(wèn)題進(jìn)行分析抽象的能力;二是自己動(dòng)手編程求解的能力;三是應(yīng)用求解結(jié)果反饋和解決問(wèn)題的能力。
2.2.1基于智能優(yōu)化算法的運(yùn)動(dòng)規(guī)劃實(shí)驗(yàn)
實(shí)驗(yàn)的目的是通過(guò)本實(shí)驗(yàn)的開(kāi)展,使學(xué)生進(jìn)一步熟悉通用智能優(yōu)化算法的特性和運(yùn)動(dòng)規(guī)劃流程。
實(shí)驗(yàn)內(nèi)容包括:①運(yùn)動(dòng)規(guī)劃問(wèn)題建模,即建立運(yùn)動(dòng)規(guī)劃問(wèn)題的環(huán)境模型和任務(wù)模型;②運(yùn)動(dòng)規(guī)劃智能優(yōu)化算法的設(shè)計(jì)和實(shí)現(xiàn),即根據(jù)提供的實(shí)驗(yàn)問(wèn)題模型,掌握智能優(yōu)化算法的基本使用方法、執(zhí)行流程和求解過(guò)程。
實(shí)驗(yàn)結(jié)果包括程序代碼、測(cè)試結(jié)果及實(shí)驗(yàn)報(bào)告,要求程序的正確性,并通過(guò)測(cè)試驗(yàn)證。
2.2.2 Jshop2規(guī)劃器的實(shí)現(xiàn)和應(yīng)用實(shí)驗(yàn)
實(shí)驗(yàn)?zāi)康氖峭ㄟ^(guò)本實(shí)驗(yàn)的開(kāi)展,能夠使學(xué)員進(jìn)一步熟悉分層任務(wù)網(wǎng)絡(luò)規(guī)劃的概念和過(guò)程,了解Jshop2規(guī)劃算法的工作原理和規(guī)劃器的使用方法,使學(xué)員透徹理解分層任務(wù)網(wǎng)絡(luò)規(guī)劃領(lǐng)域和問(wèn)題建模,培養(yǎng)學(xué)員根據(jù)需要構(gòu)建并解決問(wèn)題的能力。
實(shí)驗(yàn)要求學(xué)生在給定的規(guī)劃問(wèn)題想定場(chǎng)景下,利用規(guī)劃領(lǐng)域描述語(yǔ)言(PDDL)構(gòu)建規(guī)劃任務(wù)的領(lǐng)域文件和問(wèn)題文件,通過(guò)Jshop2規(guī)劃器對(duì)問(wèn)題進(jìn)行分解和規(guī)劃,要求規(guī)劃問(wèn)題描述正確完備,結(jié)果序列可解釋,具備復(fù)現(xiàn)和檢驗(yàn)的功能。
實(shí)驗(yàn)內(nèi)容包括:任務(wù)規(guī)劃領(lǐng)域和問(wèn)題建模,含面向規(guī)劃的智能體動(dòng)作集和任務(wù)分解方法建模、不同目的要求下目標(biāo)狀態(tài)的建模。
2.2.3不確定條件下的機(jī)器人自主規(guī)劃決策實(shí)驗(yàn)
實(shí)驗(yàn)?zāi)康氖峭ㄟ^(guò)本實(shí)驗(yàn)的開(kāi)展,使學(xué)員進(jìn)一步熟悉馬爾科夫決策過(guò)程建模,透徹理解馬爾科夫決策過(guò)程建模和模型求解的工作原理,達(dá)到培養(yǎng)學(xué)員自己動(dòng)手、分析解決實(shí)際問(wèn)題的能力。
實(shí)驗(yàn)任務(wù)包括利用馬爾科夫決策過(guò)程求解算法完整實(shí)現(xiàn)不確定條件下的機(jī)器人自主規(guī)劃決策的馬爾科夫決策過(guò)程建模和編程,并通過(guò)聯(lián)調(diào)測(cè)試,能夠就機(jī)器人自主規(guī)劃決策問(wèn)題進(jìn)行建模、求解,要求計(jì)算結(jié)果正確,程序適用性較強(qiáng),具備路徑復(fù)現(xiàn)和檢驗(yàn)的功能。
實(shí)驗(yàn)內(nèi)容包括:不確定條件下的機(jī)器人自主規(guī)劃決策的馬爾科夫決策過(guò)程建模,含馬爾科夫決策過(guò)程模型要素的抽象表示和機(jī)器人自主規(guī)劃決策目標(biāo)函數(shù)的設(shè)計(jì);②馬爾科夫決策過(guò)程模型的求解,含采用策略迭代、價(jià)值迭代求解決策問(wèn)題,在對(duì)比其性能的基礎(chǔ)上,選擇合適的學(xué)習(xí)策略,完成機(jī)器人自主規(guī)劃決策的程序?qū)崿F(xiàn)。
3教學(xué)方法
開(kāi)展探究式課堂教學(xué)改革,實(shí)行小班化教學(xué),引入翻轉(zhuǎn)課堂、研討式教學(xué)、實(shí)際系統(tǒng)演示教學(xué)、案例教學(xué)等教學(xué)方法。通過(guò)課堂教學(xué),組織討論,案例講解,課后作業(yè),作業(yè)講解與討論,課外實(shí)踐一系列的環(huán)節(jié)使學(xué)員達(dá)到預(yù)期學(xué)習(xí)目標(biāo),具體包括理論講授,互動(dòng)研討,問(wèn)題講解,答疑解惑等環(huán)節(jié)。
本課程推薦主講教員采用兩類教學(xué)方法,一是主動(dòng)學(xué)習(xí)(Active learning),通過(guò)提出預(yù)設(shè)問(wèn)題、啟發(fā)分析思路、引導(dǎo)主動(dòng)閱讀與思考、討論求解方法、反思問(wèn)題求解成果等手段方法,充分調(diào)動(dòng)激發(fā)學(xué)員主動(dòng)學(xué)習(xí)知識(shí)、研究思考,加強(qiáng)學(xué)員對(duì)理論方法的理解與應(yīng)用;二是研討式教學(xué),以學(xué)生主動(dòng)學(xué)習(xí)為基礎(chǔ),在課堂上結(jié)合講授內(nèi)容、相關(guān)案例、實(shí)際問(wèn)題開(kāi)展研討,充分激發(fā)學(xué)習(xí)興趣,鍛煉學(xué)生的創(chuàng)新思維與口頭表達(dá)能力。
課堂教學(xué)中可將案例式教學(xué)貫穿始終。針對(duì)規(guī)劃和決策算法比較抽象,不易理解的問(wèn)題,對(duì)于課程中每個(gè)知識(shí)點(diǎn),都結(jié)合實(shí)際的應(yīng)用場(chǎng)景設(shè)計(jì)典型案例。例如在運(yùn)動(dòng)規(guī)劃部分,可借助掃地機(jī)器人、無(wú)人系統(tǒng)及典型運(yùn)動(dòng)體的運(yùn)動(dòng)規(guī)劃問(wèn)題展開(kāi);在行動(dòng)規(guī)劃部分,針對(duì)不同的規(guī)劃方法,可借助航空貨物運(yùn)輸、汽車(chē)換胎、聯(lián)合作戰(zhàn)任務(wù)規(guī)劃等問(wèn)題展開(kāi);在決策問(wèn)題部分,可借助裝備維修決策、作戰(zhàn)方案優(yōu)選、目標(biāo)識(shí)別的問(wèn)題展開(kāi)。圍繞實(shí)際案例開(kāi)展啟發(fā)式、討論式和互動(dòng)式授課,激發(fā)學(xué)生參與互動(dòng)和交流的興趣,培養(yǎng)學(xué)生發(fā)現(xiàn)問(wèn)題根源、建立問(wèn)題模型、探究問(wèn)題解決思路和方法的能力,形成勤于思考、善于鉆研的科學(xué)精神。
4結(jié)語(yǔ)
智能規(guī)劃與決策課程組立足于人才培養(yǎng)目標(biāo),在分析課程定位和學(xué)情的基礎(chǔ)上,對(duì)課程內(nèi)容、實(shí)驗(yàn)設(shè)置和教學(xué)方法等內(nèi)容進(jìn)行了研究和探索。后續(xù),隨著課程教學(xué)的實(shí)施,課程組將結(jié)合教學(xué)效果和反饋,在課程內(nèi)容完善、課程思政元素設(shè)計(jì)、課程教材建設(shè)等方面不斷完善,并依托實(shí)驗(yàn)平臺(tái)和雨課堂等新型教學(xué)手段上不斷提升教學(xué)水平,努力做好相關(guān)專業(yè)人才培養(yǎng)工作。
基金項(xiàng)目:本文得到2017年國(guó)防科技大學(xué)國(guó)家自然科學(xué)基金項(xiàng)目“災(zāi)難環(huán)境中大規(guī)模人與智能體協(xié)作任務(wù)規(guī)劃(編號(hào):61702528)”支持
參考文獻(xiàn)
[1]劉鴻福,張萬(wàn)鵬,陳璟.基于建構(gòu)主義理論的智能規(guī)劃課程教學(xué)研究[J].課程教育研究,2016(4):17-18.
[2]李杰,王菖,牛軼峰等.無(wú)人機(jī)系統(tǒng)智能決策課程教學(xué)設(shè)計(jì)與實(shí)踐[J].計(jì)算機(jī)教育,2016(10):11-14.
[3]牛軼峰,賈圣德,李杰等.以智能為核心的無(wú)人機(jī)系統(tǒng)課程體系設(shè)計(jì)[J].計(jì)算機(jī)教育,2016(10):37-41.
[4]王祥科,李杰,祝建成.面向本科生教育的無(wú)人機(jī)系統(tǒng)設(shè)計(jì)與綜合實(shí)踐教學(xué)探索[J].科技資訊,2020(14):120,122.
[5]Malik Ghallab,Dana Na等著.姜云飛,楊強(qiáng)等譯.自動(dòng)規(guī)劃:理論和實(shí)踐(Automated Planning:Theory and Practice)[M].北京:清華大學(xué)出版社,2008.