曹 畋(南京曉莊學院圖書館)
機器人館員屬于專業(yè)領域服務機器人,與傳統(tǒng)的工業(yè)機器人相比,服務機器人更貼近人們的日常生活。圖書館作為文化服務的窗口單位,對機器人館員進行研究與建設,會為提升圖書館的服務質量、降低人力成本、推動圖書館轉型帶來深刻影響。[1]研究專業(yè)領域的服務機器人是服務機器人發(fā)展的重要組成部分,專業(yè)領域內服務機器人的研究對提升服務機器人行業(yè)甚至國家競爭力有著重要的促進作用。[2]
南京曉莊學院圖書館(以下簡稱“我館”)前身是陶行知先生于1927年創(chuàng)辦曉莊試驗鄉(xiāng)村師范時設立的圖書館,當時名為“書呆子莫來館”,之所以起這樣奇怪的名字,是因為陶行知先生畢生提倡實踐學習、勇于創(chuàng)新的教育理念。為了紀念和弘揚陶行知先生實踐至上的精神,我館將研發(fā)的第一臺機器人館員命名為“小陶”。為了研究開發(fā)“小陶”,我館特邀館內技術部老師、一線館員以及南京曉莊學院機器人實驗室的老師組成了專業(yè)研究團隊:技術部門提供前端技術及知識庫的支持、一線館員提供需求與相關常見問題的處理經驗、機器人實驗室提供加工及運動控制技術的支持。
通過多方調研,我館最終確定開發(fā)高150cm、重30kg的“小陶”圖博機器人1.0版本,要求該圖博機器人具備如下功能:① 自主定位和自主移動能力,移動速度約0.25m/s;② 具備引導、移動手臂等運動條件,同時需保障人機交互過程的安全性;③ 能夠在室內各種材質的平整地面自由行動,且不可造成地毯磨損;④ 可以完成自主巡航和遙控指揮兩種運動模式。
通過借鑒世界上現有服務機器人的控制結構和原理,輔以參考目前國內圖書館、博物館的應用環(huán)境及應用條件,我館對“小陶”提出了初步的性能需求,并在技術實施條件許可的范圍內建立機器人基礎結構設計方案。方案充分體現了圖書館、博物館的機器人館員的實際性能和功能需求,主要包括:機器人館員傳感器選擇和設計、機器人館員運動設計方案、機器人館員語言對話方案等。為了更好地說明本次“小陶”的開發(fā)流程和思路圖,圖1將開發(fā)過程中的各個階段及各階段之間的關系進行了展現。
圖1 機器人館員“小陶”開發(fā)流程和思路
(1)智能控制技術。智能控制技術主要包括:神經網絡、云計算、大數據、模糊控制等一系列高新技術。其中,模糊控制包含變量定義、知識庫、模糊化、多級判斷及反模糊化五個主要方面,是機器人館員開發(fā)中難度最大的技術部分。
(2)傳感器與信號處理。機器人館員在工作時依靠傳感器獲取和識別周圍的環(huán)境,一般來說需要獲取的內容越多,所需要的傳感器也越多。目前常用的傳感器有光傳感器、聲傳感器、力傳感器、距離傳感器等。
(3)自主導航與定位是機器人館員研究的核心問題之一,也是機器人館員研究的難點。目前,其他領域的服務機器人已經開始研究采用傳感器和神經網絡技術共同完成機器人的自主定位和導航的技術。[3]為了直觀地說明機器人館員導航定位系統(tǒng),筆者繪制了機器人館員導航定位系統(tǒng)圖(見圖2)。
(4)路徑規(guī)劃技術。機器人館員需要在工作空間中找到一條從起始位置到目標位置的路徑,并且該路徑能有效地避開所有障礙物。目前采用的路徑規(guī)劃技術可分為智能和非智能兩種:非智能的路徑規(guī)劃辦法有自由空間法、柵格解耦法、人工勢場法等;智能路徑規(guī)劃辦法有模糊邏輯、遺傳算法、Q學習、神經網絡等基于人工智能的技術方案。[4]
圖2 機器人館員導航定位系統(tǒng)
(5)人機交互技術。目前常用的人機交互技術包括:文字識別、語音合成與識別、圖像識別與處理、機器翻譯等。通過人機交互,用戶不但可以隨時改變機器人的狀態(tài)而且可以進行信息交互。
“小陶”機器人館員需要具備自主移動和避障功能。機器人館員擬采用8個避障傳感模塊和12個光電傳感模塊,用于“小陶”對地面或物體表面的灰度檢查,同時,配合激光傳感器和圖像傳感器對地面和障礙物進行檢測。傳感器的放置是設計的難點之一。比如:當單位面積傳感器放置得過多時,就會出現多個傳感器同時發(fā)現一個障礙物的情況,產生大量的干擾數據,增加數據處理難度;當單位面積上傳感器過少時,就會造成障礙物漏檢測的情況。為解決這一問題,在對“小陶”進行設計時,研究團隊將8個避障傳感模塊和12個光電傳感模塊均勻地放置在底盤圓周的邊緣處,同時將激光傳感器和圖像傳感器放置在較高的位置,以此保證“小陶”在行動中能夠避開高低不同的障礙物。
“小陶”的自主巡線功能采用最新的3D機器人視覺來實現,即通過兩個高速圖像傳感器把經過圖像處理的3D環(huán)境信息傳輸給“小陶”。而高速攝像頭由于處理過程比較復雜,攝影處理速度相對較慢,所以在具體使用過程中,黑白路線由僅能夠識別黑色和白色的激光傳感器和紅外線傳感器處理,復雜位置環(huán)境的識別由高速攝影頭處理,以保證“小陶”自主巡線功能具有較高的效率。
根據預算和實際需求情況,研究團隊為“小陶”選擇了機器人自體控制與信息處理模塊MH-Cel001。該芯片屬于8位系列單片機中配置較好的一款,工作時間平路為16MHZ,有80個可編程I/0口,有8個8位定時器/計數器,且具有獨立的預分頻和比較器功能;有兩路8位PWM、6路16位PWM、13個通信接口。開始的時候考慮過ATMEL公司AVR系列的ATMEGA128,但由于其無法同時處理二十個以上的脈沖信號而放棄。
目前,服務機器人的常用總線包括RS-232、RS-422、RS-485、CAN等。① RS-232總線是由電子工業(yè)協會 (Electronic Industries Association,EIA) 制定的,其通信模式為一對一,抗干擾能力較差,最遠距離為 15m,最高速率為 20Kbps。② RS-422是由RS-232發(fā)展升級而來的,傳送距離提升到了1200m,傳送速率達到10MB/s,可以實現一對多的單方向傳輸。③ RS-485是一種串行總線,最高傳送速率為10MB/s,最多可以安裝128個收發(fā)器。但由于沒有數據鏈路層而無法識別數據錯誤,易導致一個點出現問題則可能整個總線導致崩潰的惡劣情況。④ CAN是由ISO國際標準化組織提出的一種串行總線協議,最遠傳送距離高達10km,總線節(jié)點多達110個,具有很好的數據效驗機制,數據通信非??煽俊Mㄟ^以上對常用總線在速率、開發(fā)周期、容錯機制、傳送距離、通信機制等方面的比較,研究團隊最終選擇了性能突出、安全可靠的CAN作為“小陶”的總線,并且選用了廣州致遠股份有限公司生產的CANalyst-Ⅱ分析儀+應用協議分析工具作為CAN總線分析儀,該產品支持兩路CAN接口及USB 2.0接口,具備CAN總線協議分析功能。[5]
機器人館員的主要功能是在圖書館、博物館等的入口處迎賓,向進館用戶介紹使用規(guī)則、館藏資源、特色服務、注意事項等內容,所以軟件設計上不僅需要機器人館員能夠實現引導來賓、與人交流、自主行走、發(fā)現和避讓障礙等功能,還應具有安全可靠、容易操作、容易調試的特性。為此,研究團隊選擇微軟提供的Virual C#6.0作為“小陶”的軟件開發(fā)環(huán)境,控制芯片為MH-Ce1001芯片。機器人館員的控制流程見圖3。
圖3 “小陶”的控制流程
其中,接收存儲數據、數據分析與運算、機器人行為部分對應的是“小陶”的主機部分。機器人軟件可以分為三大部分,分別是機器人底盤移動控制程序、主機軟件、其他運動控制程序;主機軟件按照功能分為三個部分:語音識別與合成部分、自動移動與遙控移動功能、其他動作控制部分;機器人底盤移動控制程序包括:傳感器數據處理程序、自動巡線避障程序、電機控制程序、中斷控制程序,數據傳輸控制程序。由于目前“小陶”的研發(fā)經費沒有全部到位,所以其動作控制部分還未完全開發(fā),但已做出預留方案。“小陶”的軟件總體結構見圖4。
圖4 “小陶”的軟件總體結構
對于“小陶”的移動功能,研究團隊采用了萬向輪設計,輪子半徑約16mm。在應用環(huán)境理想狀態(tài)下,假設“小陶”的中心在底盤中心上,筆者繪制出了“小陶”的運動學示意圖(見圖5)。
圖5 “小陶”的運動學示意圖
在坐標系XOY中,令人的坐標系為X’O’Y’,則在任意時刻t,“小陶”在坐標系中的位置為Q=(x,y,θ)T,θ表示某時刻軸X’與軸X的夾角,為“小陶”的角速度(逆時針為正),x、y代表“小陶”的中心位置?!靶√铡备鬏喌木€速度為V=(v1v2v3v4)T。
當“小陶”平動時,軸X’與軸X的夾角為0,v1=-v3,v2=-v4;旋轉運動時,四個輪以相同方向、相同速度驅動。[6]由此可以得出,“小陶”底板運動的基本函數。
“小陶”向前走的函數為
Forward
{MoveContr1 (1,move,1);
MoveContr2 (1,move,1);
MoveContr3 (1,move,0);
MoveContr4 (1,move,0);}
“小陶”后退的函數為
Backword
{MoveContr1 (1,move,0);
MoveContr2 (1,move,0);
MoveContr3 (1,move,1);
MoveContr4 (1,move,1);}
“小陶”向左的函數為
Left
{MoveContr1 (1,move,0);
MoveContr2 (1,move,1);
MoveContr3(1,move,1);
MoveContr4(1,move,0);}
“小陶”向右的函數為
Right
{MoveContr1(1,move,1);
MoveContr2(1,move,0);
MoveContr3(1,move,0);
MoveContr4(1,move,1);}
“小陶”旋轉的函數為
{MoveContr1(1,move,1);
MoveContr2(1,move,1);
MoveContr3(1,move,1);
MoveContr4(1,move,1);}
Anti-clockwise
{MoveContr1 (1,move,0);
MoveContr2 (1,move,0);
堅持把培育和引進創(chuàng)新創(chuàng)業(yè)人才作為支撐綠色發(fā)展戰(zhàn)略的關鍵舉措來抓,真正把人才作為創(chuàng)新發(fā)展的核心要素和破解發(fā)展難題的“金鑰匙”,以人才創(chuàng)新驅動新舊動能轉換。
MoveContr3 (1,move,0);
MoveContr4 (1,move,0);}
有了“小陶”底板運動的基本函數,很容易衍生出“小陶”左上45°、左下 45°、右上45°、右上45°的函數。有了這些函數的綜合應用,就可以完成“小陶”在平面上的任何運動控制了。
“小陶”左下45°走的函數為
{MoveContr1 (0,move,1);
MoveContr2 (1,move,1);
MoveContr3(0,move,1);
MoveContr4(1,move,0);}
“小陶”左上45度走的函數為
{MoveContr1(1,move,0);
MoveContr2(0,move,1);
MoveContr3 (1,move,1);
MoveContr4 (0,move,1);}
“小陶”右上45度走的函數為
{MoveContr1 (1,move,1);
MoveContr2 (0,move,1);
MoveContr3 (1,move,0);
MoveContr4 (0,move,1);}
“小陶”右下45度走的函數為
{MoveContr1 (0,move,1);
MoveContr2 (1,move,0);
MoveContr3 (0,move,1);
MoveContr4(1,move,1);}
在設計構想中,“小陶”具備與人交流的功能,然而完全自行開發(fā)語言系統(tǒng)是一項難度巨大的工程。研究團隊計劃采用科大訊飛的語音識別系統(tǒng),目前科大訊飛公司公開提供語音合成系統(tǒng)InterPhonic和語音識別系統(tǒng)InterReco。InterPhonic 6.0能夠朗讀指定文本中的文字內容、導出朗讀的語音文件;InterReco 5.0能為自助語音服務提供呼叫導航功能和關鍵字語音識別,[7]該系統(tǒng)的識別率處于行業(yè)領先,且提供全面的開放支持。InterPhonic 6.0幾乎可以滿足所有中國方言的識別和輸入,甚至可以完成中英文的混合輸入,且InterPhonic 6.0支持的對接口也非常多,常用的SAPI接口、COM接口都在其支持范圍內。
“小陶”在應答知識庫的提取上采用了歐氏距離相似度距離度量算法,這種算法相對于常用的余玄相似度算法而言,具有更高的維度和準確度。如果將余玄相似度算法看成平面上兩條線段的夾角,那么歐氏距離相似度距離度量算法所表現的則是三維空間中兩個點的空間距離。
目前,雖然本館開發(fā)的“小陶”1.0版本已經基本完成,但對于“小陶”的研發(fā)和建設并沒有結束??傮w來說,自行開發(fā)服務機器人雖然前期投入較直接購買成品略顯高昂,但后期更容易根據自身的需求來調整和改進。對于還沒有固定服務模式的新興圖書館機器人館員來說,這樣的建設模式不但促進了高校學科建設,而且為圖書館智慧機器人的服務建設積累了寶貴的經驗。