吳和生
(江蘇省司法警官高等職業(yè)學(xué)校,江蘇 鎮(zhèn)江 212000)
語音是人類交流中最為方便有效的方式。隨著科學(xué)技術(shù)的不斷發(fā)展,語音不僅是人與人之間的交流工具,也成為人與機器之間的交流工具。人類可以通過語言與機器進行溝通,并傳達自己的指令,使得機器根據(jù)指令去執(zhí)行相應(yīng)的工作。隨著人工智能的飛速發(fā)展,智能語音技術(shù)可以使得終端設(shè)備具有“能聽會說”的本領(lǐng)。政府更是發(fā)布了一系列關(guān)于人工智能的政策,為智能語音的發(fā)展創(chuàng)造了良好的環(huán)境。2017 年7 月,國務(wù)院印發(fā)《新一代人工智能發(fā)展規(guī)劃》,國家科技部宣布科技公司科大訊飛成為國家新一代人工智能開放創(chuàng)新平臺之一,智能語音技術(shù)上升至國家發(fā)展戰(zhàn)略。
近年來,監(jiān)獄信息化工作取得了快速的發(fā)展,各核心業(yè)務(wù)的信息化應(yīng)用水平不斷提升,逐步實現(xiàn)了全流程、高覆蓋、信息化應(yīng)用體系。但在監(jiān)獄工作的特定場景,如會見、親情電話場景、談話筆錄、網(wǎng)絡(luò)教改場景、監(jiān)區(qū)醫(yī)院診療場景、行政管理場景等業(yè)務(wù)場景,仍然采用人工處理方式為主。智能語音技術(shù)的發(fā)展,能夠提供強大的技術(shù)服務(wù)能力,較好地解決問題,優(yōu)化程序,減少監(jiān)獄工作的潛在風(fēng)險,為基層監(jiān)獄工作提供強大推力[1]。
人工智能技術(shù)的高速發(fā)展,給智能語音技術(shù)的發(fā)展提供了廣闊的平臺。目前,國內(nèi)領(lǐng)先的智能語音技術(shù)已經(jīng)在電信業(yè)務(wù)、教育、醫(yī)療、法院等多個領(lǐng)域中取得了先進應(yīng)用。例如,在電信業(yè)務(wù)中,智能語音技術(shù)為電信運營商的炫鈴/彩鈴以及各種音樂和實用信息業(yè)務(wù)提供語音搜索軟件技術(shù)平臺;在教育領(lǐng)域中,智能語音技術(shù)應(yīng)用于機器閱卷、口語評測及融入語音交互的智慧課堂設(shè)備;在醫(yī)療領(lǐng)域中,智能語音技術(shù)應(yīng)用于實時聽寫、醫(yī)學(xué)影像、基于認(rèn)知計算的輔助診療系統(tǒng)。例如,美國智能語音技術(shù)公司可以實現(xiàn)在5 min 內(nèi)將10 h 的語音病歷轉(zhuǎn)錄成文字,其醫(yī)療解決方案已經(jīng)覆蓋全美國72%的醫(yī)療機構(gòu),每年為超過50 萬名醫(yī)生、1 萬個醫(yī)療機構(gòu)提供服務(wù)。2017 年2 月,最高人民法院修訂發(fā)布《關(guān)于人民法院庭審錄音錄像的若干規(guī)定》,將智能語音識別技術(shù)引入法院庭審記錄,并賦予這一新技術(shù)成果的法律效力[2]。
目前,基于人工智能的主流語音技術(shù)包括3 大模塊,即語音識別系統(tǒng)、語義理解系統(tǒng)和語音合成系統(tǒng)。人聲語音信號經(jīng)過語音識別系統(tǒng)進行數(shù)字信號轉(zhuǎn)化、降噪處理、斷點檢測、反饋中斷等操作,將原始語音信號轉(zhuǎn)變?yōu)闃?biāo)準(zhǔn)文本信息;文本信息通過語義理解系統(tǒng),經(jīng)過自然語言處理,使得文本信息“翻譯”成機器理解的計算機信號,通過語義理解系統(tǒng)中特定語音數(shù)據(jù)庫進行學(xué)習(xí)比對,生成標(biāo)準(zhǔn)文本或命令來反饋執(zhí)行,主要進行語義識別、置信度輸出的操作;最后,執(zhí)行結(jié)果文本經(jīng)過語音合成系統(tǒng)進行文本規(guī)范、音調(diào)確定等操作,通過語法分析和韻律分析轉(zhuǎn)變成語音,輸出到屏幕、揚聲器等語音輸出系統(tǒng),完成整個過程[3]。
智能語音技術(shù)的特點:一是便捷性,在語音獲取方面非常簡便,手機、錄音筆等設(shè)備可以高效方便地完成語音采集;二是準(zhǔn)確性,語音是每個人都具有的生理特征,具備唯一性和穩(wěn)定性,通過專業(yè)采音設(shè)備獲取的語音可以準(zhǔn)確識別,目前在相對安靜的環(huán)境內(nèi),語音采集準(zhǔn)確性可以達到98%以上;三是實時性,目前最新的語音識別設(shè)備可以實時記錄說話人說的每個字,實時記錄速度在每分鐘300字以上,而錄音文稿可以做到記錄速度在每分鐘2 000 字以上,差錯率已降到2%,在不同語言之間也可以無縫切換。在監(jiān)獄工作中,罪犯的親情電話、會見電話、獄內(nèi)偵查、談話筆錄、語言服務(wù)產(chǎn)生的大量語音數(shù)據(jù),需要花費大量時間精力進行管理。利用智能語音技術(shù)中的聲紋識別、語音識別與合成、自然語言處理、聲學(xué)事件監(jiān)測、語音控制技術(shù)及時處理,從海量的語音數(shù)據(jù)中篩選有價值的信息,通過智能分析及時發(fā)現(xiàn)線索,從而提高工作精確度。
近年來,江西省重視茶產(chǎn)業(yè)發(fā)展,在政策方面,出臺了《關(guān)于推進全省茶葉品牌整合的實施意見》等一系列政策文件;在經(jīng)濟方面,政府每年整合一億元資金集中扶持江西的特色茶葉發(fā)展,即“四綠一紅”,分別是浮梁茶、婺源綠茶、狗牯腦茶、廬山云霧茶和寧紅茶五個省級重點茶葉品牌;在文化方面,積極開展江西茶葉博覽會,邀請世界各國各地區(qū)的人們來參加,更加深入了解江西茶葉的各個方面,推動茶葉文化的交流從而促進茶葉出口。
2.3.4 監(jiān)區(qū)醫(yī)院診療
(3)鉆井液處理劑加量的數(shù)字化。對每種藥品的性能及配伍性進行深入研究,實現(xiàn)每個井段加入量的數(shù)字化。避免處理劑不配伍,反復(fù)加入處理劑等問題的出現(xiàn),節(jié)省成本,降低勞動強度。
硬件基礎(chǔ)層。硬件基礎(chǔ)層為整體框架的底層,架構(gòu)計算機基礎(chǔ)硬件,如計算服務(wù)器、數(shù)據(jù)服務(wù)器、硬件存儲資源、網(wǎng)絡(luò)備份存儲、交換機、網(wǎng)絡(luò)拓?fù)浼軜?gòu)等,保障系統(tǒng)的正常運行。
1932年,Binham提出黏度的倒數(shù)具有加和性,并經(jīng)過實驗驗證,如式(2)??梢钥闯?,該模型預(yù)測精度會隨著組分油品的黏度比增大而顯著降低,特別不適合兩種組分油黏度相差大的油品混合后黏度的預(yù)測[4]。1992年,李闖文通過13組實驗結(jié)果對該模型進行預(yù)測,發(fā)現(xiàn)結(jié)果并不理想,在此基礎(chǔ)上提出一種改進模型,如式(3)。
2.2.1 電話語音場景
在監(jiān)獄內(nèi),每天有大量的罪犯需要就醫(yī)診療。在醫(yī)院監(jiān)區(qū)看到長隊候診是常見現(xiàn)象,究其根本原因在于監(jiān)區(qū)醫(yī)院警力不足,常規(guī)的醫(yī)療診斷流程繁瑣,智能語音技術(shù)可以記錄患者口述的病情,轉(zhuǎn)成文字形成罪犯電子病歷存檔,同時將醫(yī)生口述的診斷語音轉(zhuǎn)換成初步文件,再快速加以核對、編輯,不需要醫(yī)生將資料逐字鍵入電腦,能便捷地把資料轉(zhuǎn)換成電子檔案。智能語音識別技術(shù)的運用降低了醫(yī)生的工作強度和醫(yī)院監(jiān)區(qū)日常運作成本,從總體上提高了醫(yī)院監(jiān)區(qū)收容病人的能力,縮短了無效等待時間,便于監(jiān)獄提高管理效率。
在智能語音的系統(tǒng)架構(gòu)中,智能語音可以代替原來人工交流的模式。替代之前由民警承擔(dān)的人工操作,存在一定重復(fù)性和規(guī)律性的工作。
數(shù)據(jù)資源層。數(shù)據(jù)資源層主要涉及監(jiān)獄獄務(wù)數(shù)據(jù)信息,如親情電話、會見電話語音數(shù)據(jù)、獄內(nèi)偵查語音數(shù)據(jù)、筆錄談話語音數(shù)據(jù)、指揮調(diào)度語音數(shù)據(jù)、敏感數(shù)據(jù)等。
這一年多的時間里,設(shè)計方案、技術(shù)方案中每個細(xì)節(jié)的優(yōu)化,都要經(jīng)過專家論證拍板。工程建設(shè)中遇到的每一個技術(shù)難題,隨時請教專家現(xiàn)場討論決定。鹽環(huán)定揚水工程的高質(zhì)量來自高標(biāo)準(zhǔn),來自建設(shè)中的一絲不茍。
在監(jiān)獄中引入智能語音技術(shù),其架構(gòu)基本與智能語音系統(tǒng)的通用架構(gòu)一致,在現(xiàn)有的“智慧監(jiān)獄”中引入主要功能模塊,并嵌入具體工作流程。監(jiān)獄常用的框架在邏輯結(jié)構(gòu)上分為上中下3 層,下層是硬件基礎(chǔ)層,中層是數(shù)據(jù)資源層,上層是智能應(yīng)用層,保證各業(yè)務(wù)子系統(tǒng)的獨立性,使得系統(tǒng)具備較強的語音數(shù)據(jù)接收能力、數(shù)據(jù)信息分析能力和基礎(chǔ)存儲能力,同時兼顧業(yè)務(wù)功能的可擴展性,滿足新形勢下變化的應(yīng)用需求。
2.2 酒糟有機肥不同用量對烤煙生長的影響 由表2可知,不同酒糟有機肥處理對烤煙生長有一定差異。在團棵期,株高和有效葉片數(shù)各處理差異不顯著,D2處理的株高稍高于對照,而就最大葉面積而言,D1和D3處理稍低于對照,D2處理高于對照,達325.80 cm2。至旺長期,各處理的株高和有效葉片數(shù)均稍高于對照,但無顯著差異,最大葉面積表現(xiàn)為D2>D1>D3>CK。在成熟期,各處理的株高、有效葉片數(shù)和最大葉面積均稍高于對照,說明一定量的酒糟有機肥配施化肥能夠提供烤煙對養(yǎng)分的需求,有利于烤煙正常生長。
2.2.2 談話筆錄
基于監(jiān)獄管理工作的相關(guān)要求,監(jiān)獄民警需要定期開展各類談話教育活動,對談話內(nèi)容進行記錄并以文本提交。同時,在一些特殊場合,如干警與受到禁閉處罰的罪犯談話時必須在固定場所進行,且需按照監(jiān)獄管理要求對談話內(nèi)容進行錄音,并及時形成筆錄。智能語音技術(shù)直接將錄音轉(zhuǎn)成文本,甚至可以按照固定格式形成規(guī)范內(nèi)容。目前,在法院中,智能語音技術(shù)已經(jīng)能夠在庭審后直接生成合規(guī)的法律文書。這樣的應(yīng)用同樣適用于監(jiān)獄工作的談話筆錄場景,能夠極大地減少記錄和整理文字的時間,簡化辦事流程,提高辦事效率,從而有效釋放警力。
2.2.3 網(wǎng)絡(luò)教改
2018 年以來,為了落實“五大改造”新格局,司法部指出各地監(jiān)獄要開通罪犯教育改造專網(wǎng)。當(dāng)前,許多監(jiān)獄內(nèi)部教改網(wǎng)站已經(jīng)建立,以罪犯易于接受的形式開展教育改造,將起到事半功倍的效果。但基于罪犯整體文化程度和認(rèn)知水平不高,在網(wǎng)站上進行搜索信息、查閱資料較為困難。通過智能語音系統(tǒng),罪犯以說話的形式進行查詢檢索,可以精準(zhǔn)找到所需內(nèi)容。同時,罪犯也可以通過語音聆聽的方式,完成教改網(wǎng)站上特定的專題學(xué)習(xí)。這種對文字要求低門檻的方式能夠激發(fā)罪犯的學(xué)習(xí)興趣,從而達到預(yù)定的教育改造效果。
??Avishai Margalit,The Ethics of Memory,Cambridge:Harvard University Press,2004,pp.51 ~58,pp.81 ~82.
智能應(yīng)用層。智能應(yīng)用層主要完成具體的監(jiān)獄工作,如在罪犯監(jiān)聽、聲學(xué)報警、獄務(wù)辦理、信息公開、監(jiān)獄會議、網(wǎng)絡(luò)幫教、輔助診療、智能行政各類場景下的業(yè)務(wù)功能[4-5]。
目前,服刑人員的會見電話、親情電話,是服刑人員與外界交流的重要渠道,了解服刑人員的電話交談內(nèi)容,能從一定程度上了解罪犯的思想動態(tài)。現(xiàn)階段,由于各監(jiān)獄親情電話、會見電話產(chǎn)生了大量的語音數(shù)據(jù),無論是實時監(jiān)聽還是錄音整理,通過傳統(tǒng)人工監(jiān)聽的方式受限于警力規(guī)模,導(dǎo)致無法及時對通話內(nèi)容進行分析研判,且人工復(fù)聽既做不到全覆蓋,也無法快速發(fā)現(xiàn)問題。智能語音技術(shù)能實現(xiàn)對親情電話、會見電話進行語種方言分類、談話內(nèi)容轉(zhuǎn)寫、關(guān)鍵詞識別等功能,能夠幫助民警及時、高效地發(fā)現(xiàn)敏感和違規(guī)信息,切實提升監(jiān)獄在全面信息化背景下的戰(zhàn)斗力,更好地做好監(jiān)獄管理工作。
2.3.5 監(jiān)獄行政管理
在罪犯家屬或會見人員詢問民警大量監(jiān)獄獄務(wù)問題時,智能語音系統(tǒng)能夠提供高質(zhì)量的語音交互,可以運用人工智能技術(shù)在后臺分析相關(guān)人員的訴求,分析問題因果,會見人員只需要對終端設(shè)備進行語音輸入,就可以得到交互式的答復(fù)和建議。監(jiān)獄對公電話,對普通群眾提出的大多數(shù)重復(fù)高頻的問題也可以應(yīng)用智能語音設(shè)備完成,進行語音識別與合成,減少重復(fù)勞動。監(jiān)獄內(nèi)的警力流動、崗位培訓(xùn)的問題迎刃而解,效率顯著提高[6]。
重慶江津至習(xí)水高速公路筍溪河特大橋作為渝南地區(qū)新的對外通道中的關(guān)鍵控制性工程之一,其橋梁跨越了筍溪河,橋梁全長約為1578m,承臺14座,設(shè)置承臺的墩7個,主塔塔座2座,承臺采用C20混凝土作為土墊層,厚度為20cm。習(xí)水岸主塔的橋墩承臺尺寸為22.4m×20m×6m,主引橋的承臺尺寸為13m×12m×4m,除了主橋與主引橋之外,引橋承臺有4個墩,一個橋墩承臺尺寸為12.74m×10.2m×2m,一個為7.7m×7.7m×3m,兩個為8.2m×8.2m×3m。塔座與承臺都屬于大體積混凝土。
在頂層設(shè)計方面,司法行政部門政策導(dǎo)向力度不夠。隨著監(jiān)獄工作的發(fā)展和信息化工作的逐漸深入,雖然國家關(guān)于人工智能各類會議和政策文件都在強調(diào)其重要性,但總體來看,政府工作推進的力度還有待提高,在頂層設(shè)計上并沒有完善的政策細(xì)則,在監(jiān)獄獄務(wù)的智能語音應(yīng)用建設(shè)上標(biāo)準(zhǔn)不夠細(xì)化,更多的是籠統(tǒng)的指導(dǎo)性意見?;鶎颖O(jiān)獄在實施時,對于信息化發(fā)展的新技術(shù)、新模式認(rèn)識不足,設(shè)計應(yīng)用理念落后,理解也出現(xiàn)了一定的偏差,只是形式化地為了滿足智慧建設(shè)的文件要求,導(dǎo)致與合作企業(yè)的銜接不流暢,缺乏可持續(xù)應(yīng)用。
監(jiān)獄在智能語音系統(tǒng)建設(shè)之初的設(shè)想是推動大面積應(yīng)用,然而在實際的操作中,操作者存在一系列問題。一是部分民警年級偏大,對新生事物的接受能力不足,存在畏難情緒;二是部分民警思想重視程度不夠,沒有充分利用新技術(shù)提高效率,導(dǎo)致系統(tǒng)并沒有顯著提高監(jiān)獄工作的層次和水平,智能語音系統(tǒng)停留在初級應(yīng)用,大部分是語音錄入和文件整理。對于技術(shù)含量更高、附加值更大的中高端應(yīng)用,如語音指揮調(diào)度、情報分析研判、咨詢交互服務(wù)、智能語音提醒、法律文書生成卻涉及較少,不能將智能語音技術(shù)與監(jiān)獄工作實戰(zhàn)有效結(jié)合。
專業(yè)工作應(yīng)該由專業(yè)的人員開展,有利于提高工作實效。無論是專業(yè)性較強的情報分析研判、文書生成,還是操作簡單的會議記錄、電話記錄等,都對民警的信息化技術(shù)水平提出了要求。前者需要專業(yè)技術(shù)能力,后者需要定期專業(yè)培訓(xùn)。目前,從事此項技術(shù)工作的民警較少,大多數(shù)沒有經(jīng)過系統(tǒng)的培訓(xùn),對專業(yè)知識、應(yīng)用操作流程、質(zhì)量標(biāo)準(zhǔn)以及相關(guān)法律法規(guī)了解得不全面,崗位培訓(xùn)時間短、項目少,往往流于形式,不能適應(yīng)現(xiàn)代化監(jiān)獄工作的高要求。這就導(dǎo)致民警在具體工作中邊學(xué)邊做,有時由于工作的高負(fù)荷也會出現(xiàn)疲于應(yīng)付的現(xiàn)象。專業(yè)警力的不足嚴(yán)重制約了智能語音技術(shù)的擴展應(yīng)用。
受地區(qū)經(jīng)濟發(fā)展和財政收入影響,政府劃撥給監(jiān)獄發(fā)展建設(shè)資金有限,且大多數(shù)放在硬件建設(shè)與信息化基礎(chǔ)建設(shè)上,投入到智能語音系統(tǒng)建設(shè)的經(jīng)費相對較少。因此,監(jiān)獄單位普遍存在智能語音技術(shù)裝備落后的問題,相應(yīng)的語音設(shè)備服務(wù)器、終端設(shè)備、存儲設(shè)備、網(wǎng)絡(luò)設(shè)備多數(shù)處于破舊缺乏維護的狀態(tài),需要不斷更新升級的軟件只能完成基礎(chǔ)功能,現(xiàn)代社會運用成熟的功能模塊沒有有效利用,缺乏可持續(xù)性和可擴展性。
人工智能技術(shù)的快速發(fā)展,使得智能語音技術(shù)在社會的各個領(lǐng)域都取得了長遠(yuǎn)發(fā)展。雖然智能語音技術(shù)在監(jiān)獄應(yīng)用還未成熟,在技術(shù)應(yīng)用場景的深度和廣度上有待進一步細(xì)化、提升,但智能語音技術(shù)應(yīng)用確實能夠解決監(jiān)獄工作中的文字錄入、語音分析、行政管理、指揮調(diào)度等實際困難,為監(jiān)獄工作實戰(zhàn)提供高水平的質(zhì)量保證。相信在不久的將來,監(jiān)獄工作者必將解決困擾發(fā)展的瓶頸,推動智能語音技術(shù)在監(jiān)獄發(fā)揮更大的作用。