• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      智能魚類信息共享平臺的構(gòu)建

      2022-07-11 09:40:52李然楊玉婷張志強(qiáng)劉鷹黃健隆李浩淼
      大連海洋大學(xué)學(xué)報 2022年3期
      關(guān)鍵詞:魚類檢索數(shù)據(jù)庫

      李然,楊玉婷,張志強(qiáng),劉鷹,3*,黃健隆,李浩淼

      (1.大連海洋大學(xué) 信息工程學(xué)院,遼寧 大連 116023;2.設(shè)施漁業(yè)教育部重點實驗室(大連海洋大學(xué)),遼寧 大連 116023;3.浙江大學(xué) 生物系統(tǒng)工程與食品科學(xué)學(xué)院,浙江 杭州 310058)

      隨著經(jīng)濟(jì)的高速發(fā)展,各行業(yè)對科學(xué)數(shù)據(jù)的需求日益迫切,許多國家和國際組織都開展了一系列基于新技術(shù)的科學(xué)數(shù)據(jù)共享研究和實踐,在世界范圍內(nèi)進(jìn)行科學(xué)數(shù)據(jù)共享工作。自20世紀(jì)80年代起,中國在多個領(lǐng)域開始推動科學(xué)數(shù)據(jù)共享平臺的構(gòu)建與運用,經(jīng)過40多年的發(fā)展,中國已建成的綜合性科學(xué)信息服務(wù)系統(tǒng),為國家重大戰(zhàn)略、科研計劃等提供了重要的信息服務(wù)支持。隨著互聯(lián)網(wǎng)新技術(shù)的發(fā)展,各領(lǐng)域?qū)π畔⒐蚕砑夹g(shù)的需求達(dá)到了一個新的高度。就漁業(yè)科學(xué)數(shù)據(jù)而言,由于涉及多個領(lǐng)域或?qū)W科的相關(guān)知識和原始數(shù)據(jù),尤其需要把以往分散的數(shù)據(jù)按一定標(biāo)準(zhǔn)重新整理形成共享平臺[1]。

      隨著中國海洋經(jīng)濟(jì)的高速增長,對魚類信息的需求也日益增大,數(shù)據(jù)庫技術(shù)的發(fā)展,使得海量信息資源的高效存儲和檢索成為可能。傳統(tǒng)的數(shù)據(jù)庫基于集中式存儲和關(guān)系數(shù)據(jù)庫體系結(jié)構(gòu),無法滿足海量數(shù)據(jù)存儲和高并發(fā)查詢的需求,存儲效率低,查詢響應(yīng)慢,且數(shù)據(jù)信息種類、歸屬和溯源也存在一些問題[2]。因此,現(xiàn)有的魚類數(shù)據(jù)庫管理系統(tǒng)已難以滿足海量魚類信息存儲和快速響應(yīng)的需要。

      中國現(xiàn)有的魚類信息數(shù)據(jù)庫主要有6個:①“水庫漁業(yè)數(shù)據(jù)庫”,始建于20世紀(jì)80年代末,由中國科學(xué)院水生生物研究所建立,該數(shù)據(jù)庫包含中國主要水庫魚類的生物學(xué)信息,并提供檢索和查詢功能[3];②“我國水產(chǎn)種質(zhì)資源信息系統(tǒng)”,2002年由中國水產(chǎn)科學(xué)研究院構(gòu)建,采用Access軟件,通過ODBC鏈接,綜合了2 771個物種的生物學(xué)信息、養(yǎng)殖信息和分布信息等;③“漁業(yè)科學(xué)數(shù)據(jù)共享平臺”,2009年由中國水產(chǎn)科學(xué)研究院承擔(dān)建設(shè),采用SQL Server 2000關(guān)系數(shù)據(jù)庫管理系統(tǒng)存儲數(shù)據(jù),該平臺集成了漁業(yè)生態(tài)環(huán)境野外調(diào)查數(shù)據(jù)、漁業(yè)生物資源野外調(diào)查數(shù)據(jù)、漁業(yè)水資源與生態(tài)特征數(shù)據(jù)及漁業(yè)物種資源與生物基礎(chǔ)數(shù)據(jù)等9類漁業(yè)科學(xué)數(shù)據(jù);④“漁業(yè)科學(xué)數(shù)據(jù)庫”,由中國水產(chǎn)科學(xué)研究院淡水漁業(yè)研究中心建立,涵蓋了食物成分?jǐn)?shù)據(jù)庫、水生生物數(shù)據(jù)庫、水產(chǎn)價格行情數(shù)據(jù)庫、水產(chǎn)英文期刊數(shù)據(jù)庫和漁業(yè)法律法規(guī)數(shù)據(jù)庫等19個子數(shù)據(jù)庫;⑤“中國臺灣地區(qū)魚類數(shù)據(jù)庫”,該數(shù)據(jù)庫實現(xiàn)了中國臺灣地區(qū)本土魚類和貝類(魚類和貝類標(biāo)本)的數(shù)字化,并可與國際魚類和貝類數(shù)據(jù)庫或相關(guān)網(wǎng)站進(jìn)行互通,在魚類分類數(shù)據(jù)和GIS應(yīng)用方面也取得了一定的進(jìn)展[4-5];⑥世界魚類數(shù)據(jù)庫“FishBase”,這是所有魚類數(shù)據(jù)庫中規(guī)模最大、開發(fā)最廣泛的全球魚類物種數(shù)據(jù)庫,由歐盟等機(jī)構(gòu)資助,全球有9個國際機(jī)構(gòu)管理(其中包括中國水產(chǎn)科學(xué)研究院),也是世界上訪問頻率最高的魚類數(shù)據(jù)庫,MySQL被用作該數(shù)據(jù)庫管理系統(tǒng)的支撐軟件[6]。

      上述魚類信息數(shù)據(jù)庫雖然解決了魚類信息存儲和查詢的問題,但仍存在諸多局限性:①數(shù)據(jù)庫信息在歸類上科學(xué)性欠缺,降低了用戶查詢有效信息的效率;②數(shù)據(jù)庫存取方式無法滿足海量數(shù)據(jù)存儲和高并發(fā)查詢的需求,導(dǎo)致存儲效率低、查詢響應(yīng)慢;③信息檢索方式單一,只提供文字檢索,不支持圖片、地圖檢索的功能;④魚類信息數(shù)據(jù)來源缺乏可追溯性,不能方便快捷地追蹤信息來源以確定信息的準(zhǔn)確度;⑤大多數(shù)的數(shù)據(jù)庫只是作為查詢展示的窗口,數(shù)據(jù)主要來自政府、科研單位和高校等。這在一定程度上影響了網(wǎng)站的開放性,不能做到優(yōu)質(zhì)、豐富的魚類資源共享。

      為突破前述數(shù)據(jù)庫的局限性,本研究中設(shè)計并構(gòu)建了智能魚類信息共享平臺,提出了基于MongoDB的分布式魚類信息數(shù)據(jù)庫操作策略,數(shù)據(jù)庫設(shè)計充分考慮了魚類信息數(shù)據(jù)來源的科學(xué)性、可追溯性和實用性,可提供基于人工智能的圖片檢索等多種查詢途徑。實踐表明,該平臺實現(xiàn)了魚類信息的高效存儲和多重并發(fā)訪問需求,有效地解決了海量數(shù)據(jù)存儲和高并發(fā)訪問問題,同時,該平臺提供了文本、圖片、地圖等多種信息檢索方式,可實現(xiàn)優(yōu)質(zhì)資源共享,并能為魚類的準(zhǔn)確識別及魚類種類歸屬、溯源等魚類數(shù)據(jù)庫管理提供科學(xué)參考。

      1 智能魚類信息共享平臺關(guān)鍵技術(shù)

      1.1 系統(tǒng)架構(gòu)

      平臺設(shè)計使用了SpringBoot結(jié)構(gòu)的Java一體式框架,采用模塊設(shè)計方法,按功能分類,將不同的功能在不同的模塊中進(jìn)行開發(fā)設(shè)計,較好地降低了平臺架構(gòu)的耦合度,利于模塊間的調(diào)用,同時也提高了代碼的可維護(hù)性。

      平臺的模塊架構(gòu)目錄如圖1所示。平臺分為Common公共模塊和Web前端交互模塊。Common公共模塊負(fù)責(zé)開發(fā)各個模塊中均可能被調(diào)用到的業(yè)務(wù);Web模塊負(fù)責(zé)開發(fā)與前端進(jìn)行交互的相關(guān)功能。平臺將各個功能拆分成不同的模塊,并把這些模塊部署到Docker容器下,在分離各個功能的同時,不會因為這樣的設(shè)計添加額外的配置,從而實現(xiàn)了后端的微服務(wù)架構(gòu)。

      圖1 模塊架構(gòu)目錄Fig.1 Module architecture directory

      在Common模塊中,實現(xiàn)了上傳魚類信息圖片的FTP功能、用戶中心的密碼加密功能;在Web模塊中主要是業(yè)務(wù)邏輯功能的代碼,將其放在mainjava之中,將MVC設(shè)計模式中的用戶個人中心板塊定義在Web模塊中的mainview包之中。總體上體現(xiàn)了各司其職,減少耦合。

      平臺前端采用Bootstrap框架,通過該框架的柵格特性,解決了不同瀏覽器間的兼容性問題,使網(wǎng)頁無論在臺式機(jī)、平板電腦和移動設(shè)備上均能獲得較好地體驗。

      平臺使用Vue組織與簡化Web開發(fā)。Vue所關(guān)注的核心是MVC模式中的視圖層,同時也能方便獲取數(shù)據(jù)更新,并通過組件內(nèi)部特定的方法實現(xiàn)視圖與模型的交互。對于從后端傳來的Json數(shù)據(jù),運用Vue的for循環(huán)輸出數(shù)據(jù),實現(xiàn)視圖與模型的交互,更加適應(yīng)平臺對于信息的展示[7]。平臺信息展示流程如圖2所示。

      圖2 平臺信息展示流程圖Fig.2 Flow chart of platform information display

      智能魚類信息共享平臺系統(tǒng)架構(gòu)如圖3所示。其中,接入層展示平臺的受眾群體,包括用戶、科研人員(合作者)和開發(fā)維護(hù)人員;展示層為前端的Web界面;應(yīng)用層是后端的一些接口,完成信息的上傳、審核和用戶管理;服務(wù)層中包含與MongoDB、MySQL操作的接口;系統(tǒng)層包含平臺運行的硬件和軟件,軟件使用SpringBoot內(nèi)置的Tomcat 9、MongoDB 4.4和MySQL 8.0。

      圖3 智能魚類信息共享平臺系統(tǒng)架構(gòu)圖Fig.3 System architecture of fish information sharing platform

      1.2 MongoDB數(shù)據(jù)庫關(guān)鍵技術(shù)

      由于平臺框架采用SpringBoot,故使用Spring提供的MongoTemplate服務(wù)進(jìn)行MongoDB的數(shù)據(jù)庫操作。數(shù)據(jù)庫基本操作增、刪、改、查(CURD)使用Springframework包中的MongoTemplate數(shù)據(jù)庫交互API完成,包括結(jié)構(gòu)化Query查詢操作類、結(jié)構(gòu)化Criteria類、Update類和DeleteResult類[8-10]。

      使用DBRefs完成文檔的引用,保證數(shù)據(jù)庫中的數(shù)據(jù)正確、有效,使數(shù)據(jù)庫表間的引用清晰規(guī)范,方便數(shù)據(jù)庫后期的維護(hù)。

      采用阿里云提供的云服務(wù)器平臺,以及Nginx反向代理和SpringBoot內(nèi)置的Tomcat服務(wù)器組合完成網(wǎng)站部署。

      1)服務(wù)器代碼處理方法。在服務(wù)器的配置上,使用Nginx反向代理Tomcat的端口服務(wù)實現(xiàn)IP地址與域名的解析和映射功能,用戶可以直接通過DNS域名解析的方式訪問Web界面。

      IDEA首先把后端Java代碼通過Gradle配置及SpringBoot Application定義SpringBoot啟動類入口,執(zhí)行Gradle的BootJar命令進(jìn)行Jar包打包處理。

      2)云服務(wù)器上的部署。Linux通過FTP服務(wù)把可執(zhí)行Jar包上傳到服務(wù)器中,通過執(zhí)行下列命令完成:

      java -jar yulib-web-1.0.5.jar

      把后端Jar包以java原生方式運行在8080端口。一旦退出命令行,8080端口也隨之關(guān)閉,為把Jar包持久化運行在服務(wù)器上,通過執(zhí)行下列語句達(dá)成持久化操作:

      nohup java -jar yulib-web-1.0.5.jar >log.out &

      3)后端接口的安全策略。Linux為了提高安全性和可訪問性,在使用HTTPS協(xié)議時,要求前端JS代碼不可以通過IP地址的形式訪問后端,本平臺通過Nginx反向代理端口實現(xiàn)域名的轉(zhuǎn)發(fā)跳轉(zhuǎn)操作,在Nginx進(jìn)行8080端口配置。

      1.3 檢索方式與入口

      魚類信息平臺的一級檢索包括專題、類群、魚汛。二級檢索包括綱目、海水、淡水、形態(tài)、汛期、瀕危、毒性和有無鱗片等。

      專題檢索按照魚綱、地域和形態(tài)等對魚類進(jìn)行分類,平臺采用魚類學(xué)中以魚的形態(tài)結(jié)構(gòu)作為分類鑒定的主流分類方法,按綱目對魚進(jìn)行劃分,使用了拉斯分類系統(tǒng)作為其中的一種分類方式,使檢索更清晰;按照魚所生活的水體環(huán)境,又將魚分為了海水魚、淡水魚,目的是使用戶可以通過魚的生活區(qū)域,快速了解到魚的信息;對于生活在中國不同海域的魚類做了進(jìn)一步分類,分為黃海、渤海、東海和南海4個海域,對淡水魚按照北方區(qū)、華西區(qū)、寧蒙區(qū)、華東區(qū)和華南區(qū)進(jìn)行了劃分,以更好地為漁業(yè)生產(chǎn)提供信息服務(wù)。平臺能根據(jù)區(qū)域查找指定魚類信息,如查詢黃花魚在渤海海域中的汛期,則在“渤?!敝袡z索,縮小了檢索的范圍。針對形態(tài)特征、魚汛等情況,加入了形態(tài)、汛期、瀕危和毒性等檢索入口,方便用戶對該類信息的檢索[11-12]。

      對類群的劃分,側(cè)重經(jīng)濟(jì)價值和實用性,將魚分為有鱗片和無鱗片,以更好地了解魚的經(jīng)濟(jì)價值、營養(yǎng)價值,有無毒性等,為漁業(yè)生產(chǎn)和人民生活提供服務(wù)。

      平臺還提供了圖片、地圖檢索的功能,系統(tǒng)可根據(jù)用戶上傳的魚的圖片顯示該魚的相關(guān)信息;地圖檢索則是根據(jù)魚所處的位置在地圖中進(jìn)行搜索,提供了直觀的檢索途徑;另外,平臺還設(shè)置了通過魚的學(xué)名、中文名、高級檢索進(jìn)行查詢,方便用戶進(jìn)行綜合信息分析。系統(tǒng)檢索主界面如圖4所示。

      圖4 系統(tǒng)檢索主界面Fig.4 Main interface of system retrieval

      2 AI圖片識魚

      平臺應(yīng)用人工智能技術(shù)實現(xiàn)了智能識魚功能。針對用戶使用圖片進(jìn)行查詢魚類信息的需求,平臺集成了AI識魚模塊。用戶上傳需要查詢的魚的圖片,系統(tǒng)將會出現(xiàn)該魚的詳細(xì)信息。該功能使用Python語言,通過卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練,為用戶查詢提供了一種方便有效的檢索渠道。

      2.1 數(shù)據(jù)的預(yù)處理

      系統(tǒng)數(shù)據(jù)收集的圖片主要來自實地拍照、書籍和互聯(lián)網(wǎng)等,并對清晰度不足的圖片進(jìn)行了增強(qiáng)處理。本平臺數(shù)據(jù)集包含中華鱘、海豚、鯊魚、海龜和小丑魚5種水生生物,每種生物圖片200余張,共1 000余張圖片。按照80%與20%的比例,分為訓(xùn)練集和驗證集。

      數(shù)據(jù)標(biāo)注通過預(yù)先定義labels數(shù)組完成,通過append方法追加標(biāo)簽,設(shè)置label[index]的初始值為1.0,通過程序?qū)D片進(jìn)行自動標(biāo)注,并通過標(biāo)簽完成對圖像的分類。

      在圖片預(yù)處理過程中,主要使用的是OpenCV(open source computer vision library)技術(shù),先通過cv2.imread()讀取圖片,由于輸入的圖片大小不一且像素較高,需將圖像調(diào)整到某一尺寸,系統(tǒng)中將圖片調(diào)整為64×64像素大小。通過調(diào)用shuffle函數(shù),將讀取到的數(shù)據(jù)集中的圖片打亂順序,避免由于識別單一圖片而造成的數(shù)據(jù)不準(zhǔn)確[13]。

      2.2 算法模型

      平臺中使用的算法是人工神經(jīng)網(wǎng)絡(luò)中的卷積神經(jīng)網(wǎng)絡(luò)。

      1)數(shù)據(jù)集的輸入。數(shù)據(jù)訓(xùn)練中因為輸入的是彩色圖片,以RGB 3種顏色為基礎(chǔ),設(shè)置num_channels通道數(shù)為3。

      2)卷積層的建立。定義3個卷積層,其中,每一個卷積層中卷積核大小規(guī)定為3×3,將卷積后的結(jié)果映射成1 024維的特征。構(gòu)造一個權(quán)重參數(shù),并將其進(jìn)行隨機(jī)初始化。構(gòu)造一個biases參數(shù),將biases參數(shù)的值規(guī)定為0.05。

      3)對輸出結(jié)果進(jìn)行調(diào)優(yōu)。調(diào)用dropout函數(shù),進(jìn)一步解決過擬合的問題,將keep_prob的值設(shè)為0.7,避免過度擬合。將學(xué)習(xí)率設(shè)為1×10-4,定義total_iterations=0,規(guī)定迭代從0開始。調(diào)整num_iteration的值,指定迭代次數(shù),當(dāng)規(guī)定的迭代次數(shù)完成以后,結(jié)束訓(xùn)練。可根據(jù)設(shè)備性能、圖片大小及復(fù)雜程度設(shè)置迭代次數(shù),從而使訓(xùn)練結(jié)果達(dá)到最優(yōu)[14-15]。

      4)輸出結(jié)果的保存。通過調(diào)用Saver模塊,將訓(xùn)練好的模型進(jìn)行保存和讀取,達(dá)到占用較小內(nèi)存空間的目的。

      5)試驗結(jié)果。通過分析在訓(xùn)練過程中的輸出結(jié)果可知,隨著迭代次數(shù)的增加,訓(xùn)練集的準(zhǔn)確率不斷提高,雖然驗證集的準(zhǔn)確率在訓(xùn)練過程中有起伏,但總體呈現(xiàn)上升趨勢。在現(xiàn)有的數(shù)據(jù)集訓(xùn)練下,模型的準(zhǔn)確率達(dá)到92.67%。

      本平臺在對圖像數(shù)據(jù)集處理中,鑒于圖片數(shù)量有限,訓(xùn)練集的識別率略低于驗證集。隨著平臺數(shù)據(jù)的積累,訓(xùn)練結(jié)果的準(zhǔn)確率將逐步提升。由于所需的圖像樣本目前并無公開的數(shù)據(jù)集,未來隨著本平臺數(shù)據(jù)的積累,樣本匱乏問題將得到有效解決,同時考慮對圖像數(shù)據(jù)集采用數(shù)據(jù)增強(qiáng)、遷移學(xué)習(xí)等方法進(jìn)一步豐富樣本。

      3 數(shù)據(jù)庫結(jié)構(gòu)

      3.1 數(shù)據(jù)庫表

      通過調(diào)研和查閱大量的文獻(xiàn),對現(xiàn)有的魚類數(shù)據(jù)庫中各種魚類相關(guān)信息進(jìn)行了系統(tǒng)的歸類,最終確定了16張表。每張表的結(jié)構(gòu)相對獨立,但信息可以交叉查詢,為用戶提供了一個科學(xué)、嚴(yán)謹(jǐn)、靈活、方便的信息查詢環(huán)境。

      在確定這些表的屬性過程中,充分考慮了魚類信息數(shù)據(jù)來源的科學(xué)性、實用性和可追溯性。該數(shù)據(jù)庫的主表為魚類基本信息表,通過該表又延伸出與魚類信息相關(guān)的其他15張表(表1)。其中,魚類的基本信息表是所有數(shù)據(jù)表的核心,魚類基本信息表包括學(xué)名、俗名、同種異名、綱、目、科、圖片、生態(tài)學(xué)特征、地理區(qū)域、形態(tài)特征、魚汛、瀕危和毒性等。

      表1 魚類信息共享平臺數(shù)據(jù)庫表Tab.1 Database table of fish information sharing platform

      在基本信息中確定綱和目為魚類的分類奠定了基礎(chǔ),使用拉斯系統(tǒng)將魚類分為軟骨魚綱和硬骨魚綱,歸納了十幾個總目,并對魚鰭、分解特征、繁殖、魚卵、形態(tài)計量、疾病和參考文獻(xiàn)等信息進(jìn)行了更進(jìn)一步地描述,涵蓋了魚類的主要信息,滿足用戶查詢信息的需求[6]。

      為更好地服務(wù)漁業(yè)生產(chǎn)和人民生活,平臺可通過查找魚汛信息,準(zhǔn)確地掌握汛期,達(dá)到最大捕撈量;提供魚類瀕危及毒性等與人類生活息息相關(guān)的信息,可為分析魚類瀕危原因及保護(hù)措施提供有力依據(jù),并為環(huán)境保護(hù)和飲食健康提供科學(xué)參考。

      魚類基本信息表與其他表間采用一對多的關(guān)系,使得各表關(guān)系清晰明了;各表均采用ID編號作為各表的主鍵,方便用戶查詢信息[16-17]。為了使信息可追溯,在每個表中增加了參考號的屬性,方便用戶追蹤信息來源。

      以黃魚(Larimichthys)為例,在搜索框輸入黃魚,進(jìn)入黃魚信息頁面,顯示包括學(xué)名、俗名、

      綱目、生物學(xué)特征、生活習(xí)性、區(qū)域和汛期等基本信息(圖5)。用戶還可根據(jù)需要使用其他檢索入口查詢更多信息。

      圖5 魚類基本信息界面Fig.5 Fish basic information interface

      3.2 數(shù)據(jù)采集

      智能魚類信息共享平臺的數(shù)據(jù)庫采用邊建設(shè)邊采集數(shù)據(jù)的方式。在建設(shè)數(shù)據(jù)庫的同時,采集、管理數(shù)據(jù),做到數(shù)據(jù)庫建設(shè)、數(shù)據(jù)采集同步進(jìn)行。

      智能魚類信息數(shù)據(jù)共享平臺是一個面向用戶免費開放的公益性數(shù)據(jù)庫。平臺信息主要來自兩個方面:首先,通過向有關(guān)的政府部門、科研單位、高等院校等收集信息來完善數(shù)據(jù)庫;其次,平臺允許使用者上傳魚類相關(guān)信息,或?qū)σ延行畔⑻岢龈纳暾?,由平臺數(shù)據(jù)庫管理員對上傳信息進(jìn)行審核,并更新至數(shù)據(jù)庫中,使用者亦是建設(shè)者。魚類信息數(shù)據(jù)采集流程如圖6所示。

      圖6 數(shù)據(jù)采集流程圖Fig.6 Flow chart of data acquisition

      智能魚類信息共享平臺服務(wù)能力與數(shù)據(jù)庫質(zhì)量密切相關(guān)。為使數(shù)據(jù)庫形成一個良好的網(wǎng)絡(luò)信息環(huán)境,平臺由專門管理員負(fù)責(zé)更新數(shù)據(jù)、監(jiān)控數(shù)據(jù)庫運行、優(yōu)化數(shù)據(jù)查詢功能、備份數(shù)據(jù)和檢查數(shù)據(jù)一致性等工作。在使用者上傳魚類相關(guān)信息后,數(shù)據(jù)庫管理員對相關(guān)信息進(jìn)行審核,確保信息正確有效。

      4 討論

      4.1 數(shù)據(jù)庫管理系統(tǒng)的選擇

      隨著魚類信息數(shù)據(jù)的快速增長,海量信息的高效存儲和檢索成為漁業(yè)領(lǐng)域的一個重要課題。現(xiàn)有的魚類數(shù)據(jù)庫管理系統(tǒng)已難以滿足海量數(shù)據(jù)存儲和快速響應(yīng)用戶查詢的需要。其主要原因是傳統(tǒng)的數(shù)據(jù)庫主要基于集中式存儲和關(guān)系數(shù)據(jù)庫體系結(jié)構(gòu),面對海量數(shù)據(jù),在存儲和高并發(fā)訪問上顯現(xiàn)出性能低、查詢響應(yīng)慢等問題。

      目前,國內(nèi)的魚類信息數(shù)據(jù)庫多采用關(guān)系型數(shù)據(jù)庫管理數(shù)據(jù),主流使用的關(guān)系型數(shù)據(jù)庫管理系統(tǒng)有MySQL、Microsoft SQL Server、Microsoft Access等,如“我國水產(chǎn)種質(zhì)資源信息系統(tǒng)”采用Access軟件;王立華等[5]構(gòu)建的“漁業(yè)科學(xué)數(shù)據(jù)共享平臺”使用SQLServer 2000數(shù)據(jù)庫管理系統(tǒng);國際上使用較為廣泛的FishBase數(shù)據(jù)庫也是采用MySQL作為數(shù)據(jù)庫管理系統(tǒng)的支撐軟件[4]。其中,關(guān)系型數(shù)據(jù)庫適合可以預(yù)先定義邏輯關(guān)系的數(shù)據(jù),數(shù)據(jù)結(jié)構(gòu)化是必要的,對于目前海量的非結(jié)構(gòu)化數(shù)據(jù)管理顯得力不從心,當(dāng)海量數(shù)據(jù)需要將負(fù)載分配到不同的服務(wù)器上時,對于基于SQL語言開發(fā)的系統(tǒng)也是非常困難的。而非關(guān)系型數(shù)據(jù)庫NoSQL適合處理結(jié)構(gòu)松散、不相關(guān)、不確定和逐步發(fā)展的數(shù)據(jù)需求,能夠更簡單或者更快速地開展編程,具備管理大規(guī)模數(shù)據(jù)的功能。

      本研究中,智能魚類信息共享平臺的構(gòu)建,與前述的“我國水產(chǎn)種質(zhì)資源信息系統(tǒng)”“漁業(yè)科學(xué)數(shù)據(jù)共享平臺”“FishBase”數(shù)據(jù)庫等系統(tǒng)使用的關(guān)系型數(shù)據(jù)庫[18-19]不同,采用非關(guān)系型數(shù)據(jù)庫MongoDB。該數(shù)據(jù)庫是基于分布式文件存儲的開源非關(guān)系型數(shù)據(jù)庫管理系統(tǒng),平臺利用MongoDB的內(nèi)存映射技術(shù)實現(xiàn)了高性能和高可擴(kuò)展性,獲得了較好的高并發(fā)訪問效率;采用MongoDB的BinaryJSON管理松散的數(shù)據(jù)結(jié)構(gòu),使用其自動分片的功能存儲海量數(shù)據(jù),實現(xiàn)了復(fù)雜的數(shù)據(jù)結(jié)構(gòu)管理,完成了多種查詢功能,有效地解決了海量數(shù)據(jù)存儲問題。

      4.2 人工智能技術(shù)在魚類圖像識別中的應(yīng)用

      現(xiàn)有的魚類數(shù)據(jù)庫一般只提供文字檢索方式,隨著大數(shù)據(jù)及人工智能技術(shù)的發(fā)展,圖像檢索、地圖檢索方式的應(yīng)用越來越廣泛。本研究中構(gòu)建的魚類信息共享平臺,通過人工智能的圖像識別技術(shù)實現(xiàn)圖像檢索,該方式使用卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練,模型可根據(jù)圖片大小及復(fù)雜程度設(shè)置迭代次數(shù),使訓(xùn)練結(jié)果達(dá)到最優(yōu),準(zhǔn)確率達(dá)到92.67%。與傳統(tǒng)識別算法中復(fù)雜的特征提取和數(shù)據(jù)重建過程相比,卷積神經(jīng)網(wǎng)絡(luò)的權(quán)值共享網(wǎng)絡(luò)結(jié)構(gòu)降低了網(wǎng)絡(luò)模型的復(fù)雜度,減少了權(quán)值的數(shù)量,魚類圖像可以直接作為數(shù)據(jù)輸入,提高了識別的效率及準(zhǔn)確率[20]。

      本研究中構(gòu)建的智能魚類信息共享平臺還實現(xiàn)了地圖檢索功能,通過使用騰訊提供的地圖組件實現(xiàn)位置顯示,將用戶輸入的魚類位置信息存放于云服務(wù)器中,程序加載時,取出服務(wù)器中位置參數(shù),實現(xiàn)在地圖上顯示魚類相關(guān)信息。在提高檢索效率的設(shè)計上,使用機(jī)器學(xué)習(xí)中的推薦算法,通過分析歷史記錄、高頻檢索詞計算檢索結(jié)果,并使用基于用戶的協(xié)同過濾算法進(jìn)行結(jié)果推薦。

      綜上,本平臺通過用戶上傳的魚類圖片,即可識別該魚的相關(guān)信息,并可在地圖中根據(jù)魚所處的位置進(jìn)行搜索,滿足了多樣化的檢索需求。

      5 結(jié)論

      1)本研究中設(shè)計的智能魚類信息共享平臺實現(xiàn)了海量魚類信息存儲和高并發(fā)訪問需要,在當(dāng)今數(shù)據(jù)快速增長情況下,使魚類信息處理有較好的預(yù)期。

      2)通過融合人工智能、地圖檢索等技術(shù),豐富了智能魚類信息共享平臺的檢索途徑。用戶可通過文本、圖片、地圖多種途徑查詢魚的詳細(xì)信息,更好地滿足了使用者的需求。

      3)智能魚類信息共享平臺面向所有用戶免費開放。用戶既可免費瀏覽所有內(nèi)容,也可向數(shù)據(jù)庫中添加魚類信息,使用者亦是建設(shè)者,最終實現(xiàn)共享優(yōu)質(zhì)魚類信息資源。

      猜你喜歡
      魚類檢索數(shù)據(jù)庫
      基于MFCC和ResNet的魚類行為識別
      2019年第4-6期便捷檢索目錄
      奇妙的古代動物 泥盆紀(jì)的魚類
      數(shù)據(jù)庫
      財經(jīng)(2017年2期)2017-03-10 14:35:35
      魚類是怎樣保護(hù)自己的
      數(shù)據(jù)庫
      財經(jīng)(2016年15期)2016-06-03 07:38:02
      專利檢索中“語義”的表現(xiàn)
      專利代理(2016年1期)2016-05-17 06:14:36
      數(shù)據(jù)庫
      財經(jīng)(2016年3期)2016-03-07 07:44:46
      數(shù)據(jù)庫
      財經(jīng)(2016年6期)2016-02-24 07:41:51
      魚類怎樣呼吸
      承德市| 清水河县| 克拉玛依市| 靖州| 阿鲁科尔沁旗| 若尔盖县| 张家界市| 库伦旗| 利辛县| 昌图县| 青州市| 长垣县| 武山县| 青铜峡市| 尖扎县| 昂仁县| 潮州市| 浦城县| 九江县| 白水县| 沅陵县| 莱阳市| 和龙市| 锡林浩特市| 洮南市| 石楼县| 正宁县| 当阳市| 巴林右旗| 红原县| 新安县| 军事| 越西县| 乌拉特中旗| 阿合奇县| 新疆| 精河县| 威海市| 贞丰县| 正镶白旗| 土默特右旗|