基于LLVM的RISC-V自定義擴(kuò)展指令支持方法①

2022-01-06 08:04:44邢明杰

計(jì)算機(jī)系統(tǒng)應(yīng)用 2021年11期

王鵬, 陳影, 邢明杰

1(中國(guó)科學(xué)院軟件研究所, 北京 100190)

2(中國(guó)科學(xué)院深圳先進(jìn)技術(shù)研究院, 深圳 518055)

3(合肥工業(yè)大學(xué) 數(shù)學(xué)學(xué)院, 合肥 230601)

由于RISC-V指令集架構(gòu)具有開源、模塊化、可擴(kuò)展等特性, 近年來(lái)在許多領(lǐng)域迅速興起.國(guó)內(nèi)外也出現(xiàn)了一些基于RISC-V進(jìn)行指令集擴(kuò)展的研究和實(shí)現(xiàn).例如, 神經(jīng)網(wǎng)絡(luò)指令集擴(kuò)展研究[1-4], 加密指令集擴(kuò)展研究[5], 平頭哥公司發(fā)布的玄鐵C910處理器[6]等.對(duì)于標(biāo)準(zhǔn)指令集擴(kuò)展, RISC-V社區(qū)會(huì)提供完整的工具鏈支持[7], 而對(duì)于非標(biāo)準(zhǔn)的自定義指令集擴(kuò)展, 則意味著需要用戶自己實(shí)現(xiàn)工具鏈支持.

LLVM編譯框架具有模塊化、可復(fù)用等特性[8-10],適合用于快速搭建原型系統(tǒng)和二次開發(fā).目前LLVM社區(qū)已經(jīng)對(duì)RISC-V體系結(jié)構(gòu)進(jìn)行支持.本文通過(guò)對(duì)LLVM現(xiàn)有框架進(jìn)行分析, 研究在RISC-V后端對(duì)自定義擴(kuò)展指令集的支持方法, 為基于LLVM基礎(chǔ)架構(gòu)的RISC-V自定義指令集擴(kuò)展研究與實(shí)現(xiàn)提供借鑒.文章組織如下: 第1節(jié)介紹RISC-V指令集擴(kuò)展, 包括標(biāo)準(zhǔn)指令集擴(kuò)展和非標(biāo)準(zhǔn)的自定義指令集擴(kuò)展; 第2節(jié)對(duì)LLVM框架進(jìn)行分析, 重點(diǎn)分析現(xiàn)有的RISC-V體系結(jié)構(gòu)相關(guān)部分; 第3節(jié)研究基于LLVM實(shí)現(xiàn)擴(kuò)展指令支持的方法, 并以玄鐵C910為例進(jìn)行實(shí)現(xiàn)和驗(yàn)證;第4節(jié)給出結(jié)論與展望.

1 RISC-V指令集擴(kuò)展

RISC-V指令集架構(gòu)被設(shè)計(jì)成由基礎(chǔ)整數(shù)指令集和各種擴(kuò)展指令集組成.其中, 基礎(chǔ)整數(shù)指令集非常精簡(jiǎn)(目前最新版本的RV32I僅包含40條指令), 同時(shí)功能又足以支持編譯器和操作系統(tǒng)[7-9].擴(kuò)展指令集分為標(biāo)準(zhǔn)擴(kuò)展指令集和非標(biāo)準(zhǔn)擴(kuò)展指令集.擴(kuò)展指令集不僅支持固定寬度指令, 還可以支持可變長(zhǎng)指令和VLIW指令.為了能夠有效支持各種指令集擴(kuò)展, RISC-V指令集架構(gòu)在編碼空間和命名約定等方面做了詳細(xì)的設(shè)計(jì)和規(guī)劃.

1.1 標(biāo)準(zhǔn)指令集擴(kuò)展

標(biāo)準(zhǔn)指令集擴(kuò)展涵蓋了常用的功能支持, 并且相互之間不能存在指令編碼沖突.非特權(quán)指令集使用單個(gè)字母或者以Z開頭的字母組合來(lái)命名, 特權(quán)指令集則使用S (Supervisor級(jí)別)、H (Hypervisor級(jí)別)或者Zxm (Machine級(jí)別)開頭的字母組合來(lái)命名.其中, 字母G用來(lái)表示通用指令集擴(kuò)展組合IMAFDZicsr_Zifencei,依次表示整數(shù)、乘除法、單精度浮點(diǎn)、雙精度浮點(diǎn)、控制狀態(tài)寄存器訪問(wèn)、取指柵欄指令集.指令集名稱不區(qū)分大小寫, 名稱之間可以使用下劃線來(lái)分割, 并且后面可以有版本號(hào)信息.

RISC-V國(guó)際基金會(huì)下面設(shè)有專門的任務(wù)工作組來(lái)負(fù)責(zé)標(biāo)準(zhǔn)指令集擴(kuò)展規(guī)范的制定.同時(shí)還設(shè)有工具鏈相關(guān)的任務(wù)工作組來(lái)負(fù)責(zé)推動(dòng)開源社區(qū)工具鏈對(duì)標(biāo)準(zhǔn)指令集的支持, 從而對(duì)RISC-V的生態(tài)建設(shè)起到很好的支撐作用.

1.2 自定義指令集擴(kuò)展

RISC-V指令集架構(gòu)允許并鼓勵(lì)用戶根據(jù)自己的需求來(lái)定制指令集擴(kuò)展.自定義的非標(biāo)準(zhǔn)指令集可以與它不支持的標(biāo)準(zhǔn)擴(kuò)展或者非標(biāo)準(zhǔn)擴(kuò)展之間存在指令編碼沖突.不過(guò)為了減少?zèng)_突, RISC-V指令集規(guī)范也為自定義擴(kuò)展指令集預(yù)留了4個(gè)主編碼字段: 0b0001011(custom-0), 0b0101011 (custom-1), 0b1011011 (custom-2)和0b1111011 (custom-3).自定義擴(kuò)展指令集使用以X開頭的字母組合來(lái)命名.

比較有代表性的自定義指令集擴(kuò)展實(shí)現(xiàn)是平頭哥推出的玄鐵C910, 一款12級(jí)超標(biāo)量流水線、3發(fā)射、亂序執(zhí)行的高性能64位嵌入式多集群多核RISC-V處理器.其標(biāo)準(zhǔn)指令集架構(gòu)為RV64GCV, 并在此基礎(chǔ)上增加了自定義擴(kuò)展指令集和相應(yīng)的控制狀態(tài)寄存器,用于增強(qiáng)計(jì)算、存儲(chǔ)和多核等方面的性能.擴(kuò)展指令集的總體信息如表1所示.

表1 玄鐵C910擴(kuò)展指令集

新增指令的位寬為32位固定長(zhǎng)度, 其指令主編碼使用的是custom-0預(yù)留編碼.新增控制狀態(tài)寄存器的總體信息如表2所示.

表2 玄鐵C910擴(kuò)展寄存器

此外, 擴(kuò)展指令集需要在機(jī)器模式控制狀態(tài)寄存器MXSTATUS中開啟擴(kuò)展指令集使能位THEADISAEE的時(shí)候才能正常運(yùn)用, 否則會(huì)出現(xiàn)非法指令異常.

2 LLVM框架分析

最新的LLVM代碼已經(jīng)開始對(duì)RISC-V體系結(jié)構(gòu)進(jìn)行支持.因此, 在LLVM中增加自定義擴(kuò)展指令支持需要首先對(duì)LLVM框架[11], 特別是RISC-V相關(guān)部分有所熟悉[12].

2.1 LLVM整體框架

LLVM可以看作是一個(gè)編譯基礎(chǔ)設(shè)施, 由一系列的功能模塊以及基于這些模塊構(gòu)建的工具集組成[13-15].其整體框架如圖1所示.

圖1 LLVM整體框架

LLVM主要涉及到編譯器的中、后端, 其代碼以模塊的形式進(jìn)行劃分和實(shí)現(xiàn), 包括中間表示、代碼分析、優(yōu)化和代碼生成等[16-18].基于這些模塊實(shí)現(xiàn)的工具集有優(yōu)化器(opt)、生成器(llc)、匯編器(llvmmc)等[19].Clang主要涉及到編譯器的前端, 也是采用類似的形式進(jìn)行模塊化實(shí)現(xiàn), 包括抽象語(yǔ)法樹、詞法分析、語(yǔ)法分析、語(yǔ)義分析和LLVM中間代碼生成等.基于這些模塊實(shí)現(xiàn)的工具集有編譯器(clang)、靜態(tài)檢查工具(clang-tidy)等[20].

2.2 RISC-V體系結(jié)構(gòu)相關(guān)部分

為了能夠支持多種目標(biāo)體系結(jié)構(gòu)(X86、ARM、RISC-V等), LLVM的代碼結(jié)構(gòu)被劃分成體系結(jié)構(gòu)無(wú)關(guān)部分和相關(guān)部分, 如圖2所示.

圖2 多目標(biāo)體系結(jié)構(gòu)支持框架

體系結(jié)構(gòu)無(wú)關(guān)部分使用通用的算法來(lái)實(shí)現(xiàn)各種分析、優(yōu)化以及代碼生成(涉及指令選擇、指令調(diào)度、寄存器分配等), 并通過(guò)抽象接口來(lái)獲取體系結(jié)構(gòu)相關(guān)的信息, 執(zhí)行相應(yīng)的處理.其中RISC-V體系結(jié)構(gòu)相關(guān)信息主要包括:

1) 芯片特性.描述芯片所支持的特性、對(duì)應(yīng)的命令行參數(shù)和說(shuō)明信息等.

2) 寄存器信息.描述寄存器的編號(hào)、大小、存放數(shù)據(jù)類型、名稱、類別、分配優(yōu)先級(jí)等.

3) 指令信息.描述指令格式、編碼、操作數(shù)、指令選擇匹配模式、對(duì)應(yīng)的匯編代碼等.

4) 調(diào)用約定.描述需要被調(diào)用函數(shù)保存的寄存器列表等.

5) 調(diào)度模型.描述調(diào)度資源、指令延遲周期、對(duì)調(diào)度資源的使用情況等.

6) 處理器模型.描述處理器所支持的指令調(diào)度模型、芯片特性等.

這些信息都是通過(guò)LLVM自帶的TableGen語(yǔ)言來(lái)編寫.TableGen是一個(gè)領(lǐng)域?qū)Ｓ谜Z(yǔ)言, 用來(lái)幫助LLVM開發(fā)者來(lái)處理大規(guī)模的信息描述, 簡(jiǎn)化代碼編寫和維護(hù)工作.其語(yǔ)法形式借鑒了C++的類和模板, 并增加一些用于處理指令選擇、指令編碼的數(shù)據(jù)類型和操作.

圖3給出了TableGen代碼的處理流程: 在構(gòu)建LLVM的時(shí)候, 用戶使用TableGen編寫的代碼(文件名通常以td為后綴), 會(huì)先通過(guò)工具llvm-tblgen進(jìn)行解析, 然后在構(gòu)建目錄下生成C++數(shù)據(jù)結(jié)構(gòu)和代碼片段(文件名通常以inc為后綴), LLVM源文件通過(guò)#include方式將這些生成的文件包含進(jìn)來(lái).

圖3 TableGen代碼處理流程

TableGen本身只是描述信息記錄, 至于具體生成什么樣的C++代碼, 則需要LLVM開發(fā)者來(lái)實(shí)現(xiàn)相應(yīng)的C++代碼生成后端.除此之外, 還有一些目標(biāo)體系結(jié)構(gòu)抽象接口不適合使用TableGen來(lái)描述和自動(dòng)生成,這部分則直接使用C++代碼來(lái)實(shí)現(xiàn), 主要包括:

1) 棧幀布局.處理?xiàng)？臻g的增長(zhǎng)方向、地址對(duì)齊方式、局部變量地址偏移以及在函數(shù)開頭和結(jié)尾處插入棧幀維護(hù)代碼等.

2) 部分指令選擇處理.例如指令DAG圖構(gòu)建過(guò)程中的類型和操作合法化、函數(shù)調(diào)用和返回的處理、特殊DAG節(jié)點(diǎn)的處理等.

3) 部分寄存器信息.例如獲取預(yù)留寄存器列表、消除幀指針等.

4) 部分指令信息.例如判斷指令是否為對(duì)棧槽進(jìn)行加載或存儲(chǔ)、對(duì)分支跳轉(zhuǎn)指令的分析和處理等.

5) 匯編器和反匯編器的接口函數(shù)實(shí)現(xiàn).

6) 機(jī)器代碼層(MC)的處理.例如ELF文件寫出、重定位信息、匯編指令打印等.

2.3 LLVM測(cè)試框架

LLVM源碼包中自帶的測(cè)試用例有兩種: 回歸測(cè)試與單元測(cè)試.其中單元測(cè)試使用Google C++測(cè)試框架編寫, 用來(lái)測(cè)試LLVM的功能單元.回歸測(cè)試使用LLVM測(cè)試框架編寫, 用來(lái)驗(yàn)證特定功能點(diǎn)或者已經(jīng)修復(fù)的問(wèn)題.這些測(cè)試用例需要在每次提交代碼之前運(yùn)行通過(guò), 從而避免新的改動(dòng)出現(xiàn)回退現(xiàn)象.

3 擴(kuò)展指令支持方法

我們可以將基于LLVM的擴(kuò)展指令支持分為匯編層面支持和編譯層面支持.其中, 編譯層面支持是指可以將用戶編寫的高級(jí)語(yǔ)言程序轉(zhuǎn)換成含有擴(kuò)展指令的匯編程序或者機(jī)器指令編碼.編譯層面支持有兩種常見(jiàn)的方式: 一是在高級(jí)語(yǔ)言中定義新的數(shù)據(jù)類型和編譯器內(nèi)建函數(shù), 使得用戶可以直接通過(guò)函數(shù)調(diào)用的形式來(lái)使用擴(kuò)展指令; 二是通過(guò)編譯優(yōu)化技術(shù)將中間代碼自動(dòng)轉(zhuǎn)換成機(jī)器特定的擴(kuò)展指令.

本文主要研究匯編層面的支持方法.匯編層面支持是指可以將用戶編寫的含有擴(kuò)展指令的匯編程序轉(zhuǎn)換成機(jī)器指令編碼.根據(jù)前面對(duì)RISC-V指令擴(kuò)展的介紹以及LLVM框架的分析, 可以看到匯編層面支持大體需要完成如下工作:

1)定義新的芯片特性, 添加命令行選項(xiàng);

2) 針對(duì)新增加的寄存器, 實(shí)現(xiàn)相應(yīng)的寄存器信息描述以及可能涉及到的抽象接口;

3) 針對(duì)新增加的指令, 實(shí)現(xiàn)相應(yīng)的指令信息描述以及可能涉及到的抽象接口;

4) 根據(jù)指令集擴(kuò)展情況, 可能需要對(duì)匯編器和反匯編器的接口函數(shù)進(jìn)行更新實(shí)現(xiàn);

5) 根據(jù)指令集擴(kuò)展情況, 可能需要在機(jī)器代碼層增加相應(yīng)的處理;

6) 編寫測(cè)試用例, 對(duì)新增加的指令集擴(kuò)展進(jìn)行測(cè)試和驗(yàn)證.

接下來(lái), 我們將以玄鐵C910的擴(kuò)展指令支持為例, 對(duì)主要涉及到的工作內(nèi)容進(jìn)行具體介紹.我們已經(jīng)將完整的代碼實(shí)現(xiàn)進(jìn)行了開源, 項(xiàng)目地址為: https://github.com/isrc-cas/c910-llvm.

3.1 定義芯片特性, 添加命令行選項(xiàng)

我們?cè)赗ISCV.td文件中, 通過(guò)TableGen語(yǔ)言來(lái)描述玄鐵C910所支持的指令擴(kuò)展特性.參見(jiàn)代碼示例1,其中特性FeatureExtXuantie繼承自SubtargetFeature,并通過(guò)模板參數(shù)給出名字、屬性、屬性值、文字描述信息.同時(shí), 定義一個(gè)斷言HasExtXuantie, 可以在指令描述中用來(lái)設(shè)置指令選擇和匯編指令匹配的判斷條件.

代碼示例1.定義芯片特性def FeatureExtXuantie:SubtargetFeature＜"xuantie", "HasExtXuantie","true", "'Xuantie' (Xuantie Custom Instructions)"＞;def HasExtXuantie:Predicate＜"Subtarget-＞hasExtXuantie()"＞,AssemblerPredicate＜"FeatureXcache"＞;

除此之外, 還定義了一個(gè)命名為c910的處理器模型.從而, 用戶可以在匯編器llvm-mc的命令行中使用-mattr=+xuantie或者-mcpu=c910來(lái)開啟對(duì)玄鐵C910擴(kuò)展指令的支持特性.

3.2 描述寄存器信息

由于玄鐵 C910只對(duì)控制狀態(tài)寄存器進(jìn)行了擴(kuò)展,并沒(méi)有增加新的通用寄存器或者其他用來(lái)存放數(shù)據(jù)、參與寄存器分配的寄存器, 因此, 基于現(xiàn)有的RISC-V代碼框架, 對(duì)這部分進(jìn)行支持所需要做的工作比較簡(jiǎn)單.我們?cè)赗ISCVSystemOperands.td文件中, 使用TableGen語(yǔ)言對(duì)它進(jìn)行描述.代碼示例2給出了部分?jǐn)U展控制狀態(tài)寄存器的描述, 例如, MXSTATUS寄存器繼承自父類SysReg, 并通過(guò)模板參數(shù)給出它的名字和編碼.

代碼示例2.描述狀態(tài)寄存器信息def MXSTATUS : SysReg＜"mxstatus", 0x7C0＞;def MHCR : SysReg＜"mhcr", 0x7C1＞;def MCOR : SysReg＜"mcor", 0x7C2＞;def MCCR2 : SysReg＜"mccr2", 0x7C3＞;

現(xiàn)有的RISC-V代碼框架已經(jīng)實(shí)現(xiàn)了SysReg的定義, 以及相應(yīng)的支持.所以, 用戶只需要添加一行TableGen描述即可.然后在匯編程序中, 便可以使用該寄存器的名字作為指令的符號(hào)操作數(shù).

3.3 描述指令信息

我們以玄鐵C910的位操作擴(kuò)展指令EXT (寄存器連續(xù)位提取符號(hào)位擴(kuò)展指令)和EXTU (寄存器連續(xù)位提取零擴(kuò)展指令)為例介紹如何使用TableGen語(yǔ)言來(lái)描述指令信息.圖4給出了這兩條指令的編碼格式.

圖4 位操作擴(kuò)展指令EXT和EXTU

其匯編語(yǔ)法形式如下:

1) ext rd, rs1, imm1, imm2

2) extu rd, rs1, imm1, imm2

可以看到EXT和EXTU兩條指令具有相同的操作數(shù), 只不過(guò)是12-14位的編碼不同.因此, 可以將相同指令格式提取出來(lái), 使用TableGen的class類型定義成一個(gè)模板類, 從而避免冗余的指令信息描述.圖5給出了兩個(gè)指令格式, 其中模板類RVInst是在RISCVInstrFormats.td文件中定義, 用來(lái)表示32位的RISC-V指令格式.目前LLVM中所有的RISC-V擴(kuò)展指令都是繼承自該父類.

圖5 指令格式

我們參照LLVM現(xiàn)有的RISC-V代碼框架, 新增加一個(gè)RISCVInstrFormatsC910.td文件用來(lái)定義擴(kuò)展指令格式.其中模板類RVInstC910BO_1用來(lái)表示EXT和EXTU這樣的位操作擴(kuò)展指令格式, 它的主編碼為0b0001011 (指令集規(guī)范中預(yù)留的custom-0主編碼).然后新增加一個(gè)RISCVInstrInfoC910.td文件用來(lái)定義具體的擴(kuò)展指令, 以及細(xì)化的指令格式模板子類.

代碼示例3給出了RVInstC910BO_1的定義, 其模板參數(shù)分別為12-14位的編碼, 指令的輸出和輸入操作數(shù), 匯編指令字符串.然后, 在類的定義中根據(jù)這些參數(shù)來(lái)設(shè)置指令相應(yīng)字段的值.具體的代碼含義可以參照TableGen語(yǔ)言文檔資料.通過(guò)TableGen提供的這種抽象和繼承機(jī)制, 我們可以很方便的實(shí)現(xiàn)對(duì)玄鐵C910擴(kuò)展指令集的支持.

代碼示例3.描述指令信息class RVInstC910BO_1＜bits＜3＞ funct3, dag outs, dag ins, string opcodestr, string argstr＞: RVInst＜o(jì)uts, ins, opcodestr, argstr, [], InstFormatOther＞ {bits＜6＞ imm1;bits＜6＞ imm2;bits＜5＞ rs1;bits＜5＞ rd;let Inst{31-26} = imm1;let Inst{25-20} = imm2;let Inst{19-15} = rs1;let Inst{14-12} = funct3;let Inst{11-7} = rd;let Opcode = OPC_CUSTOM0.Value;}

3.4 測(cè)試驗(yàn)證

最后, 我們通過(guò)編寫測(cè)試用例, 來(lái)驗(yàn)證對(duì)玄鐵C910擴(kuò)展指令的支持情況.參照現(xiàn)有測(cè)試框架, 在test/MC/RISCV目錄下新增一個(gè)c910-valid.s文件用來(lái)測(cè)試有效的匯編指令, 同時(shí)新增一個(gè)c910-invalid.s文件用來(lái)測(cè)試對(duì)無(wú)效指令的錯(cuò)誤處理.代碼示例4中給出了測(cè)試用例的開頭部分.

代碼示例4.測(cè)試用例# RUN: llvm-mc %s -triple=riscv64 -mcpu=c910 -riscv-no-aliases -show-encoding # RUN: | FileCheck -check-prefixes=CHECK-ASM,CHECK-ASMAND-OBJ %s# CHECK-ASM-AND-OBJ: ext a0, a1, 4, 1# CHECK-ASM: encoding: [0x0b,0xa5,0x15,0x10]ext a0, a1, 4, 1

前兩行是要執(zhí)行的測(cè)試命令, 由RUN開頭并且嵌套在代碼注釋中.LLVM測(cè)試工具llvm-lit會(huì)根據(jù)這些命令來(lái)調(diào)用匯編器llvm-mc, 然后將輸出結(jié)果傳送給檢查工具FileCheck.FileCheck工具會(huì)根據(jù)注釋中CHECK關(guān)鍵字開頭的內(nèi)容來(lái)對(duì)比匯編生成結(jié)果.

代碼示例5是匯編指令測(cè)試用例, 有效匯編指令c910-valid.s文件中包含了新增的99條自定義玄鐵C910指令集, 我們運(yùn)行l(wèi)lvm-lit來(lái)單獨(dú)測(cè)試c910-valid.s匯編文件的正確性, 運(yùn)行結(jié)果輸出 Expected Passes 1, 說(shuō)明所有的新增自定義指令的匯編編碼都是正確的.

代碼示例5.匯編指令測(cè)試用例$./bin/llvm-lit -v../test/MC/RISCV/c910-valid.s-- Testing: 1 tests, single process --PASS: LLVM :: MC/RISCV/c910-valid.s (1 of 1)Testing Time: 0.30s Expected Passes : 1

代碼示例6是新增寄存器測(cè)試用例, 在控制與狀態(tài)寄存器文件user-csr-names.s中, 我們添加了玄鐵C910擴(kuò)展寄存器fxcr, 它的功能是用于浮點(diǎn)擴(kuò)展功能開關(guān)和浮點(diǎn)異常累積位, 我們對(duì)新增寄存器進(jìn)行指令編碼,然后用llvm-mc求出fxcr的編碼, 同時(shí)將寄存器別名添加到user-csr-names.s匯編文件中.

代碼示例6.新增寄存器測(cè)試用例User@dacent:～/tools/c910-project/c910-llvm/test/MC/RISCV$ vim user-csr-names.s# fxcr# name# CHECK-INST: csrrs t1, fxcr, zero# CHECK-ENC: encoding: [0x73,0x23,0x00,0x80]# CHECK-INST-ALIAS: csrr t1, fxcr# uimm12# CHECK-INST: csrrs t2, fxcr, zero# CHECK-ENC: encoding: [0xf3,0x23,0x00,0x80]# CHECK-INST-ALIAS: csrr t2, fxcr# name csrrs t1, fxcr, zero# uimm12 csrrs t2, 0x800, zero

代碼示例7是99條新增玄鐵C910指令中ff0指令, ff0指令是快速找 0 指令, 我們用llvm-mc進(jìn)行測(cè)試, 編譯選項(xiàng)選擇mcpu=c910 和mattr=+c910, 可以確定ff0指令對(duì)應(yīng)的編碼形式.

代碼示例7.ff0指令匯編測(cè)試用例User@dacent:～/tools/c910-project/c910-llvm/build/bin$ echo "ff0 a0,a1" |./llvm-mc --triple=riscv64 -mcpu=c910 -mattr=+c910 -showencoding -show-inst.text ff0a0, a1# encoding: [0x0b,0x95,0x05,0x84]# ＜MCInst #399 FF0# ＜MCOperand Reg:11＞# ＜MCOperand Reg:12＞＞

代碼示例8是利用llvm-mc, 在選定了編譯選項(xiàng)是mcpu=c910 和mattr=+c910之后, 對(duì)匯編編碼進(jìn)行反匯編測(cè)試, 查看執(zhí)行之后得出的是否是對(duì)應(yīng)的ff0匯編指令.

代碼示例8.ff0指令反匯編測(cè)試用例User@dacent:～/tools/c910-project/c910-llvm/build/bin$ echo"0x0b,0x95,0x05,0x84" |./llvm-mc -disassemble --triple=riscv64 -mcpu=c910 -mattr=+c910 -show-encoding -show-inst.text ff0a0, a1# encoding: [0x0b,0x95,0x05,0x84]# ＜MCInst #399 FF0# ＜MCOperand Reg:11＞# ＜MCOperand Reg:12＞＞

表3中列出了我們目前支持的所有新增玄鐵C910指令的匯編測(cè)試, 反匯編測(cè)試, 編譯選項(xiàng)mcpu=c910測(cè)試和無(wú)效操作數(shù)測(cè)試, 說(shuō)明了新增玄鐵C910自定義擴(kuò)展指令集在LLVM中具有功能完備性支持.

表3 功能完備性測(cè)試

除此之外, 我們還在一個(gè)C文件test.c中, 使用內(nèi)聯(lián)匯編的方式編寫了一條上述已定義的玄鐵C910擴(kuò)展指令, 使用clang編譯生成匯編文件, 然后用llvm-mc將匯編文件test.s, 編譯選項(xiàng)是mcpu=c910, 編譯成目標(biāo)文件, 之后可以通過(guò)反匯編來(lái)驗(yàn)證正確性.

代碼示例9.玄鐵C910新增指令內(nèi)聯(lián)匯編測(cè)試用例$./bin/clang --target=riscv64-unknown-elf test.c -S -o test.s$ cat test.c int main(){int a,b,c;a = 1;b = 2;asm volatile("mula %[z], %[x], %[y] ": [z] "=r" (c): [x] "r" (a), [y] "r" (b));if ( c == 0 ){

return -1;}return 0;}$./bin/llvm-mc test.s -triple=riscv64 -mcpu=c910 -show-encoding -show-inst --filetype=obj -o=test.o

4 結(jié)論與展望

本文通過(guò)對(duì)RISC-V指令集擴(kuò)展和LLVM框架的分析, 給出了在LLVM中實(shí)現(xiàn)對(duì)RISC-V自定義指令集擴(kuò)展的支持方法.結(jié)合玄鐵C910的例子可以看到,在現(xiàn)有LLVM框架下, 對(duì)于32位指令集擴(kuò)展的匯編層面支持比較容易實(shí)現(xiàn).

對(duì)于其他寬度的指令擴(kuò)展支持, 包括可變長(zhǎng)指令和VLIW指令擴(kuò)展的支持, 還需要做進(jìn)一步的分析研究.除此之外, 對(duì)擴(kuò)展指令的編譯層面支持涉及到編譯器的前、中和后端多個(gè)方面.后續(xù)工作中, 將重點(diǎn)研究這部分內(nèi)容.