劉媛媛,崔 偉
(1.松遼水利委員會(huì)水文局(信息中心),吉林長春130021;2.松遼水利委員會(huì)水文局嫩江水文水資源中心,黑龍江齊齊哈爾161005)
洪水風(fēng)險(xiǎn)依然是流域的最大威脅。全球氣候變化,極端天氣頻發(fā),洪澇與干旱交替威脅,洪旱并存,形勢嚴(yán)峻。行之有效的解決途徑是,在努力提高防洪抗旱工程能力的同時(shí),大力加強(qiáng)防洪抗旱非工程措施的建設(shè),充分采用現(xiàn)代化信息技術(shù)全面改造和提升傳統(tǒng)的防汛抗旱效率。信息應(yīng)用,數(shù)據(jù)先行。2008年起,按照水利部有關(guān)工作安排,水利部松遼水利委員會(huì)開始實(shí)施松遼流域防洪工程數(shù)據(jù)庫的開發(fā)建設(shè)。2015年,進(jìn)行了二期項(xiàng)目的開發(fā)完善,共形成5萬余項(xiàng)工程基礎(chǔ)數(shù)據(jù)成果,其中堤防工程5 700余項(xiàng)[1],形成可供平臺及各業(yè)務(wù)系統(tǒng)調(diào)用的數(shù)據(jù)庫。隨著防汛工作不斷細(xì)化和深入,對防洪工程基礎(chǔ)數(shù)據(jù)的理解不斷深化,對數(shù)據(jù)的需求不斷提高,尤其是流域大江大河干流工程的防洪基礎(chǔ)數(shù)據(jù)信息需要更加貼近流域防洪實(shí)況需求。2015年后,部分未進(jìn)入數(shù)據(jù)庫的大型工程陸續(xù)建成,需要進(jìn)行核對和建設(shè)入庫,對應(yīng)的空間數(shù)據(jù),也需要進(jìn)一步補(bǔ)充修正,以滿足防洪減災(zāi)工作新要求、新任務(wù)。
在開展數(shù)據(jù)收集時(shí),進(jìn)行數(shù)據(jù)名錄核對、屬性拆分比對,對同意義字段進(jìn)行匹配,確定與屬性數(shù)據(jù)基礎(chǔ)的異同情況,確定是否存在擴(kuò)展字段。確定工程數(shù)據(jù)名錄及工程的空間屬性和非空間屬性來源,增補(bǔ)防洪工程數(shù)據(jù)庫表結(jié)構(gòu),加載數(shù)據(jù)并發(fā)布空間數(shù)據(jù)服務(wù)。在資料收集中,著重收集技術(shù)標(biāo)準(zhǔn)和依據(jù),貼近水利統(tǒng)一數(shù)據(jù)模型及代碼編制要求,等等。從數(shù)據(jù)分析、空間數(shù)據(jù)處理、屬性數(shù)據(jù)處理等環(huán)節(jié),開展數(shù)據(jù)處理與發(fā)布。
收集到的數(shù)據(jù)從屬性數(shù)據(jù)上看,包括“一張圖”上的堤防工程代碼、名稱數(shù)據(jù),防洪工程數(shù)據(jù)庫的堤防數(shù)據(jù)表16張,含5 778段堤防。從空間數(shù)據(jù)上看,包括“一張圖”上的堤防工程空間數(shù)據(jù)5 583段堤防。收集到需要加工處理的數(shù)據(jù)包括CAD數(shù)據(jù)及各類工程報(bào)告資料等。
工程代碼主要包含2個(gè)來源:一是防洪工程數(shù)據(jù)庫工程代碼;二是水利“一張圖”工程代碼。防洪工程數(shù)據(jù)庫的對象代碼由國家項(xiàng)目辦通過項(xiàng)目建設(shè)統(tǒng)一編制和下發(fā),在項(xiàng)目實(shí)施進(jìn)程中,由于有新增工程的存在,國家項(xiàng)目辦及其項(xiàng)目承擔(dān)單位對工程對象的代碼進(jìn)行了調(diào)整。從工程名錄中選擇同一地域范圍的3個(gè)類型的工程進(jìn)行代碼比對。其中,水庫工程選擇了豐滿水庫,代碼為220211021000006;堤防工程選擇了二松豐滿區(qū)堤防,代碼為220211041000003;控制站工程選擇了豐滿水庫控制站,代碼為22000003000002,并考察代碼的組成。在《防洪工程數(shù)據(jù)庫表結(jié)構(gòu)及標(biāo)識符》中,堤防的類型碼為11,水庫為08,類型碼沒有體現(xiàn)在編碼中[2]。第二松花江的水資源二級區(qū)代碼為A030000,豐滿以上的三級區(qū)代碼為A030100,水資源分區(qū)代碼也沒有體現(xiàn)在編碼中。經(jīng)過收集項(xiàng)目建設(shè)期資料得到,原實(shí)施單位在代碼編制中,考慮設(shè)置了2位工程類型順序碼和1位校驗(yàn)碼,工程類順序碼01~15依次為:河流、水庫、控制站,堤防、海堤、蓄滯洪區(qū),湖泊、圩垸、水閘,跨河工程、治河工程、險(xiǎn)點(diǎn)險(xiǎn)段、機(jī)電排灌站、墑情監(jiān)測站和灌區(qū)。1位校驗(yàn)碼為取所在行政區(qū)的代碼的最后1位。由此可基本確定防洪工程數(shù)據(jù)庫最終的代碼編制方式:6位行政區(qū)代碼+2位順序碼+1位校驗(yàn)碼+6位流水號。由于項(xiàng)目建設(shè)時(shí),新增了部分工程、剔除了部分重復(fù)工程等,使得實(shí)際下發(fā)的數(shù)據(jù)成果基本滿足此代碼編制規(guī)則,但個(gè)別對象類有所偏差。水利“一張圖”是水利部信息中心組織建設(shè)的實(shí)現(xiàn)水利基礎(chǔ)數(shù)據(jù)和水利專業(yè)數(shù)據(jù)一體化管理、具備多類數(shù)據(jù)資源,以統(tǒng)一地圖服務(wù)為依托的基礎(chǔ)信息平臺,集成整合了國家防汛抗旱指揮系統(tǒng)工程的各類專題數(shù)據(jù),工程代碼與水利普查數(shù)據(jù)之間具有一定的繼承性[3]。水利普查工作中的堤防工程指沿江、河、湖、海等岸邊或行洪區(qū)、分洪區(qū)、圍墾區(qū)邊緣修筑的擋水建筑物,對應(yīng)到防汛抗旱指揮系統(tǒng)的防洪工程中,主要分為堤防和海堤[4],將防洪工程代碼批量處理,去掉中間3位,保留前后各6位后,兩者可進(jìn)行比對。
1)數(shù)據(jù)量差異。從數(shù)據(jù)名錄表看,防洪工程數(shù)據(jù)庫中的堤防工程數(shù)據(jù)記錄為5 778行,“一張圖”中堤防空間的數(shù)據(jù)記錄為5 583行,兩者之間,防洪工程數(shù)據(jù)庫比“一張圖”多出195條堤防。
2)名錄匹配。按照分析出的規(guī)則對代碼進(jìn)行了處理,處理后的比對結(jié)果:兩者代碼完全一致的有5 489組,防洪工程數(shù)據(jù)庫中代碼不能得到匹配的有289行,“一張圖”中代碼不能得到匹配的有94行。兩者的代碼、名稱都一致的有5 133組,剩余356組不一致。對剩余的356組記錄逐個(gè)對比,可分為三類:第一類為在“一張圖”中名稱的連接符使用了“-”,而在防洪工程數(shù)據(jù)庫中連接符使用“_”;或者在“一張圖”中名稱的連接符使用“/”,而防洪工程數(shù)據(jù)庫中的連接符使用“/”,有290組。第二類為“一張圖”空間數(shù)據(jù)的名稱字段因?yàn)殚L度不夠,數(shù)據(jù)獲取時(shí)就存在字符串截?cái)嗟?,?行。第三類為從名稱上看可能有聯(lián)系,但無法確認(rèn)關(guān)系的,有59行。
采用兩種方式分別進(jìn)行提取分析:
第一種是按照屬性進(jìn)行提取分析。數(shù)據(jù)導(dǎo)入后,軟件會(huì)根據(jù)源數(shù)據(jù)情況自動(dòng)將數(shù)據(jù)分為注記層、點(diǎn)圖層、線圖層、面圖層、多面體圖層及其他數(shù)據(jù)類的圖層。堤防數(shù)據(jù)應(yīng)為線數(shù)據(jù),即polyline類,因此選擇數(shù)據(jù)中的線圖層,查看線圖層的屬性表,嘗試通過屬性表分析并提取堤防數(shù)據(jù)。在“l(fā)ayer”字段中可以看到多個(gè)與堤防相關(guān)的屬性取值,包括“difang”“達(dá)標(biāo)堤1”“堤防”“加固堤防”“現(xiàn)狀堤防”和“新建堤防”,逐一對包含這些屬性值的記錄行進(jìn)行查看。結(jié)果為:layer=“difang”時(shí)可查詢到2項(xiàng)記錄,layer=“堤防”時(shí)可查詢到469項(xiàng)記錄,layer=“現(xiàn)狀堤防”時(shí)可查詢到1項(xiàng)記錄,但這些數(shù)據(jù)目測均非堤防數(shù)據(jù)。layer=“達(dá)標(biāo)堤1”時(shí)可查詢到145項(xiàng)記錄,layer=“加固堤防”時(shí)可查詢到191項(xiàng)記錄,layer=“新建堤防”時(shí)可查詢到4項(xiàng)記錄,以上數(shù)據(jù)應(yīng)屬堤防數(shù)據(jù),共可提取340段記錄。
第二種是按照顏色進(jìn)行提取分析。通過“顏色字段”粗讀屬性表,大部分提示為“堤防”的數(shù)據(jù)記錄,顏色字段的屬性值為“2”或者“7”,但點(diǎn)選后發(fā)現(xiàn)并非堤防數(shù)據(jù)。選中堤防線對象,讀取屬性表信息,可以獲知“堤防”數(shù)據(jù)的顏色字段取值可能為“18”,“加固堤防”的顏色字段取值可能為“200”,“達(dá)標(biāo)堤防”數(shù)據(jù)的顏色字段取值可能為“7”,并且同名堤防的對象存在于不同的CAD圖幅中,且是不連續(xù)的折線,按照“顏色”屬性選取,共可提取272段記錄。經(jīng)過比對,確定由屬性中部分字段完成數(shù)據(jù)提取和整合,并通過提取結(jié)果的顏色字段作為驗(yàn)證。提取結(jié)果的顏色字段值大體上包含了“3”“7”和“200”等,linetype字段值大體上包含了“TRACKS”和“護(hù)岸(實(shí)線)”等,因此數(shù)據(jù)基本可取。
對提取出的數(shù)據(jù)結(jié)果進(jìn)行人工查缺補(bǔ)漏之后,進(jìn)行數(shù)據(jù)處理。首先對提取到的結(jié)果進(jìn)行字段處理。源數(shù)據(jù)的工程名稱屬性是存儲(chǔ)在氣泡式標(biāo)識中的,易于讀圖,但不能使用數(shù)據(jù)檢索和查詢。因此,要為導(dǎo)出數(shù)據(jù)增加“Name”,即“堤防名稱”字段。由于沒有其他參照資料,主要采用了人工目測的方式,逐一讀取堤防工程的名稱,完成名稱屬性的補(bǔ)充。其次,對數(shù)據(jù)進(jìn)行坐標(biāo)系統(tǒng)建立和轉(zhuǎn)換。初步判斷源文件的坐標(biāo)系統(tǒng)為“CGCS2000_3_Degree_GK_CM_123E”,為導(dǎo)出結(jié)果文件設(shè)置該坐標(biāo)系統(tǒng),并轉(zhuǎn)換到“GCS_China_Geoditic_Coordinate_System_2000”。5個(gè) 源 文 件中,有3個(gè)文件是無法得知坐標(biāo)系統(tǒng)的,只能通過空間校正進(jìn)行空間位置糾偏,存在一定的誤差。得到656個(gè)堤防空間數(shù)據(jù)對象,其中松花江干流堤防數(shù)據(jù)257條、嫩江339條、第二松花江60條。按原有屬性標(biāo)注名稱分類:“達(dá)標(biāo)堤”255條,“哈爾濱市 現(xiàn) 有堤防”31條,“加固 堤 防”255條,“現(xiàn)有堤防”61條,“現(xiàn)狀堤防”50條,“新建堤防”4條??臻g數(shù)據(jù)以geodatabase數(shù)據(jù)庫方式存儲(chǔ)。
首先,對數(shù)據(jù)表進(jìn)行初步地規(guī)范化處理,得到3張表、258行記錄,其中:嫩江96行記錄,第二松花江40行記錄,松花江干流122行記錄。參照防洪工程數(shù)據(jù)庫二期項(xiàng)目中國家項(xiàng)目辦所采取的統(tǒng)一措施,將堤防名稱中多種格式的連接符統(tǒng)一為“_”,共調(diào)整32項(xiàng)。但“馬蹄至半子山堤防”和“光榮至沿江堤”未修改。分析得出屬性數(shù)據(jù)列表中的工程代碼規(guī)則:1位工程類型字符+6位河流代碼段+2位英文順序碼+1位占位碼+1位岸別碼。以古里堤防為例,D為堤防工程類型,AB0000為松花江河流代碼AB00006的局部,AA為英文順序碼,0為占位碼,2為右岸。河流代碼段規(guī)則:松花江AB0000,嫩江AB1000,第二松花江AB1100。岸別代碼規(guī)則:1為左岸,2為右岸。對數(shù)據(jù)編碼進(jìn)行查重,發(fā)現(xiàn)有46對工程代碼重復(fù)。分析后得出,部分原始數(shù)據(jù)在進(jìn)行工程編碼時(shí),錯(cuò)誤地選用了非所在河流的代碼,造成了代碼沖突,對這部分?jǐn)?shù)據(jù)進(jìn)行代碼段替換處理。
其次,對屬性數(shù)據(jù)表參照NFCS 01-2017《防洪工程數(shù)據(jù)庫表結(jié)構(gòu)及標(biāo)識符》進(jìn)行表結(jié)構(gòu)匹配,共涉及4張數(shù)據(jù)表,即名錄表、堤防基礎(chǔ)信息表、堤防水文特征和橫斷面信息表,共10個(gè)屬性項(xiàng),具體包括堤防名稱(DIKE_NAME)、堤防長度(DIKE_LEN)、堤防級別(DIKE_GRAD)、設(shè)計(jì)洪水標(biāo)準(zhǔn)(DSFLST)、設(shè)計(jì)流量(DSFL)、堤頂超高(BNTPFR)、堤頂平均寬度(BNTPAVWD)、堤頂路面型式(BNTPRDTP)、歸口管理部門(ADM_DEP)和屬性采集時(shí)間(COLL_DATE)。在字段方面,標(biāo)準(zhǔn)中的堤防代碼字段類型為VC(20),實(shí)際數(shù)據(jù)成果為C(17),此次源數(shù)據(jù)中代碼均為11位字符串,因此字段類型設(shè)置為C(11)。堤防長度在標(biāo)準(zhǔn)中單位為m,而業(yè)務(wù)單位工作慣例采用km,因此數(shù)據(jù)類型從N(8,2)調(diào)整為N(7,3),單位km。歸口管理部門在標(biāo)準(zhǔn)中為歸口管理單位的類別,字段值為枚舉類型,字段類型為C(1),而源數(shù)據(jù)中歸口單位為描述性字符串,因此字段類型改為VC(100)。
通過Name字段進(jìn)行匹配,258條新增數(shù)據(jù)源的堤防中,完全匹配結(jié)果有65個(gè):嫩江21個(gè),第二松花江26個(gè),松花江18個(gè)??赡:ヅ浣Y(jié)果有126個(gè):嫩江41個(gè),第二松花江4個(gè),松花江81個(gè)。直接字符串比較后,完全不匹配結(jié)果有67個(gè):嫩江34個(gè),第二松花江10個(gè),松花江23個(gè)。65條堤防共對應(yīng)出空間數(shù)據(jù)對象316個(gè),經(jīng)過有關(guān)部門技術(shù)人員校對后,完成了全部數(shù)據(jù)匹配工作。
針對獲取的補(bǔ)充圖形資料開展了堤防空間數(shù)據(jù)補(bǔ)充修正工作,補(bǔ)充了堤防工程數(shù)據(jù)記錄258行,對應(yīng)空間數(shù)據(jù)656段,發(fā)布空間服務(wù)1項(xiàng)??紤]數(shù)據(jù)源主要來源于設(shè)計(jì)成果,且本期工作中未涉及實(shí)地校驗(yàn),數(shù)據(jù)與實(shí)際建成情況和已有數(shù)據(jù)成果之間的關(guān)系,還需要進(jìn)一步核實(shí)和確認(rèn)。建議條件允許時(shí),進(jìn)行現(xiàn)場對象核查,確保資料的準(zhǔn)確性。數(shù)據(jù)建設(shè)和完善是一項(xiàng)持久的工作,持續(xù)不斷地應(yīng)用和更新才能使得已建成的數(shù)據(jù)庫保持長久的生命力。在數(shù)據(jù)補(bǔ)充完善過程中,需要特別注重?cái)?shù)據(jù)標(biāo)準(zhǔn)整合和一數(shù)一源,遵照統(tǒng)一數(shù)據(jù)模型開展更新。