◆吳濤/丹江口市審計局
筆者在工作中經(jīng)常會碰到如企業(yè)股東信息、不動產(chǎn)登記信息等,將同一公司或不動產(chǎn)的所有權(quán)利人的姓名、身份證號信息集中保存在一個單元格中(如圖1所示),不便于后期的數(shù)據(jù)分析。無論用常規(guī)的哪種方法來進行數(shù)據(jù)標準化,往往難度較大且費時費力。這里以企業(yè)股東信息為例,介紹運用Excel 2016中的Power Query三分鐘完成數(shù)據(jù)的整理。
圖1
Power Query是Excel 2016及Power BI Desktop中內(nèi)置的一個免費工具,主要用于數(shù)據(jù)獲取、數(shù)據(jù)轉(zhuǎn)換、數(shù)據(jù)處理,入手極快,不需要太多的學(xué)習時間,僅使用Power Query圖形界面就足以完成80%的日常任務(wù)。
1.如圖2所示,將光標定位到表格中,然后選擇“數(shù)據(jù)—從表格”,將表格引入Power Query中。
圖2
2.如圖3所示,選中“姓名(股東)、證件號碼(股東)”兩列,選擇“逆透視列”,將二維表轉(zhuǎn)為一維表。
圖3
3.如圖4所示,選中“值”列,選擇“拆分列—按分隔符”,將每個人的姓名、身份證號拆分出來。其中:分隔符為“逗號”,拆分為“行”。
圖4
4.由于每條記錄除“值”不同外,存在重復(fù),在進行升維操作時會造成取值混亂。為了唯一區(qū)分每條記錄,需要給姓名和身份證號分別進行編號加以區(qū)分。如圖5所示,選擇“證件號碼(法定代表人)”“屬性”執(zhí)行“轉(zhuǎn)換—分組依據(jù)”,對“所有行”進行計數(shù)分組。
圖5
5.添加自定義列,錄入公式=Table.AddIndexColumn([計數(shù)],"分組編號",1),作用是對每個子表添加從1開始的索引編號,并將該列命名為“分組編號”。刪除“計數(shù)”列,然后展開“自定義”列,完成分類索引編號,如圖6所示。
圖6
6.選中“屬性”列,執(zhí)行“轉(zhuǎn)換—任意列—透視列”,即可得到所需標準表,如圖7所示?!?/p>
圖7