俞木發(fā)
方法1:QQ的OCR識圖法通過查看原始數(shù)據(jù)可以知道,每個(gè)人的手機(jī)號位數(shù)都是11位,可以先在Excel中調(diào)整列寬,使得列寬正好可以顯示11位數(shù)字,這樣人名和電話號碼就自動(dòng)分列顯示了。接著啟動(dòng)QQ并打開截圖組件,對單元格進(jìn)行截圖,點(diǎn)擊截圖工具欄的“文”(即屏幕識圖工具)進(jìn)行OCR識別,在右側(cè)的識別結(jié)果中,可以看到名字和電話已經(jīng)實(shí)現(xiàn)了自動(dòng)分離(圖2)。
點(diǎn)擊QQ識別窗口右側(cè)窗格下的“轉(zhuǎn)為在線文檔”按鈕,按提示登錄騰訊文檔后,上述識別的數(shù)據(jù)就會(huì)自動(dòng)在“騰訊文檔”中打開?,F(xiàn)在將識別后的數(shù)據(jù)和原始數(shù)據(jù)進(jìn)行核對,對識別錯(cuò)誤的數(shù)據(jù)進(jìn)行訂正后,雙擊A1單元格,全選內(nèi)容并復(fù)制(圖3)。
返回到Excel 2019窗口并新建工作表,然后將A列的數(shù)據(jù)格式設(shè)置為“文本”,這樣將上述復(fù)制的內(nèi)容粘貼到工作表后,就完成了數(shù)據(jù)的分離(圖4)。
我們還可以利用Word 2019的查找替換法來提取數(shù)據(jù)。通過觀察原始數(shù)據(jù)可以知道,數(shù)據(jù)類型主要是漢字和數(shù)字兩大類,因此我們只要在Word中依次對這兩類數(shù)據(jù)進(jìn)行替換即可。
首先將數(shù)據(jù)復(fù)制到新建的Word文檔中,接著依次點(diǎn)擊“開始→ 替換”,在“查找內(nèi)容”處輸入“[一-龥]”(不含雙引號,下同,即查找所有的漢字),在“替換為”處輸入“^p”(即段落標(biāo)記,可以依次點(diǎn)擊下方的“ 特殊格式→ 段落標(biāo)記”輸入),展開“更多”并勾選其下的“使用通配符”,最后點(diǎn)擊“全部替換”,這樣即可將漢字全部刪除,僅保留電話號碼(圖5)。
完成替換后按下“Ctrl+A”組合鍵全選數(shù)據(jù)并復(fù)制,接著返回E xc e l并新建工作表,選中B列,將其格式設(shè)置為“文本”,再定位到B1單元格并依次點(diǎn)擊“開始→ 粘貼→匹配目標(biāo)格式”。然后選中B列數(shù)據(jù),按下F5鍵打開并選擇“定位條件→空值”,最后將選中的空單元格全部刪除,這樣就可以完成電話號碼的提取了(圖6)。
姓名的提取則需在圖5所示窗口的“查找內(nèi)容”處輸入“[0-9]”(表示查找數(shù)字),其他同上,完成替換后粘貼到圖6所示的A列并刪除空單元格,這樣在A、B列就可以分離出名字和電話數(shù)據(jù)了。如果還要轉(zhuǎn)換為圖4所示的格式,那么只要將電話號碼復(fù)制到名字的后方,接著在C1:C11區(qū)域輸入01-11,在C12:C22也輸入同樣的數(shù)字,最后以C列為基準(zhǔn)排序即可(圖7)。
如果原始數(shù)據(jù)的格式和字符數(shù)是一致的,比如從某競品網(wǎng)站復(fù)制到的信息是類似“商品01訂單號139123456789商品02訂單號139123456781”的數(shù)據(jù),即商品代碼+數(shù)字,均為7+12=19位字符,現(xiàn)在需要在Excel中將商品名稱和訂單號分離,首先將數(shù)據(jù)復(fù)制到A1單元格中,定位到B1單元格并輸入1,在B2單元格中輸入公式“=B1+7”,B3單元格中輸入公式“=B2+12”,接著選中B2:B3區(qū)域并下拉填充公式(圖8)。
繼續(xù)定位到C1單元格并輸入公式“=MID($A$1,B1,7)”,表示以B1中的數(shù)字為基準(zhǔn),從第1個(gè)字符開始,依次從左到右提取A1數(shù)據(jù)中的7個(gè)字符(即提取“商品01訂單號”這樣形式的7個(gè)字符),繼續(xù)在C2單元格中輸入公式“=MID($A$1,B2,12)”,表示從第8個(gè)字符開始,依次提取12個(gè)字符(即提取訂單號數(shù)據(jù)),選中C1:C2區(qū)域并下拉填充公式,這樣就完成數(shù)據(jù)整理的要求了(圖9)。