李新安
摘 要 論文初審是現(xiàn)行期刊的初審、外審、終審的“三審制”中重要的環(huán)節(jié)。而稿件登記和匯總又是初審入口關,在分析稿件登記和匯總目前存在工作量大、容易出錯等問題后, 設計了稿件登記智能化流程,采用Python軟件設計了代碼。在實踐中運行成功,保證了準確性,提高了工作效率。
關鍵詞 期刊;稿件登記;編程
引言
期刊的論文撰寫和發(fā)表是為了交流、傳播信息,目的是要同行認可并利用,通過符合標準和規(guī)范的編排使讀者能順利地閱讀、迅速而方便地了解和利用論文的內(nèi)容[1]。為此論文的作者和編者都應按照科技期刊的要求,遵循規(guī)定的格式,科技論文的基本要素包括:文章題名、作者署名、作者單位、摘要、關鍵詞、引言、正文、結論、參考文獻等。但編輯部經(jīng)常收到的論文缺部分要素,有的論文沒有參考文獻,有的文章甚至沒有作者姓名和作者單位,給編輯部稿件登記和初審帶來不便[2-4]。同時為了統(tǒng)計和以后工作的快捷,稿件的登記常采用Excel表格,目前大多數(shù)文章是Word文檔。編輯部收到的稿件放入一個文件夾,有的期刊一周能收到好多文章,登記文章時,逐步打開Word文檔,把題目、作者、單位等復制和粘貼到Excel表格中,工作量大,也容易出錯。筆者在某編輯部實習期間,發(fā)現(xiàn)采用編程和爬蟲技術,可以把收稿文件夾中的Word文檔論文的要素提取出來,自動生成到Excel表格中,大大提高效率和準確性,為編輯部的辦公智能化提高發(fā)揮了一定作用。
1稿件登記智能化流程設計
根據(jù)以上采用Visio設計的工作流程如圖1所示。
2采用Python編程
具體的編程代碼如下:
from win32com import client as wc
import os
from docx import Document
import pandas as pd
def doc_to_docx(dirpath,path):
file = dirpath + ‘\\ + path
word = wc.Dispatch(‘word.Application)
doc = word.Documents.Open(file)
doc.SaveAs(file.replace(‘.doc,.docx), 12)? # 12表示docx格式
doc.Close()
word.Quit()
os.remove(file)
return file.replace(‘.doc,.docx)
def get_data(dirpath):
for root, dirs, files in os.walk(dirpath):
result_list = []
for i in files:
try:
result_dict = {}
text = []
if i.endswith(‘.doc):
file_name = doc_to_docx(dirpath,i)
document = Document(file_name)? # 打開文件demo.docx
for paragraph in document.paragraphs:
c = paragraph.text.replace(‘ ‘,)
if c != ‘:
text.append(c) # 打印各段落內(nèi)容文本
elif i.endswith(‘.docx):
document = Document(dirpath V ‘\\ + i)? # 打開文件demo.docx
for paragraph in document.paragraphs:
c = paragraph.text.replace(‘ ‘,)
if c != ‘:
text.append(c)
result_dict[‘稿件名稱] = text[0]
result_dict[‘作者] = text[1]
result_dict[‘作者單位] = text[2].replace(‘(‘,).replace(‘),)
num = 0
for i in range(len(text)):
if ‘寄刊 in text[i]:
result_dict[‘參考文獻數(shù)量] = text[i-1].split(‘])[0].replace(‘[‘,)
result_dict[‘手機號碼] = text[-1].split(‘:)[1]
result_list.append(result_dict)
except Exception as e:
print(e)
with open(‘err.txt,w) as f:
f.write(i)
pd.DataFrame(result_list).to_excel(‘收稿件登記簿.xls)
print(‘程序結束)
if __name__ == ‘__main__:
dirpath = input(‘請輸入存放word文件的絕對路徑\n)
# print(dirpath)
get_data(dirpath)
運行后生成的Excel表如圖2。
收稿件登記簿生成的是Excel格式,便于用于以后本期刊的統(tǒng)計分析,比如作者單位統(tǒng)計,可以看出那些單位投稿的文章數(shù)量多,高校的文章和科研院所文章投稿數(shù)量對比,及參考文獻數(shù)量匯總及平均引文數(shù)量統(tǒng)計等等,以此Excel文檔為基礎,還可以擴展應用到稿酬計算和給作者寄刊匯總的方面,大大節(jié)省編輯的錄入時間,提高了工作效率。
3結束語
在期刊現(xiàn)行的初審、外審、終審的“三審制”中,初審是控制稿件質(zhì)量的入口,是把握刊發(fā)論文學術質(zhì)量的第一道防線,而稿件登記是編輯部論文初審環(huán)節(jié)中重要的一環(huán)。針對這個環(huán)節(jié),設計稿件登記智能化流程 ,并用Python軟件編程,自動生成的Excel文檔,便于匯總、統(tǒng)計、分析,提高了編輯部工作效率。
圖2? 自動生成的Excel表格界面
參考文獻
[1] 陳浩元.科技書刊標準化18講[M]北京:北京師范大學出版社, 1998:101.
[2]張建合.學術期刊編輯初審探微[J].編輯學報,2003,15(1):23-26.
[3] 居自強.科技期刊編輯應做好文稿的初審工作[J].編輯學報,2005, 17(1):58-59.
[4] 沈玲.高校學報編輯初審探微[J].吉林省經(jīng)濟管理干部學院學報,2010,24(6):81-84.