◆黃志高
網(wǎng)絡自媒體自動控制軟件的設計與實現(xiàn)
◆黃志高
(泉州師范學院 福建 362000)
通過HttpWatch軟件對自媒體后臺發(fā)帖的過程中傳輸?shù)膱笪倪M行了抓取,隨之對抓取到字段進行分析和比較,通過CPP編程語言的多功能性對抓取到的網(wǎng)絡報文進行封裝,利用微軟的MFC類庫重現(xiàn)POST報文的發(fā)送過程,利用Visual C實現(xiàn)自媒體論壇的模擬自動操作功能,避免了用戶在自媒體的復雜操作過程,可以更加及時地對現(xiàn)有熱點進行跟蹤發(fā)布,免去了登錄驗證等一系列煩瑣行為,同時方便企業(yè)營銷團隊的網(wǎng)紅營銷在各大自媒體第一時間發(fā)布熱點信息。
自媒體;HTTP協(xié)議;HttpWatch;自動控制
近年來,自媒體逐漸興起,從博客到微博大號乃至微信公眾號,互聯(lián)網(wǎng)及媒體從業(yè)人員紛紛加入其中,探索其盈利模式自動。自媒體自動控制軟件的實現(xiàn)避免了用戶在自媒體復雜的控制過程,可以更加及時地對現(xiàn)有熱點進行發(fā)布,免去了登錄驗證和驗證碼驗證等一系列行為,能夠讓別人更快地看到你的帖文,減少了很多不必要的操作,同時可以給企業(yè)營銷和小團隊的網(wǎng)紅營銷在各大自媒體第一時間最快地發(fā)布自己所需的信息,讓信息的及時性發(fā)揮得淋漓盡致。利用CPP編程實現(xiàn)一個能夠在自媒體進行自動發(fā)帖的軟件,通過HttpWatch進行抓包[1]報文分析,通過Visual C++ 6.0構建網(wǎng)絡數(shù)據(jù)包,軟件控制以實現(xiàn)自媒體諸多功能的自動操作。
使用HTTPWATCH等抓包工具,抓取某自媒體網(wǎng)站的發(fā)送、點贊、登錄[2]等等操作的數(shù)據(jù)包,分析數(shù)據(jù)包中各參數(shù)的實際作用并修改測試,以確定重要參數(shù)的實際意義。以下是某自媒體論壇的HTTP報文截取片段(圖1)。
圖1 某自媒體論壇的HTTP報文截取片段
POST Data中包含非常多發(fā)送給服務器的信息,分析其中對我們有用的重要的key值。Request報文的BODY是最重要的一串字符信息,關乎發(fā)帖的一個成功與否,所以單獨拿出來進行分析(圖2)。
圖2 Request報文的BODY是最重要的一串字符信息
自動控制軟件[3]所需要的一些必需的參數(shù),要對凱迪論壇的回帖報文進行多次的抓包獲取,進行實際的測試實驗,才能得出正確的結論。
這是瀏覽器發(fā)送給服務器請求報文,也是我們后面編程構建POST請求時候給服務器的字段,服務器端根據(jù)這串字符來解析當前用戶的行為,來做出相應的操作,所以十分重要。根據(jù)關鍵詞的含義及多次的修改模擬發(fā)包測試,得出關鍵參數(shù)的作用如表1所示。
表1 request報文關鍵參數(shù)
在完成了對HTTP request請示數(shù)據(jù)包的正確解析后[4],用軟件編程構造出一樣的數(shù)據(jù)包,并修改其中需要自動控制修改的相關參數(shù),然后向服務器發(fā)送新構造的數(shù)據(jù),得到服務器的reponse響應報文,同時登錄自媒體站點,驗證是否自動完成相應的控制操作。如圖3所示,是自動循環(huán)發(fā)帖的程序流程圖。
HTTP協(xié)議定義許多種與服務器交互的方式,其中我們經(jīng)常用到的有GET和POST兩種方式[5],GET方式一般多用戶查詢/獲取資源信息,當成一個通用接口使用,POST方式則是用body體進行傳輸,POST方式放在請求題則不存在過長這個問題,POST方式采用body體進行發(fā)送信息,相對于GET方式安全性較高,但是也可以通過抓取報文進行獲取。自媒體平臺的自動控制,采用先抓包后修改重新封裝并發(fā)送的方式來實現(xiàn)[6],其中主要的技術是用CInternetSession這個類實現(xiàn)代理服務器(server)的connection(連接),并且創(chuàng)建一個或者多個網(wǎng)絡的會話,網(wǎng)絡連接如果完成之后,CHttpFile主要用來對HTTP發(fā)送的請求頭進行添加,也就是對header部分進行操作,它提供了向HTTP Server查詢和讀取的功能,當然如果想從HTTP Server讀取數(shù)據(jù),那么首先必須要構建一個CHttpFile的實例,用來添加和發(fā)送HTTP中的header部分[7]。另外,程序中定義計時器,可以以一定的頻率定時地發(fā)送指定文件夾下的文章到自媒體平臺,省去了用戶的許多操作,提高了工作效率和內(nèi)容的傳播量[8]。
圖3 某自媒體網(wǎng)站自動控制程序流程圖
圖4的①是當前獲取到的要發(fā)送的文章列表,②是發(fā)帖成功后返回的響應頭信息,③是發(fā)帖成功后的頁面的HTML結構,④是發(fā)帖之后進入首頁的操作。
圖4 模擬發(fā)帖成功的對話框
圖5 論壇成功發(fā)帖截圖
經(jīng)過測試,本文所開發(fā)軟件可以通過抓取的數(shù)據(jù)包,自動解析并修改數(shù)據(jù),把準備好的文章以自動發(fā)送的方式發(fā)布到自媒體網(wǎng)站。達到了對自媒體網(wǎng)站的自動控制的目的。
本文主要針對某自媒體網(wǎng)站的自動控制進行研究。首先是用抓包工具軟件對發(fā)帖時候的數(shù)據(jù)包進行抓取,對其中的報文數(shù)據(jù)進行了理解,之后利用CPP的IDE軟件編寫CPP程序?qū)δM自動發(fā)帖的程序做了實現(xiàn),成功地實現(xiàn)了自動發(fā)帖的過程。分析了最后發(fā)帖成功的代碼和帖子HTML代碼,此方案能夠在該自媒體網(wǎng)站進行自動控制的操作。
[1]蒲信竹.自媒體科普短視頻的內(nèi)容生產(chǎn)與公眾解讀——兼議對話規(guī)則的建立[J].中國編輯,2021(03):33-37.
[2]王芬.Fiddler工具在接口測試中的應用[J].無線互聯(lián)科技,2021,18(02):113-114.
[3]畢志杰,李靜.基于Python的新浪微博爬蟲程序設計與研究[J].信息與電腦(理論版),2020,32(04):150-152.
[4]葉宇翔.抽取自媒體新聞熱詞的技術實現(xiàn)[J].電腦知識與技術,2018,14(17):14-16+21.
[5]鐘宇. 面向網(wǎng)絡自媒體的空間數(shù)據(jù)挖掘研究[D].江西理工大學,2018.
[6]王偉兵,秦浩.論網(wǎng)絡抓包與分析技術在網(wǎng)絡犯罪偵查中的應用[J].中國人民公安大學學報(自然科學版),2018,24(02):74-78.
[7]蘇文斌. 自媒體文本自動文摘算法改進與設計[D].山東科技大學,2018.
[8]曹永建,祁鵠云,張千千.用批處理程序?qū)崿F(xiàn)高校機房復雜軟件的自動注冊[J].電腦知識與技術,2009,5(24):6915-6916.
2018年福建省中青年教師教育科研項目“基于模擬登錄的微博數(shù)據(jù)采集方案”(項目編號:JT180381)