• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      通過C#實現房屋中介行業(yè)數據的模糊匹配

      2017-03-27 20:37宋家麟
      電子技術與軟件工程 2017年4期

      宋家麟

      摘 要 房屋中介行業(yè)的經營者常會從不同的數據源中提取相關的成交數據、業(yè)績數據,對數據進行清理以保證數據的正確性。隨后將數據進行不同維度的匹配,從而將數據變?yōu)樾畔⒑椭R,以輔助企業(yè)做出正確的決策。本文嘗試通過C#語言結合正則表達式來解釋數據進行匹配如何在行業(yè)中應用。

      【關鍵詞】房屋中介 成交數據 數據匹配 C#

      以往房產中介企業(yè)以房源信息為導向,而對業(yè)績狀況做分析可以幫助決策層更了解自己和對手。企業(yè)的管理者需要從系統中發(fā)掘更多數據資產,基于此來進行更好地進行市場的戰(zhàn)略部署。

      本文結合微軟的.NET技術,對現有的房源信息、銷售數據和市場成交數據依據規(guī)則進行匹配,幫助案例企業(yè)實時地了解企業(yè)的業(yè)績狀況,提高業(yè)務決策的有效性和可靠性。

      1 案例企業(yè)已有數據系統的現狀

      案例企業(yè)成立于1998年,在其他中介公司還是基于Excel或者使用紙筆來記錄房源信息和客戶帶看信息的時候。該公司已定制部署了一套C/S架構的集中式房源管理信息系統。

      在互聯網大潮下,企業(yè)已無法依賴單一信息系統來與新進者競爭。管理層迫切地希望可以通過新的IT技術手段,把房源等內部信息,與外部數據結合起來做分析,形成一個數據平臺,消除數據孤島。

      2 數據匹配

      數據匹配是數據之間按照某種內在關系進行配準。

      確定性數據匹配方法中,當參與匹配的列都滿足匹配規(guī)則(相等規(guī)約)時,這對記錄被認為是同一個實體。目前比較通用的做法是計算每對記錄的匹配權重,與用戶手動設定的界限值比較,根據比較結果,將該對記錄分類為匹配,不匹配或可能匹配。

      3 C#

      C#是微軟推出的一種基于.NET框架的、面向對象的高級編程語言。C?由C語言和C++派生而來,繼承了其強大的性能,同時又以.NET框架類庫作為基礎,擁有類似Visual Basic的快速開發(fā)能力。

      C#并不被編譯成為能夠直接在計算機上執(zhí)行的二進制本地代碼。與Java類似,它被編譯成為中間代碼(Microsoft Intermediate Language),然后通過.NET Framework的虛擬機——被稱之為通用語言運行庫——執(zhí)行。

      4 正則表達式

      正則表達式,又稱正規(guī)表示式、常規(guī)表示法(英語:Regular Expression,在代碼中常簡寫為regex),是計算機科學的一個概念。正則表達式使用單個字符串來描述、匹配一系列匹配某個句法規(guī)則的字符串。在很多文本編輯器里,正則表達式通常被用來檢索、替換那些匹配某個模式的文本。

      許多程序設計語言都支持利用正則表達式進行字符串操作。例如,在C#中就內建了一個功能強大的正則表達式引擎(Regex)。

      5 C#結合正則表達式進行模糊數據匹配的實例

      5.1 數據查詢優(yōu)化模塊設計

      由于全市的樓盤信息眾多,同時每月的成交數據量也非常大,當需要進行多維度數據查詢時,會遇到系統性能瓶頸。故預先將不同數據源的數據依據一定業(yè)務規(guī)則進行匹配,并預處理和分類。

      5.2 數據查詢優(yōu)化有關的主要程序代碼

      5.2.1 將外部數據與內部數據進行整合、匹配

      C#代碼中使用正則表達式,通過物業(yè)地址的近似度,將臨時表中的成交數據與盤源系統中的盤源數據進行匹配。下面以***路***弄***支弄為例。

      (1)在代碼中定義正則表達式。

      (5)序列化數據并入庫

      嵌有HTML代碼的數據流無法直接存入數據庫中,故采用了.NET框架中所提供的序列化函數來對數據內容進行處理。

      sbArea.Append(CentaBI.ReportLogic.Common.SerializeDataTableXml(dtAreaResult));

      6 總結

      為了適應行業(yè)變化,本文設計并實現了一種通過C#與正則表達式相結合為核心的數據匹配模塊。通過掌握更多的行業(yè)數據、企業(yè)經營業(yè)績數據,成功地為企業(yè)的管理和決策提供有力依據。

      參考文獻

      [1]熊建芳,高繼,任賀宇,基于ASP.NET的ADO與ADO.NET分析與研究[J].計算機與現代化,2006(07),36-38.

      [2]譚學清,譚永麗,陸泉,陳靜.商務智能[M].武漢:武漢大學出版社,2006(10).

      [3]Alistair McLeod,Business Intelligence:Discover the truth about your business,Waterstons white paper,2005,3-5.

      作者單位

      上海大學計算機工程與科學學院 上海市 200444

      宁安市| 邵武市| 蓝山县| 黄浦区| 清水县| 行唐县| 九寨沟县| 汉阴县| 怀仁县| 南溪县| 东丽区| 淮滨县| 拜城县| 永春县| 正宁县| 罗源县| 镇远县| 波密县| 温泉县| 安达市| 修水县| 北碚区| 长沙县| 凤庆县| 若尔盖县| 保康县| 江源县| 武宁县| 麻城市| 新河县| 永吉县| 正镶白旗| 永嘉县| 牙克石市| 平顺县| 高尔夫| 红桥区| 磐安县| 柳林县| 河津市| 周至县|