• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      基于圖片內(nèi)容的商品信息檢索系統(tǒng)*

      2015-12-05 08:53:38黎浩宏浙江工貿(mào)職業(yè)技術(shù)學(xué)院浙江溫州325003
      關(guān)鍵詞:商品信息爬蟲(chóng)特征值

      黎浩宏(浙江工貿(mào)職業(yè)技術(shù)學(xué)院,浙江溫州325003)

      基于圖片內(nèi)容的商品信息檢索系統(tǒng)*

      黎浩宏
      (浙江工貿(mào)職業(yè)技術(shù)學(xué)院,浙江溫州325003)

      介紹了使用基于圖片內(nèi)容進(jìn)行商品信息檢索的算法和實(shí)現(xiàn)原型系統(tǒng),用戶提交待查詢商品圖片后,系統(tǒng)對(duì)商品圖像進(jìn)行提取關(guān)鍵特征值,再和系統(tǒng)數(shù)據(jù)庫(kù)中的圖像特征值比較,縮小了檢索得到的圖片集合,提高了查全率和查準(zhǔn)率。

      商品;圖像;檢索;NET Framework

      當(dāng)前的大部分電子商務(wù)網(wǎng)站,如京東、淘寶、當(dāng)當(dāng)、亞馬遜等提供了種類繁多的海量商品,一般電子商務(wù)網(wǎng)站只提供文字進(jìn)行查找,通過(guò)這種傳統(tǒng)的關(guān)鍵字搜索商品,返回給用戶的往往是大量的商品,搜索到的商品多達(dá)幾十頁(yè)甚至上百頁(yè),而用戶購(gòu)買商品時(shí),特別是對(duì)于穿著的衣服、鞋、帽、褲子等,不但主要考慮商品的質(zhì)量,同時(shí)商品的外形也是用戶購(gòu)買商品的關(guān)鍵因素,然而通過(guò)文字搜索到的大多數(shù)商品都不是用戶所需的商品,這樣往往浪費(fèi)了用戶的大量時(shí)間進(jìn)行選擇商品,實(shí)際上用戶在購(gòu)買商品時(shí)只查看前幾頁(yè),如果沒(méi)有查到想要的商品,也不會(huì)再往下查看商品了,存在較大的局限性。

      1 相關(guān)技術(shù)

      1.1圖片內(nèi)容檢索技術(shù)

      要進(jìn)行圖片內(nèi)容的檢索,首先要根據(jù)待查圖片進(jìn)行圖像特征提取,根據(jù)待查圖像特征到被查圖像特征庫(kù)中進(jìn)行查找,將小于閥值的備查圖像顯示出來(lái)即可,所以關(guān)鍵技術(shù)是提取圖像特征。圖像的特征包括基于文本特征和視覺(jué)特征兩類。主要使用視覺(jué)特征來(lái)進(jìn)行圖片內(nèi)容的檢索。

      圖像特征通??梢詮念伾?、紋理和形狀特征三方面進(jìn)行獲取。顏色直方圖[1]是描述圖像的視覺(jué)特征的一種廣泛使用的技術(shù)。該技術(shù)用于統(tǒng)計(jì)不同色彩在整幅圖像中所占用的比例,不考慮每種色彩在圖像中所處的位置。紋理特征是一種不依賴于顏色或亮度的反映圖像中同質(zhì)現(xiàn)象的視覺(jué)特征[2],它是所有物體表面共有的內(nèi)在特性,例如云彩、樹(shù)木、磚、織物等都有各自的紋理特征。形狀特征的提取要對(duì)圖像中物體或區(qū)域進(jìn)行劃分,圖像檢索中的形狀特征只能用于某些特殊應(yīng)用,在這些應(yīng)用中圖像包含的物體或區(qū)域可以直接獲得[3]。

      1.2網(wǎng)絡(luò)爬蟲(chóng)

      網(wǎng)絡(luò)爬蟲(chóng)是一個(gè)自動(dòng)提取網(wǎng)頁(yè)的程序,它為搜索引擎從萬(wàn)維網(wǎng)上下載網(wǎng)頁(yè),是搜索引擎的重要組成。傳統(tǒng)爬蟲(chóng)從一個(gè)或若干初始網(wǎng)頁(yè)的URL開(kāi)始,獲得初始網(wǎng)頁(yè)上的URL,在抓取網(wǎng)頁(yè)的過(guò)程中,不斷從當(dāng)前頁(yè)面上抽取新的URL放入隊(duì)列,直到滿足系統(tǒng)的一定停止條件[4]。由于系統(tǒng)中的網(wǎng)絡(luò)爬蟲(chóng)需要獲取當(dāng)前的URL所包含的圖片鏈接以及抓取往后的URL,故本網(wǎng)絡(luò)爬蟲(chóng)系統(tǒng)主要是獲取圖片同時(shí)保存在指定的位置,還要對(duì)圖片進(jìn)行特征提取,保存到系統(tǒng)的備查數(shù)據(jù)庫(kù)中。

      2 系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)

      2.1圖片內(nèi)容檢索關(guān)鍵技術(shù)

      針對(duì)圖片內(nèi)容進(jìn)行檢索時(shí),先進(jìn)行采集圖片特征,主要提取圖片的顏色直方圖特征,如果有能夠提取形狀,則將圖片形狀特征提取出來(lái),分別將特征值保存到數(shù)據(jù)庫(kù)中??梢詻](méi)有形狀特征。如果有形狀特征,則為兩者設(shè)定一定的權(quán)重值。進(jìn)行圖片檢索時(shí),先將要檢索的圖片進(jìn)行特征提取,然后和服務(wù)器端的圖片特征集合進(jìn)行檢索匹配,最后顯示出符合檢索條件的圖片。

      2.2總體結(jié)構(gòu)設(shè)計(jì)

      用戶選擇不同的圖片搜索方式搜索,如果選擇基于文本的搜索。則輸入關(guān)鍵字后,系統(tǒng)根據(jù)用戶提交的關(guān)鍵字進(jìn)行關(guān)鍵字搜索。若用戶選擇基于內(nèi)容的搜索方式,那么當(dāng)用戶上傳一張圖片后,客戶端對(duì)上傳的商品圖片進(jìn)行特征提取并上傳到服務(wù)器,與服務(wù)器中的已提取特征的商品圖片特征集進(jìn)行匹配,由系統(tǒng)查找與用戶上傳商品圖片特征相似的商品圖片,將查找到的圖片集返回給客戶端。本系統(tǒng)總體框架結(jié)構(gòu)如圖1所示。

      圖1 系統(tǒng)總體框架圖

      2.3開(kāi)發(fā)環(huán)境

      本系統(tǒng)在.net framework 4.5平臺(tái)下,采用Microsoft Visual studio2012開(kāi)發(fā)工具,數(shù)據(jù)庫(kù)使用sql server 2005,采用asp.net web form技術(shù),使用c#語(yǔ)言進(jìn)行開(kāi)發(fā)的。

      2.4數(shù)據(jù)庫(kù)設(shè)計(jì)

      根據(jù)商品圖片檢索需求,系統(tǒng)有10多個(gè)表,由于比較復(fù)雜,為便于描述,這里只列出了關(guān)鍵的5個(gè)表的內(nèi)容和其關(guān)系圖,包括商品種類表(tb_Kinds),商品信息表(GoodsInfo),商品特征表(tb_feature),用戶表(tb_Usser)以及用戶關(guān)注商品表(tb_Matching),其具體字段和關(guān)系如圖2所示。

      圖2 表的關(guān)系圖

      2.5系統(tǒng)功能

      本系統(tǒng)依據(jù)淘寶網(wǎng)的手機(jī)淘寶網(wǎng)站,將其作為初始的URL(http://a.m.taobao.com/),根據(jù)網(wǎng)絡(luò)爬蟲(chóng)進(jìn)行自動(dòng)搜索和下載圖片,同時(shí)提取下載的圖片的具體特征值并且保存到數(shù)據(jù)庫(kù)中。

      本系統(tǒng)分為前臺(tái)和后臺(tái),其中前臺(tái)主要有以下3個(gè)功能。

      查詢功能:能夠根據(jù)文字關(guān)鍵字進(jìn)行查詢商品,也能通過(guò)提交商品圖片進(jìn)行查詢商品信息,查詢到商品信息后,點(diǎn)擊相應(yīng)的商品圖片,能夠顯示商品的具體信息。

      用戶管理:具有用戶注冊(cè)和登錄功能。

      定制和推送商品:用戶可以注冊(cè)成為會(huì)員后,才能定制商品,定制好具體商品后,用戶只要登錄本系統(tǒng)網(wǎng)站后,就能自動(dòng)查看到定制的商品信息。

      后臺(tái)功能主要有以下4項(xiàng)功能。

      商品信息采集:輸入初始的網(wǎng)址后,網(wǎng)絡(luò)爬蟲(chóng)會(huì)自動(dòng)識(shí)別和下載相應(yīng)的圖片,提取圖片的特征值,由于手機(jī)淘寶網(wǎng)站具有統(tǒng)一的商品設(shè)計(jì)格式,分析該格式,同時(shí)將商品的相應(yīng)信息,如商品標(biāo)題,商品價(jià)格、類型等信息保存到數(shù)據(jù)庫(kù)中,本模塊需要花費(fèi)較長(zhǎng)時(shí)間進(jìn)行采集商品信息。

      商品維護(hù):可以對(duì)商品信息進(jìn)行增刪改查等常規(guī)功能的實(shí)現(xiàn)。

      會(huì)員管理:對(duì)前臺(tái)注冊(cè)的客戶進(jìn)行日常增刪改查等管理。

      商品推送:設(shè)置商品推送后,前臺(tái)登錄的用戶能夠接受到推送的商品信息。

      前臺(tái)主界面如圖3所示:

      圖3 圖片檢索網(wǎng)頁(yè)

      其中對(duì)圖片內(nèi)容的特征值比較的關(guān)鍵代碼如下:protected void ButtonImage_Click(object sender,EventArgs e)

      {

      …….

      if(this.uplPhoto.HasFile==false)

      {

      SmallScript.MessageBox(this,"請(qǐng)選擇圖片!");

      }

      else

      {

      string path=Server.MapPath(@".uploadPhoto");

      dataOperate.UpPhoto(this.uplPhoto,ImageMyPic, path);

      string imgPathAndName=path+uplPhoto.FileName;

      stringfeatureStr=ImageObject.GetImageFeature (imgPathAndName);//得到圖片特征值

      int goodKind=Convert.ToInt32(DropDownListGood-Kind.SelectedValue);

      DataSet ds=Engine.getImageFeatureInfoBygoodkind (goodKind);

      imageFeatureEntity[]imageFeatureEntitys=image-FeatureEntity.DataSetToimageFeatureEntity(ds);//數(shù) 據(jù) 集中的數(shù)據(jù)插入到goodEntity數(shù)組中

      string strIdList="";

      Boolean GoodIdisNull=true;

      foreach(imageFeatureEntity iFE in imageFeatureEntitys)

      {

      float similar=ImageObject.CompreFromFeature(featureStr,iFE.feature);//比較圖片的特征值

      mySimilar=similar;

      if(similar>=0.75)

      {

      GoodIdisNull=false;

      strIdList+=iFE.goodId.ToString()+",";

      }

      }

      if(GoodIdisNull==false)//找到符合條件的圖片

      {

      strIdList=strIdList.Substring(0,strIdList.LastIndexOf (","));

      rs=Engine.getGoodInfoInIdList(strIdList);

      Session.Add("rs",rs);

      lbPageImage.Text="1";

      bindDataListImage();

      Labellbl=(Label)this.DataListImage.Controls[0]. FindControl("lblTotalImage");

      if(lbl!=null)

      {

      lbl.Text="共找到"+rs.Tables[0].Rows.Count.To-String()+"件商品";

      }

      }

      else

      SmallScript.MessageBox(this,"沒(méi)有匹配的商品");

      }

      }3結(jié)束語(yǔ)

      本文介紹的基于圖片內(nèi)容的商品信息檢索系統(tǒng),能夠通過(guò)商品類別和提交要購(gòu)買的商品圖片,根據(jù)商品的內(nèi)容(如商品形狀、顏色)在商品庫(kù)進(jìn)行查找,查找到的商品結(jié)果明顯大幅減少,能更符合用戶的查找要求,能夠提高商品查找的查準(zhǔn)率和查全率。由于對(duì)商品進(jìn)行提取圖像特征要耗費(fèi)大量的時(shí)間,存放海量圖片也要占用大量的存儲(chǔ)空間,服務(wù)器進(jìn)行圖像特征值比較也要占用較長(zhǎng)的時(shí)間,本文所使用的圖片例子大約10 000個(gè),離實(shí)際商業(yè)使用還有差距,隨著技術(shù)的飛速發(fā)展,將來(lái)必能實(shí)現(xiàn)海量圖片內(nèi)容查詢商業(yè)使用。

      [1]竇建軍,文俊,劉重慶.基于顏色直方圖的圖像檢索技術(shù)[J].紅外與激光工程,2005,34(1):84-87.

      [2]周支元,周素萍.一種基于圖像內(nèi)容檢索技術(shù)的數(shù)字視頻水印算法[J].計(jì)算技術(shù)與自動(dòng)化,2011,30(3):100-104.

      [3]王彤,魏成光.數(shù)字圖像信息的組織和檢索[J].情報(bào)科學(xué),2005,23(11):1708-1713.

      [4]周立柱,林玲.聚焦爬蟲(chóng)技術(shù)研究綜述[J].計(jì)算機(jī)應(yīng)用,2005,25(9):1965-1969.

      (責(zé)任編輯:潘修強(qiáng))

      Commodity Information Retrievable System Based On Image Content

      LI Hao-hong
      (College of Information and Communications,Zhejiang Industry&Trade Vocation al College,Wenzhou,325003,China)

      The paper introduces the retrievable algorithm and prototype system based on image content.After users submit image file,the system can abstract the submitted image's key features,then compare them with all image's features in system database, which reduces the retrieval image result set and improves the retrieve all ratio and the retrieve accurate ratio.

      commodity;image;retrieve;.NET Framework

      TP317.4

      A

      1672-0105(2015)03-0046-04

      10.3969/j.issn.1672-0105.2015.04.012

      2015-09-08

      基于圖片內(nèi)容的商品信息檢索系統(tǒng)(X140104)

      黎浩宏,碩士,浙江工貿(mào)職業(yè)技術(shù)學(xué)院副教授,研究方向:數(shù)據(jù)庫(kù)、圖形圖像、計(jì)算機(jī)應(yīng)用等。

      猜你喜歡
      商品信息爬蟲(chóng)特征值
      中國(guó)商品信息服務(wù)平臺(tái)
      商品信息
      軍事文摘(2023年18期)2023-10-31 08:11:40
      利用網(wǎng)絡(luò)爬蟲(chóng)技術(shù)驗(yàn)證房地產(chǎn)灰犀牛之說(shuō)
      一類帶強(qiáng)制位勢(shì)的p-Laplace特征值問(wèn)題
      基于Python的網(wǎng)絡(luò)爬蟲(chóng)和反爬蟲(chóng)技術(shù)研究
      單圈圖關(guān)聯(lián)矩陣的特征值
      備戰(zhàn)雙十一
      利用爬蟲(chóng)技術(shù)的Geo-Gnutel la VANET流量采集
      大數(shù)據(jù)環(huán)境下基于python的網(wǎng)絡(luò)爬蟲(chóng)技術(shù)
      電子制作(2017年9期)2017-04-17 03:00:46
      商品信息標(biāo)準(zhǔn)化助力電子商務(wù)健康發(fā)展
      来凤县| 古交市| 油尖旺区| 乌兰浩特市| 措勤县| 陕西省| 崇义县| 吉隆县| 福清市| 柳江县| 大理市| 绥中县| 兰溪市| 乐陵市| 全州县| 晋宁县| 沁源县| 金乡县| 湘潭市| 资源县| 涿州市| 南投市| 上饶市| 望江县| 岱山县| 册亨县| 禄丰县| 吉林省| 特克斯县| 潞城市| 城固县| 侯马市| 镇远县| 密云县| 新丰县| 保德县| 安龙县| 化隆| 治多县| 萨嘎县| 普安县|