《電子技術應用》
您所在的位置:首頁 > 通信與網絡 > 設計應用 > 基于Django框架的智能商務監控系統的設計
基于Django框架的智能商務監控系統的設計
2016年微型機與應用第12期
夏志富1,王晗璐1,李玉平1,曹磊2,夏斌1
(1. 上海海事大學 信息工程學院,上海 201306; 2. 同濟大學 電子與信息工程學院,上海 201804)
摘要: 隨著電子商務的迅速發展,商品在電商平臺的排名變化信息愈來愈受到大家的關注。市場上現有的排名查詢工具主要是基于C/S構架,因為電商平臺的變化,需要頻繁更新軟件,使用較為不便。為了方便用戶對商品排名信息的查詢設計出一種基于B/S框架的排名查詢工具。該工具實現了同一商品的多關鍵詞實時排名查詢,并且能夠讓用戶自定義產品監控列表并對列表中的產品排名變化情況進行長期監控。本系統構架采用Django來設計,主要功能采用Python 2.7 語言來開發,云端采用穩定便捷的亞馬遜公司的AWS云計算平臺進行服務器端的部署和搭建,經過上線測試后發現系統達到了良好的效果。
Abstract:
Key words :

  夏志富1,王晗璐1,李玉平1,曹磊2,夏斌1

 ?。?. 上海海事大學 信息工程學院,上海 201306; 2. 同濟大學 電子與信息工程學院,上海 201804)

      摘要:隨著電子商務的迅速發展,商品在電商平臺的排名變化信息愈來愈受到大家的關注。市場上現有的排名查詢工具主要是基于C/S構架,因為電商平臺的變化,需要頻繁更新軟件,使用較為不便。為了方便用戶對商品排名信息的查詢設計出一種基于B/S框架的排名查詢工具。該工具實現了同一商品的多關鍵詞實時排名查詢,并且能夠讓用戶自定義產品監控列表并對列表中的產品排名變化情況進行長期監控。本系統構架采用Django來設計,主要功能采用Python 2.7 語言來開發,云端采用穩定便捷的亞馬遜公司的AWS云計算平臺進行服務器端的部署和搭建,經過上線測試后發現系統達到了良好的效果。

  關鍵詞:電子商務; 爬蟲; 文本相似度; 云計算

0引言

  同濟大學嵌入式系統與服務計算教育部重點實驗室開放課題電子商務的興起促進了跨境貿易的發展,作為當前最流行的跨境電商平臺,阿里巴巴擁有數量龐大的用戶群體,約有40萬家電子商務公司入駐阿里巴巴平臺。平臺上每家公司商品的銷量與其商品在阿里平臺上的排名情況緊密相連。商品排名越靠前,關注度就越高,銷量就會更好。因此提升商品排名是提升銷量的重要手段。

  目前關于阿里國際站的產品排名查詢工具主要有兩類,一類是阿里后臺提供的排名查詢工具,但這個工具只能一次查詢一個關鍵詞,使用起來不太方便而且沒有自定義關鍵詞查詢排名功能。另外一類就是由第三方公司提供的排名查詢工具,但主要是C/S構架,需要安裝客戶端軟件。因為阿里巴巴服務器經常會有變化,所以客戶端軟件也需要經常更新,給用戶使用過程中帶來不便。并且此類軟件不具備長期追蹤產品排名變化的功能,公司不能及時了解自己商品排名變化情況。因此本文設計了一個基于B/S構架的產品排名查詢及監控系統,用戶通過瀏覽器登錄本系統就可以進行商品排名查詢,并且可以長期追蹤商品排名變化情況。

1系統設計

  1.1系統架構

  系統基于Django架構[1]的MVC模式:分為Model層、View層、Control層,將業務邏輯、顯示邏輯和數據邏輯以低耦合、高復用的形式展現出來,便于系統后期的擴展和維護。

  在View層,利用Django自帶的模板系統[2]跟前端開源框架Bootstrap結合,增強用戶的交互體驗和提高前端頁面開發效率。在Model層,系統采用MySQL關系型數據庫,并利用Django的ORM機制將MySQL中的數據以對象接口的方式進行封裝,極大方便了數據的查詢和操作。在Control層,系統控制器通過分析請求、邏輯判斷、模型操作以及重定向視圖等將整個系統業務流串聯起來。系統結構及邏輯流程如圖1所示。

 

001.jpg

  1.2系統功能結構

  該系統功能主要分為三個部分。

 ?。?)顯示邏輯模塊

  系統前端靜態頁面利用前端開源框架Bootstarp實現,里面內置了豐富的CSS樣式庫,可以快遞開發優美的頁面。系統動態頁面采用Javascript開源框架Jquery實現,能夠很方便地操控鼠標點擊事件和后臺數據的異步傳輸。

  (2)業務邏輯模塊

  用戶注冊登錄后輸入商品名稱就可以直接檢索出該商品對應的3個關鍵詞,并可以在下拉框中選擇備選商品,或者刪除備選商品。當用戶輸入商品名發生錯誤時可以通過糾錯機制告知用戶,并利用相似度算法[3]自動從數據庫中匹配出最相近的商品名,減少用戶輸入時間。在批量導入查詢模塊中,用戶可以上傳txt格式的待查詢商品名文件,系統會自動檢索出其排名結果,并以Excel格式供用戶下載查看。在管理產品頁面中,用戶可以添加和刪改監控的商品并觀察商品排名的變化趨勢,可以按時間段選擇商品在指定日期的排名變化情況。

  (3)數據邏輯模塊

  通過后臺Celery定時任務設定閑時爬取數據[4],定期自動地通過多線程并發更新數據,并在后臺服務器計算好商品排名的變化情況,以便用戶可以立即從數據庫中調取數據查看,無需等待時間。

  1.3數據處理流程

  在查詢頁面中進行商品查詢時,如果用戶是首次查詢某個商品則系統進行實時商品排名查詢,并將排名信息存入數據庫。這些信息被保存下來以后,系統后臺設置了每天定時任務,會在設定的時間閑時爬取數據以更新排名和排名變化情況。當用戶輸入以前查詢過的商品名時就可以直接從數據庫中調取其排名和排名變化數據,這樣可以減少服務器在同一時間的壓力,提升系統查詢的響應速度。系統數據處理流程圖如圖2所示。

002.jpg

2系統實現

  2.1獲取數據資源

  網絡爬蟲是獲取數據最快速有效的方法,是構建搜索引擎最重要的組成部分之一,通過對阿里國際站點爬蟲獲取數據是該系統構建的基礎。

  本系統獲取商品數據分為以下流程。

 ?。?)通過用戶輸入的商品名在數據庫中檢索出其對應的關鍵詞,根據其關鍵詞匹配出對應搜索結果的URL列表集合。

  (2)通過Python多線程爬蟲[5]獲取到URL列表集合對應的網頁源代碼,并對每個網頁源代碼打好標記后裝載于queue隊列中,以便后面將數據以原順序展示出來。

  (3)取出queue隊列里的網頁源代碼,并使用Xpath解析工具通過多線程方式去解析網頁源代碼得到商品數據列表,然后通過原先打好的標記對商品數據列表按照原網頁索引排序,最終得到以原順序輸出的商品列表,最后通過列表索引計算排名。

  2.2數據庫設計

  系統中利用Django ORM對象設定表之間的外鍵關聯,建立好數據之間的從屬關系,從而方便通過條件篩選出對應的數據。本系統創建了8個數據表,主要通過loginuser(用戶信息表)和middleuser(查詢圖3系統外鍵關聯表關系圖

  中間鍵表)作為橋梁與其他數據表建立外鍵關聯。通過loginuser表與其他表關聯使得用戶的查詢和數據信息管理可以通過外鍵把數據獨立起來,形成以每個用戶為單元的數據塊,以便于信息的維護和查詢速度的優化。通過middleuser表和其他表的關聯可以使得用戶的下拉輸入框查詢變得容易處理,減少了前端javascript的交互邏輯,并且能夠記錄好用戶備選框中已經添加了但還未得到查詢結圖4系統測試樣例圖果的商品列表,方便用戶下次直接一鍵查詢。

  系統的外鍵關聯表關系圖如圖3所示。

003.jpg

  2.3基于TF-IDF算法的相似度糾錯檢測

  2.3.1TF-IDF算法的原理

  TF-IDF(Term FrequencyInverse Document Frequency)是一種用于信息搜索和信息挖掘的常用加權技術[3]。TFIDF模型的主要思想是:用一個具有很強區分能力的詞w將文章d與其他文章區分開來,該詞必須具備以下條件:在d文章中有很高的出現頻率并且該詞在其他文檔中較少出現。該模型主要包含了兩個因素:

  (1)詞w在文檔d中的詞頻TF(Term Frequency),即詞w在文檔d中出現次數count(w, d)和文檔d中總詞數size(d)的比值:

  tf(w,d)=count(w,d)/size(d)(1)

 ?。?)詞w在整個文檔集合中的逆向文檔頻率idf (Inverse Document Frequency)[6],即文檔總數n與詞w所出現文件數docs(w,D)比值的對數:

  idf=log(n/docs(w,D))(2)

  查詢串q與文檔d的匹配度可以由一個權重表示,該權重是通過tfidf模型為每一個文檔d和由其關鍵詞w[1]…w[k]組成的查詢串q計算出來的:

  tf-idf(q,d)

  =sum{i=1..k/tf-idf(w[i],d)}

  =sum{i=1..k/tf(w[i],d)*idf(w[i])}(3)

  2.3.2相似度檢測的實現

  系統利用Python自然語言處理中的開源框架Gensim可以對文本進行分詞,再對分詞進行向量化處理并自動提取特征,利用這些向量化特征構建TFIDF算法的模型從而計算出兩個文本之間的余弦夾角[7],夾角越小則相似度越高。按照此原理把用戶輸入的商品名與該用戶對應的店鋪所有商品名進行TFIDF算法的相似度對比,對比值放在列表中,取出其最大值,則可得到相似度最大的商品名,實現了用戶的糾錯檢測功能。

3系統測試

  通過上線測試和每天監控商品排名數據的變化情況,發現系統達到了預期效果。后臺定時爬蟲任務的數據能夠保證每天的更新,并且正常穩定運行。數據能夠準確地反映真實商品的排名情況,并且能夠計算出每天的商品排名變化,通過手動方式查詢對比符合真實情況的排名變化結果。系統部分測試效果如圖4所示。

004.jpg

4結論

  通過將商品數據自動抓取下來,并利用Django框架開發出一個智能化的商品排名監控系統,能有效監控商品排名及其變化趨勢,大大節約了眾多店鋪商的手工查詢時間,幫助他們實現更好的收益。本文利用互聯網技術簡化了電子商務平臺上的繁雜性工作,并把相似度算法應用于用戶輸入檢測,便于輸入信息的檢索,實現了商務數據監控的智能化。本系統能夠對境外電商貿易者提供極大的便利,有很強的應用價值。

參考文獻

 ?。?] 柴慶龍, 謝剛, 陳澤華, 等. 基于Django框架的故障診斷和安全評估平臺[J].電子技術應用, 2015,43(4):1921.

  [2] 王曉斌,閆果,基于Django開發的橋梁健康監控數據查詢的Web應用[J].電子技術與軟件工程,2009,24(4):2324.

 ?。?] XU W, CALLISONBURCH C, DOLAN W B. SemEval2015 task 1: Paraphrase and semantic similarity in Twitter (PIT)[C].Proceedings of the 9th International Workshop on Semantic Evaluation (SemEval), 2015.

  [4] DETTINGER R D, KOLZ D P, STEVENS R J, et al. Automated data model extension through data crawler approach[P]. US: US8165989, 2012.

 ?。?] SINGHAL N, DIXIT A, SHARMA A K. Design of a priority based frequency regulated incremental crawler[M]. LAP LAMBERT Academic Publishing, 2014.


此內容為AET網站原創,未經授權禁止轉載。
亚洲一区二区欧美_亚洲丝袜一区_99re亚洲国产精品_日韩亚洲一区二区
一区二区三区欧美在线观看| 日韩一级片网址| 国产自产精品| 欧美日一区二区三区在线观看国产免| 久久精品官网| 亚洲欧美国产三级| 一区二区三区精密机械公司| 亚洲国产成人av| 国产一区二区三区的电影| 国产精品av一区二区| 久久精品国产999大香线蕉| 亚洲永久免费观看| 亚洲高清在线精品| 欧美一区二区精品| 亚洲社区在线观看| 日韩视频在线观看一区二区| 国产精品v日韩精品v欧美精品网站| 午夜精品福利视频| 亚洲视频一区二区在线观看| 亚洲精品人人| 亚洲精品国产精品国自产观看浪潮| 久久se精品一区二区| 亚洲欧美在线网| 亚洲午夜久久久| 一区二区三区精品视频| 国产综合久久久久久| 国产欧美日韩免费看aⅴ视频| 国产精品久久久久久久电影| 亚洲福利视频一区| 国内精品久久久久影院优| 国产精品国产三级国产普通话99| 欧美精品一区在线播放| 欧美高清在线视频| 欧美大片免费观看在线观看网站推荐| 免播放器亚洲一区| 美女视频黄 久久| 女女同性精品视频| 欧美国产精品一区| 欧美—级高清免费播放| 欧美精品videossex性护士| 欧美激情1区2区3区| 玖玖玖国产精品| 老司机免费视频一区二区| 久久久蜜桃一区二区人| 久久久之久亚州精品露出| 久久亚洲美女| 久久精品一区四区| 乱码第一页成人| 免费黄网站欧美| 欧美黄色精品| 欧美日韩综合| 欧美成人国产va精品日本一级| 你懂的网址国产 欧美| 欧美成人久久| 欧美日韩一级片在线观看| 欧美日韩综合在线免费观看| 国产精品美女黄网| 欧美成年人视频网站欧美| 欧美精品久久久久久久| 欧美三区在线| 国产精品免费在线| 国产主播一区二区三区| 影音先锋亚洲电影| 99re8这里有精品热视频免费| 亚洲永久精品国产| 欧美在线播放一区| 亚洲三级性片| 亚洲欧美国产77777| 久久久免费av| 欧美激情一区二区三区| 欧美日韩精品一本二本三本| 国产精品日本一区二区| 国产欧美精品在线观看| 国产精品成人在线| 国产日韩精品电影| 1024成人| 日韩小视频在线观看专区| 在线亚洲自拍| 亚洲成人在线免费| 久久精品国产免费| 亚洲电影av| 亚洲视频在线一区| 久久久水蜜桃av免费网站| 欧美精品网站| 国产伦精品一区二区三区四区免费 | 亚洲免费黄色| 午夜精品久久久久久久久久久久| 久久久久久亚洲精品杨幂换脸| 欧美精品首页| 国产亚洲激情视频在线| 亚洲另类一区二区| 香蕉乱码成人久久天堂爱免费| 久久婷婷av| 欧美三级不卡| 一色屋精品视频在线观看网站| 欧美日韩91| 久久gogo国模裸体人体| 亚洲精品日韩在线| 国产一区二区三区久久久久久久久| 亚洲欧洲日本专区| 午夜亚洲一区| 国产精品区一区二区三区| 欧美精品v国产精品v日韩精品| 国产精品伊人日日| 亚洲精品久久久久久久久久久久久 | 最新日韩中文字幕| 欧美在线观看网址综合| 欧美日韩精品免费| 黄色精品网站| 亚洲午夜久久久| 99精品国产99久久久久久福利| 久久久久久久久岛国免费| 欧美三级欧美一级| 亚洲国语精品自产拍在线观看| 欧美特黄视频| 国产精品网站在线播放| 亚洲黄色影院| 亚洲第一在线| 久久精品亚洲精品| 国产精品一级| 亚洲少妇一区| 亚洲一区二区三| 欧美日韩国产精品一区二区亚洲| 激情亚洲成人| 欧美在线播放高清精品| 先锋影院在线亚洲| 国产精品99免费看 | 欧美中文字幕视频在线观看| 欧美视频在线一区| 亚洲精品无人区| 亚洲精品日韩在线观看| 美女在线一区二区| 狠狠操狠狠色综合网| 午夜国产精品影院在线观看 | 亚洲午夜视频在线观看| 欧美日韩成人一区二区| 黄色成人精品网站| 小嫩嫩精品导航| 欧美一区二区三区在线免费观看| 国产精品chinese| 999在线观看精品免费不卡网站| 亚洲免费精彩视频| 欧美激情中文字幕在线| 亚洲欧洲日产国码二区| 99国产精品久久久久老师| 欧美xx视频| 亚洲黄色免费网站| 日韩手机在线导航| 欧美黄色aaaa| 亚洲日本成人在线观看| 99国内精品久久| 欧美日韩一区不卡| 一本色道久久88综合亚洲精品ⅰ| 亚洲视频中文字幕| 国产精品成人久久久久| 亚洲一区免费看| 欧美一区二区精品久久911| 国产精品午夜电影| 午夜精品三级视频福利| 久久精品论坛| 极品日韩久久| 日韩性生活视频| 欧美性淫爽ww久久久久无| 亚洲影音先锋| 久久久久久免费| 亚洲电影av| 在线性视频日韩欧美| 国产精品mm| 亚洲欧美在线播放| 久久综合伊人77777尤物| 亚洲精品在线观| 久久九九热免费视频| 亚洲精品影院| 久久精品一区蜜桃臀影院| 亚洲精品日韩综合观看成人91| 欧美一区二区精品| 亚洲精品美女在线观看| 久久精品一区二区国产| 日韩视频免费在线| 久热精品在线视频| 亚洲视频电影在线| 欧美成人第一页| 欧美一区二区国产| 欧美日韩三级在线| 亚洲第一区色| 国产精品视频久久久| 亚洲精品乱码久久久久久| 国产精品一二三视频| 亚洲免费观看在线观看| 国产午夜亚洲精品羞羞网站| 中日韩在线视频| 亚洲国产日韩一区二区| 欧美一区日韩一区| av成人毛片| 欧美激情四色| 亚洲国产精品va在线观看黑人 | 日韩午夜精品| 欧美好吊妞视频| 久久精品欧美日韩| 国产日韩一区在线|