《電子技術(shù)應(yīng)用》
您所在的位置:首頁(yè) > 嵌入式技術(shù) > 設(shè)計(jì)應(yīng)用 > 可重構(gòu)陣列處理器中分布式Cache設(shè)計(jì)
可重構(gòu)陣列處理器中分布式Cache設(shè)計(jì)
2018年電子技術(shù)應(yīng)用第12期
蔣 林1,劉 陽(yáng)2,山 蕊1,劉 鵬1,耿玉榮2
1.西安郵電大學(xué) 電子工程學(xué)院,陜西 西安710121;2.西安郵電大學(xué) 計(jì)算機(jī)學(xué)院,陜西 西安710121
摘要: 隨著片上集成的處理器核數(shù)日益增多,可重構(gòu)陣列處理器中的“存儲(chǔ)墻”問(wèn)題日益加劇,而傳統(tǒng)采用多級(jí)共享Cache硬件設(shè)計(jì)復(fù)雜度高,并行訪問(wèn)度有限,難以滿足可重構(gòu)陣列處理器的訪存需求。設(shè)計(jì)了一種本地優(yōu)先、全局共享的“物理分布、邏輯統(tǒng)一”分布式Cache結(jié)構(gòu),該結(jié)構(gòu)硬件開(kāi)銷小,并行訪問(wèn)性高。通過(guò)Xilinx公司的Virtex-6系列xc6vlx550T開(kāi)發(fā)板對(duì)設(shè)計(jì)進(jìn)行測(cè)試,實(shí)驗(yàn)結(jié)果表明,該結(jié)構(gòu)相比于同類結(jié)構(gòu),平均延遲減少最高達(dá)30%,硬件開(kāi)銷僅為Cache容量的5%,最高可提供10.512 GB/s的訪存帶寬。
中圖分類號(hào): TP302
文獻(xiàn)標(biāo)識(shí)碼: A
DOI:10.16157/j.issn.0258-7998.181095
中文引用格式: 蔣林,劉陽(yáng),山蕊,等. 可重構(gòu)陣列處理器中分布式Cache設(shè)計(jì)[J].電子技術(shù)應(yīng)用,2018,44(12):9-12,16.
英文引用格式: Jiang Lin,Liu Yang,Shan Rui,et al. Design of the distributed Cache for reconfigurable array processor[J]. Application of Electronic Technique,2018,44(12):9-12,16.
Design of the distributed Cache for reconfigurable array processor
Jiang Lin1,Liu Yang2,Shan Rui1,Liu Peng1,Geng Yurong2
1.School of Electronic Engineering,Xi′an University of Posts and Telecommunications,Xi′an 710121,China; 2.School of Computer,Xi′an University of Posts and Telecommunications,Xi′an 710121,China
Abstract: With the increasing number of processor cores integrated on-chip, the problem of “storage walls” in reconfigurable array processors is increasing. Traditionally, the use of multi-level shared Cache hardware design has high complexity and limited parallel access, and it is difficult to meet the memory requirements of reconfigurable array processors. This paper designs a local-priority, global-shared“physical distribution, unified logic” distributed Cache structure. The hardware overhead of this structure is small and parallel access is high. The Xilinx Virtex-6 series xc6vlx550T development board was used to test the design. The experimental results show that the average delay of proposed architecture is reduced by up to 30% compared with the similar structure, and the hardware overhead is only 5% of the Cache capacity. The maximum memory access bandwidth is 10.512 GB/s.
Key words : array processor;reconfigurable;storage structure;distributed Cache;parallelism

0 引言

    隨著電路技術(shù)飛速發(fā)展,人工智能等新應(yīng)用層出不窮,可重構(gòu)陣列處理器[1-2]兼顧通用處理器(General Purpose Processor,GPP)[3]靈活性和專用集成電路(Application Specific Integrated Circuit,ASIC)[4]計(jì)算能力,因而逐漸成為目前密集型應(yīng)用領(lǐng)域的研究熱點(diǎn)??芍貥?gòu)陣列器中海量的訪存數(shù)據(jù)使得目前存儲(chǔ)帶寬嚴(yán)重不足[5],故研究存儲(chǔ)結(jié)構(gòu)解決帶寬嚴(yán)重不足問(wèn)題是提升整個(gè)系統(tǒng)性能的關(guān)鍵。

    為了解決以上問(wèn)題,設(shè)計(jì)人員普遍采用Cache技術(shù),其中文獻(xiàn)[6]中CGRA的硬件平臺(tái)中,存儲(chǔ)結(jié)構(gòu)采用數(shù)據(jù)共享Cache,此結(jié)構(gòu)數(shù)據(jù)并行性差;CONG J等人提出的FPCA結(jié)構(gòu)通過(guò)增加一級(jí)共享Cache的容量來(lái)提高命中率[7],文獻(xiàn)[8]同樣采用片上大容量共享Cache來(lái)進(jìn)行訪存,這種大容量的Cache結(jié)構(gòu)不但使得整個(gè)系統(tǒng)的面積增加且訪存的并行性依舊不高。以上多個(gè)處理器核對(duì)單一Cache空間的共享使得競(jìng)爭(zhēng)突出[9],延遲有所增加。GALANIS M D等人在其提出的可重構(gòu)數(shù)據(jù)通路中,存儲(chǔ)結(jié)構(gòu)采用共享一級(jí)Cache和共享二級(jí)Cache來(lái)提高訪存速度[10];多倫多大學(xué)SWANSON S等人提出的WaveScalar數(shù)據(jù)流結(jié)構(gòu)中,片上存儲(chǔ)單元只采用一級(jí)共享數(shù)據(jù)Cache和指令Cache[11];SOUZA J D等人提出的動(dòng)態(tài)自適應(yīng)處理器中,存儲(chǔ)單元依舊采用兩級(jí)共享Cache來(lái)實(shí)現(xiàn),其中一級(jí)Cache分為數(shù)據(jù)和指令Cache[12]。文獻(xiàn)[13]片上采用分布式buffer設(shè)計(jì)來(lái)提高數(shù)據(jù)存取效率,但是與外存的交互依舊采用共享Cache技術(shù)來(lái)實(shí)現(xiàn)。以上多級(jí)共享Cache的結(jié)構(gòu)沒(méi)有考慮數(shù)據(jù)的局部性特點(diǎn)以及并行性要求,使得訪存的并行性差,吞吐量得到很大的限制。

    針對(duì)可重構(gòu)陣列處理器訪存數(shù)據(jù)量很大、數(shù)據(jù)并行性要求高且數(shù)據(jù)全局重用少、局部性明顯的特點(diǎn),本文提出一種“物理分布、邏輯統(tǒng)一”的分布式Cache結(jié)構(gòu)。其中可重構(gòu)陣列處理器對(duì)本地Cache以及遠(yuǎn)程Cache都具有讀寫訪問(wèn)權(quán)限,本地Cache優(yōu)先級(jí)高,遠(yuǎn)程Cache訪問(wèn)通過(guò)高效的行列交叉開(kāi)關(guān)進(jìn)行目的地索引,在與外存進(jìn)行交互時(shí),設(shè)計(jì)輪詢仲裁機(jī)制仲裁出一路信號(hào)后通過(guò)路由器進(jìn)行數(shù)據(jù)傳輸,最后通過(guò)Xilinx公司的Virtex-6系列xc6vlx550T開(kāi)發(fā)板對(duì)設(shè)計(jì)進(jìn)行測(cè)試,實(shí)驗(yàn)結(jié)果表明,該結(jié)構(gòu)在保持簡(jiǎn)潔性和擴(kuò)展性的同時(shí),最高能夠提供10.512 GB/s的訪存帶寬,滿足可重構(gòu)陣列處理器訪存的需求。

1 可重構(gòu)陣列處理器分布式Cache結(jié)構(gòu)

    本文采用的可重構(gòu)陣列結(jié)構(gòu),是由4×4個(gè)PE組成的一個(gè)陣列處理器簇(Processing Element Group,PEG),每個(gè)PE的訪存數(shù)據(jù)位寬為32位,其分布式Cache結(jié)構(gòu)如圖1所示,由高速緩存器(Cache)、輪詢仲裁器以及網(wǎng)絡(luò)適配器組成。其中每個(gè)PE都有一個(gè)本地Cache,共16個(gè),這16個(gè)Cache結(jié)構(gòu)物理分布、邏輯統(tǒng)一。每個(gè)PE通過(guò)高效的行列交叉開(kāi)關(guān)不僅可以訪問(wèn)本地Cache,也可以對(duì)遠(yuǎn)程Cache進(jìn)行操作。在無(wú)沖突的情況下,當(dāng)PE訪問(wèn)本地Cache時(shí),優(yōu)先級(jí)最高,一旦本地Cache命中,立即將數(shù)據(jù)返回給請(qǐng)求PE,若不命中,則需要通過(guò)輪詢仲裁器仲裁出一路信號(hào)通過(guò)虛通道路由器VCR0901與外存進(jìn)行通信;當(dāng)PE訪問(wèn)遠(yuǎn)程Cache時(shí),需通過(guò)行列交叉開(kāi)關(guān)對(duì)目的PE進(jìn)行索引,從而完成對(duì)遠(yuǎn)程Cache的操作。在本地與遠(yuǎn)程操作沖突的情況下,優(yōu)先進(jìn)行本地訪問(wèn),其次將遠(yuǎn)程請(qǐng)求進(jìn)行正確反饋??芍貥?gòu)陣列處理器的分布Cache結(jié)構(gòu)可使16個(gè)PE同時(shí)對(duì)本地Cache進(jìn)行讀寫操作,在無(wú)沖突訪問(wèn)時(shí),分布式Cache結(jié)構(gòu)的訪存帶寬達(dá)到峰值。

wdz3-t1.gif

1.1 高速緩存器的設(shè)計(jì)

    高速緩存器主要由命中判斷單元(judge)、標(biāo)志寄存單元(tag_index)、狀態(tài)寄存單元(state)、寫替換策略單元(wr_strategy)以及Cache數(shù)據(jù)存儲(chǔ)單元(Cache_data)組成,如圖2所示。

wdz3-t2.gif

    (1)判斷單元:該單元主要用于接受來(lái)自PE的讀寫信號(hào),根據(jù)地址信息讀取標(biāo)志寄存單元的標(biāo)志位信息,然后在判斷單元內(nèi)進(jìn)行比較,輸出讀寫是否命中信息;

    (2)標(biāo)志寄存單元:該單元主要用于寄存數(shù)據(jù)的標(biāo)志位以及索引信息,并根據(jù)Cache數(shù)據(jù)存儲(chǔ)單元的信息進(jìn)行實(shí)時(shí)更新;

    (3)狀態(tài)寄存單元:該單元主要用于寄存數(shù)據(jù)的臟位以及有效位信息,并根據(jù)Cache數(shù)據(jù)存儲(chǔ)單元的信息進(jìn)行實(shí)時(shí)更新;

    (4)寫替換策略單元:該單元采用最近最少用策略提供需替換的Cache行,并根據(jù)狀態(tài)寄存單元信息判讀是否需將數(shù)據(jù)寫回外存;

    (5)Cache數(shù)據(jù)存儲(chǔ)單元:該單元主要采用寫回策略通過(guò)路由與外存進(jìn)行交互。

1.2 輪詢仲裁器的設(shè)計(jì)

    當(dāng)分布式Cache不命中時(shí),發(fā)送讀或?qū)懺L問(wèn)信號(hào)給仲裁器,仲裁器通過(guò)輪詢機(jī)制仲裁出一組信號(hào)輸出給網(wǎng)絡(luò)適配器,輪詢仲裁器的結(jié)構(gòu)圖如圖3所示。

wdz3-t3.gif

1.3 網(wǎng)絡(luò)適配器的設(shè)計(jì)

    網(wǎng)絡(luò)適配器是PE與外存之間通信的網(wǎng)絡(luò)接口,按照路由器格式對(duì)通信信息進(jìn)行打包與解包操作,包格式如圖4所示。

wdz3-t4.gif

    網(wǎng)絡(luò)適配器由寫數(shù)據(jù)模塊以及讀數(shù)據(jù)模塊組成,頂層結(jié)構(gòu)如圖5所示。

wdz3-t5.gif

2 基于分布式Cache的并行訪問(wèn)策略

    對(duì)于可重構(gòu)陣列處理器來(lái)說(shuō),簇內(nèi)的信息交互通過(guò)行列交叉開(kāi)關(guān)來(lái)定位,簇間的信息交互在輪詢仲裁之后通過(guò)路由器來(lái)傳輸。

    PE的讀訪問(wèn)過(guò)程如圖6所示,當(dāng)PE發(fā)出讀請(qǐng)求時(shí),通過(guò)地址信息判斷是否讀本地Cache,其中讀本地Cache優(yōu)先級(jí)最高。若讀遠(yuǎn)程Cache,則通過(guò)行列交叉開(kāi)關(guān)來(lái)定位簇內(nèi)PE的位置;將讀地址與Cache中標(biāo)志位進(jìn)行比較,如果讀命中,則通過(guò)行列交叉開(kāi)關(guān)直接將讀數(shù)據(jù)返回給請(qǐng)求PE;如果讀不命中且命中行無(wú)效,則通過(guò)路由將外存的數(shù)據(jù)塊搬移到Cache中,再進(jìn)行讀數(shù)據(jù)操作;如果讀不命中且命中行有效,則根據(jù)最近最久用替換算法以及寫回策略來(lái)進(jìn)行主存數(shù)據(jù)塊的搬移,最后再通過(guò)交叉開(kāi)關(guān)將讀數(shù)據(jù)返回給請(qǐng)求PE??芍貥?gòu)陣列處理器中16個(gè)PE可同時(shí)對(duì)Cache進(jìn)行以上讀操作。PE的寫訪問(wèn)過(guò)程與讀訪問(wèn)操作類似,如圖7所示。

wdz3-t6.gif

wdz3-t7.gif

3 仿真與性能分析

3.1 設(shè)計(jì)仿真

    基于分布式Cache的訪問(wèn)策略對(duì)高速緩沖單元、輪詢仲裁器以及網(wǎng)絡(luò)適配器進(jìn)行RTL級(jí)設(shè)計(jì),通過(guò)編寫幾種典型訪問(wèn)情況下的測(cè)試激勵(lì),使用Questsim進(jìn)行功能仿真后,與可重構(gòu)陣列處理器虛通道路由器、輕核處理器以及Xilinx定制存儲(chǔ)器IP互連,通過(guò)Xilinx的Virtex-6系列xc6vlx550T開(kāi)發(fā)板對(duì)設(shè)計(jì)進(jìn)行硬件測(cè)試,具體參數(shù)如表1所示。

wdz3-b1.gif

    圖8給出了本地與遠(yuǎn)程訪問(wèn)時(shí)無(wú)沖突下典型情況數(shù)據(jù)訪問(wèn)的最小延遲周期數(shù);圖9給出了本地與遠(yuǎn)程訪問(wèn)沖突時(shí)的典型情況數(shù)據(jù)訪問(wèn)的最小延遲周期數(shù)。

wdz3-t8.gif

wdz3-t9.gif

    從圖8可以看出,在完全沒(méi)有競(jìng)爭(zhēng)的情況下,訪問(wèn)遠(yuǎn)程Cache比本地Cache延遲1個(gè)時(shí)鐘周期數(shù)。由圖9可知,當(dāng)本地與遠(yuǎn)程同時(shí)訪問(wèn)本地Cache時(shí),由于本地Cache優(yōu)先級(jí)高,故先響應(yīng)本地Cache請(qǐng)求,遠(yuǎn)程請(qǐng)求將在延遲4個(gè)時(shí)鐘周期之后進(jìn)行響應(yīng)。

3.2 性能分析

    通過(guò)Xilinx ISE14.7對(duì)設(shè)計(jì)進(jìn)行綜合,器件選用xc6vlx550T綜合后,分布式Cache實(shí)現(xiàn)方案最大工作頻率可以達(dá)到164.249 MHz,具體器件資源占用情況如表2所示。

wdz3-b2.gif

    文獻(xiàn)[14]設(shè)計(jì)了一種共享Cache以及分布式Cache結(jié)構(gòu),并給出了共享Cache和分布式Cache中本地Cache以及遠(yuǎn)程Cache的平均訪問(wèn)延遲,表3是本文與文獻(xiàn)[14]結(jié)構(gòu)的平均訪問(wèn)延遲對(duì)比結(jié)果。

wdz3-b3.gif

    從表3可知,本文最壞情況下(即沖突時(shí)的遠(yuǎn)程訪問(wèn))的平均訪問(wèn)延遲與共享Cache相比,仍舊有所降低;訪問(wèn)本地Cache時(shí),本文的訪問(wèn)延遲稍有增加,是由于在不命中時(shí),路由器的訪問(wèn)延遲較大引起的;在訪問(wèn)遠(yuǎn)程Cache時(shí),平均訪問(wèn)延遲明顯較低,相比于文獻(xiàn)[14]減少了30%。

    本文中分布式Cache的主要硬件開(kāi)銷可通過(guò)(T+S)×N×W×P計(jì)算得到[15],其中,T、S分別表示標(biāo)志位和狀態(tài)位所占的位數(shù);N表示Cache的組數(shù);W表示Cache的相聯(lián)度;P表示處理器核數(shù)。每個(gè)處理器核所對(duì)應(yīng)的Cache的硬件開(kāi)銷按上式計(jì)算為1.6 KB,只占片上Cache容量的5%。

4 結(jié)論

    針對(duì)可重構(gòu)陣列處理器訪存量大以及訪存全局重用少、局部性明顯的特點(diǎn),設(shè)計(jì)并實(shí)現(xiàn)了一種分布式Cache結(jié)構(gòu),其中Cache采用兩路組相聯(lián)的地址映射策略以及最近最少用的替換算法,利用局部高效交叉開(kāi)關(guān)以及路由實(shí)現(xiàn)Cache共享以提高訪存的并行性,減少延遲。通過(guò)Xilinx公司的FPGA開(kāi)發(fā)板進(jìn)行驗(yàn)證,實(shí)驗(yàn)結(jié)果表明,在無(wú)沖突情況下,16個(gè)PE同時(shí)發(fā)送讀寫請(qǐng)求,此時(shí)帶寬達(dá)到峰值10.512 GB/s,硬件開(kāi)銷很小,僅為片上Cache容量的5%,在滿足可重構(gòu)陣列處理器訪存要求的同時(shí),保證了結(jié)構(gòu)的可擴(kuò)展性。

參考文獻(xiàn)

[1] 魏少軍,劉雷波,尹首一.可重構(gòu)計(jì)算處理器技術(shù)[J].中國(guó)科學(xué):信息科學(xué),2012(12):1559-1576.

[2] 周理.高效可重構(gòu)陣列計(jì)算:體系結(jié)構(gòu),設(shè)計(jì)方法與程序映射技術(shù)研究[D].長(zhǎng)沙:國(guó)防科學(xué)技術(shù)大學(xué),2014.

[3] SCHMIDHUBER J.Deep learning in neural networks:an overview.[J].Neural Networks the Official Journal of the International Neural Network Society,2014,61:85.

[4] HAN X,ZHOU D,WANG S,et al.CNN-MERP:An FPGA-based memory-efficient reconfigurable processor for forward and backward propagation of convolutional neural networks[C].IEEE,International Conference on Computer Design.IEEE,2016:320-327.

[5] ROMANOV A Y,ROMANOVA I I.Use of irregular topologies for the synthesis of networks-on-chip[C].IEEE,International Conference on Electronics and Nanotechnology.IEEE,2011:445-449.

[6] YIN S,YAO X,LIU D,et al.Memory-aware loop mapping on coarse-grained reconfigurable architectures[J].IEEE Transactions on Very Large Scale Integration Systems,2016,24(5):1895-1908.

[7] CONG J,HUANG H,MA C,et al.A fully pipelined and dynamically composable architecture of CGRA[C].IEEE,International Symposium on Field-ProgrammableCustom Computing Machines.IEEE,2014:9-16.

[8] LIANG S,YIN S,LIU L,et al.A coarse-grained reconfig-urable architecture for compute-intensive mapreduce acceleration[J].IEEE Computer Architecture Letters,2016,PP(99):1-1.

[9] 李崇民,王海,李兆麟.CMP中Cache一致性協(xié)議的驗(yàn)證[J].電子技術(shù)應(yīng)用,2005,31(12):1-4.

[10] GALANIS M D,THEODORIDIS G,TRAGOUDAS S,et al.A reconfigurable coarse-graindata-pathfor accelerating computational intensive kernels[J].Journal of Circuits Systems & Computers,2005,14(4):877-893.

[11] SWANSON S,SCHWERIN A,MERCALDI M,et al.The wave scalararchitecture[J].ACM Transactions on Computer Systems,2007,25(2):1-54.

[12] SOUZA J D,CARRO L,RUTZIG M B,et al.A reconfig-urable heterogeneous multicore with a homogeneous ISA[C].Design,Automation & Test in Europe Conference & Exhibition.IEEE,2016:1598-1603.

[13] DU Z,LIU S,F(xiàn)ASTHUBER R,et al.An accelerator for high efficient vision processing[J].IEEE Transactions on Computer-Aided Design of Integrated Circuits and Systems,2017,36(2):227-240.

[14] BECKMANN B M,MARTY M R,WOOD D A.ASR:adaptive selective replication for CMP Caches[C].IEEE/ACM International Symposium on Microarchitecture.IEEE Computer Society,2006:443-454.

[15] 趙小雨,吳俊敏,隋秀峰,等.CMP中基于目錄的協(xié)作Cache設(shè)計(jì)方案[J].計(jì)算機(jī)工程,2010,36(21):283-285.



作者信息:

蔣  林1,劉  陽(yáng)2,山  蕊1,劉  鵬1,耿玉榮2

(1.西安郵電大學(xué) 電子工程學(xué)院,陜西 西安710121;2.西安郵電大學(xué) 計(jì)算機(jī)學(xué)院,陜西 西安710121)

此內(nèi)容為AET網(wǎng)站原創(chuàng),未經(jīng)授權(quán)禁止轉(zhuǎn)載。
亚洲一区二区欧美_亚洲丝袜一区_99re亚洲国产精品_日韩亚洲一区二区
亚洲午夜国产一区99re久久| 欧美国产在线电影| 亚洲国产精品久久久久秋霞不卡| 一区二区三区精品国产| 91久久精品国产91久久| 在线观看欧美一区| 国际精品欧美精品| 国产麻豆9l精品三级站| 国产精品亚洲综合天堂夜夜 | 久久精品亚洲一区二区三区浴池| 亚洲欧美视频一区| 亚洲免费在线视频一区 二区| 亚洲少妇在线| 亚洲视频在线观看视频| a4yy欧美一区二区三区| 夜夜嗨av一区二区三区四区| 亚洲毛片一区二区| 一区二区三区四区五区精品| 一二三四社区欧美黄| 一本久久知道综合久久| 在线亚洲一区观看| 亚洲综合色噜噜狠狠| 午夜精品福利一区二区蜜股av| 亚洲欧美中文日韩v在线观看| 亚洲欧美大片| 久久成人免费| 久久青青草原一区二区| 蜜桃精品久久久久久久免费影院| 裸体女人亚洲精品一区| 欧美成人网在线| 欧美另类专区| 国产精品久久福利| 国产精品一区二区在线观看| 国产精品男女猛烈高潮激情| 国产嫩草一区二区三区在线观看 | 亚洲精品久久久一区二区三区| 亚洲精品久久久久久下一站| 一区二区三区四区五区视频| 午夜精品久久久99热福利| 欧美在线视频日韩| 米奇777超碰欧美日韩亚洲| 欧美日韩xxxxx| 国产精品视频一区二区三区| 国产一区自拍视频| 亚洲国产欧美精品| 一本色道久久综合狠狠躁篇的优点| 一区二区三区欧美视频| 午夜老司机精品| 亚洲黄色在线看| 亚洲在线一区| 裸体一区二区三区| 国产精品v片在线观看不卡| 国产亚洲永久域名| 亚洲人成人一区二区三区| 中文一区二区在线观看| 性欧美暴力猛交另类hd| 亚洲人成毛片在线播放女女| 亚洲网站视频福利| 久久久久国产精品厨房| 欧美精品网站| 国产亚洲一区二区三区在线观看| 亚洲三级网站| 午夜欧美大尺度福利影院在线看 | 欧美激情一区二区三区高清视频| 欧美午夜寂寞影院| 国外成人性视频| 亚洲乱码国产乱码精品精98午夜| 亚洲欧美日韩一区在线观看| 亚洲人成在线观看一区二区| 亚洲欧美日韩国产一区| 免费观看欧美在线视频的网站| 欧美午夜大胆人体| 精品不卡一区二区三区| 国产精品99久久久久久久vr| 亚洲成人在线视频播放| 亚洲一品av免费观看| 久久综合色8888| 国产精品毛片va一区二区三区 | 91久久精品久久国产性色也91| 亚洲一区二区在线免费观看| 亚洲日本欧美| 久久精品视频在线播放| 欧美日韩国产色视频| 国内成+人亚洲+欧美+综合在线| 99av国产精品欲麻豆| 久久精品五月| 久久国产精品免费一区| 欧美午夜激情小视频| 一区二区在线视频| 欧美亚洲一区二区在线| 亚洲一二三区视频在线观看| 欧美电影免费观看高清完整版| 国产一区二区三区av电影 | 国产精品久久久久9999高清| 亚洲国产精品电影在线观看| 欧美在线3区| 亚洲欧美在线播放| 欧美日韩在线一区二区| 91久久线看在观草草青青| 久久精品卡一| 久久av红桃一区二区小说| 欧美午夜免费影院| 91久久精品www人人做人人爽| 亚洲二区免费| 久久精品一二三| 国产欧美日韩不卡| 亚洲一区3d动漫同人无遮挡| 一区二区三区精密机械公司| 欧美二区在线| 伊人影院久久| 亚洲高清不卡av| 久久免费精品日本久久中文字幕| 国产麻豆91精品| 午夜一区二区三区在线观看| 午夜精品剧场| 国产精品一区二区三区乱码| 亚洲一区二区视频在线| 亚洲欧美日韩一区在线| 国产精品久久看| 亚洲午夜一区二区| 亚洲自拍偷拍福利| 国产精品久久久久毛片大屁完整版 | 模特精品在线| 亚洲国产精品一区二区第四页av| 亚洲国产婷婷综合在线精品| 另类激情亚洲| 亚洲高清视频一区| 日韩视频一区二区在线观看| 欧美日本一区二区高清播放视频| 亚洲精品乱码久久久久久蜜桃91 | 欧美看片网站| 亚洲美女网站| 亚洲伊人网站| 国产精品久久久久久久久久免费 | 亚洲区中文字幕| 一本不卡影院| 欧美日韩国产一区二区三区地区| 亚洲精品在线电影| 亚洲香蕉视频| 国产日韩av高清| 久久av一区二区| 欧美aa国产视频| 日韩午夜精品视频| 亚洲欧美日韩国产一区二区三区 | 亚洲人成在线播放| 欧美日韩另类一区| 亚洲特级毛片| 欧美在线资源| 黑人巨大精品欧美一区二区 | 欧美成人嫩草网站| 日韩视频免费在线观看| 亚洲欧美日韩精品久久久久| 国产日韩在线看片| 亚洲高清久久久| 欧美精品三级| 亚洲一区二区四区| 另类专区欧美制服同性| 亚洲精品欧美极品| 午夜精品福利在线观看| 狠狠色噜噜狠狠狠狠色吗综合| 亚洲欧洲一区二区在线播放| 欧美日韩视频第一区| 欧美亚洲一区| 欧美女同视频| 亚洲欧美精品伊人久久| 快she精品国产999| 99国产麻豆精品| 久久免费视频一区| 亚洲乱码国产乱码精品精天堂 | 国产欧美丝祙| 亚洲国内在线| 欧美性猛交xxxx免费看久久久| 午夜一区二区三区不卡视频| 欧美大学生性色视频| 亚洲午夜国产成人av电影男同| 久久男人av资源网站| 亚洲美女精品成人在线视频| 欧美一区二区在线免费播放| 亚洲激情成人| 久久精品人人爽| 99视频一区| 久久综合九色综合欧美就去吻| 日韩亚洲成人av在线| 久久久久久久综合色一本| 亚洲精品欧美| 久久一区二区视频| 亚洲无限av看| 欧美sm视频| 亚洲综合色激情五月| 欧美肥婆在线| 欧美一区二区三区视频在线 | 中文在线资源观看视频网站免费不卡| 久久婷婷人人澡人人喊人人爽| 日韩午夜视频在线观看| 老司机精品导航| 亚洲欧美韩国| 欧美日韩免费一区二区三区视频 | 浪潮色综合久久天堂| 亚洲欧美日韩一区二区| 欧美日韩亚洲视频一区|