《電子技術應用》
您所在的位置:首頁 > 人工智能 > 設計應用 > 從RTL到GDS的功耗優化全流程
從RTL到GDS的功耗優化全流程
2022年電子技術應用第8期
顧東華1,曾智勇1,余金金1,黃徐輝1,朱嘉駿2,何湘君2,陳澤發2
1.燧原科技上海有限公司,上海200000;2.上海楷登電子科技有限公司,上海200000
摘要: 功耗作為大型SoC芯片的性能功耗面積(PPA)三要素之一,已經變得越來越重要。尤其是當主流設計平臺已經發展到了7 nm以下。AI芯片一般會有多個核心并行執行高性能計算任務。這種行為會產生巨大的功耗。因此在AI芯片的設計過程中,功耗優化變得尤為重要。利用一個典型的功耗用例波形或者一組波形,可以從RTL進來開始功耗優化。基本的方式是借助Joules-replay實現基于RTL波形產生相對應的網表波形。在Genus的syn-gen、syn-map、syn-opt三個綜合階段,都可以加入Joules-replay,并且產生和綜合網表相對應的波形,用于Innovus PR階段進一步地進行功耗優化。在Innovus中實現Place和Routing也分為3個階段:place_opt、cts_opt和route_opt。同樣每一步都可以引入Joules-replay來生成功耗優化所需的網表波形。最終在Tempus timing signoff的環境中,再次引入波形進行功耗優化。基于上面的一系列各個節點的精確功耗優化該設計可以獲得10%以上的功耗節省。此時再結合multi-bit技術,最終可以獲得21%的功耗節省。
中圖分類號: TN402
文獻標識碼: A
DOI:10.16157/j.issn.0258-7998.229807
中文引用格式: 顧東華,曾智勇,余金金,等. 從RTL到GDS的功耗優化全流程[J].電子技術應用,2022,48(8):65-69.
英文引用格式: Gu Donghua,Zeng Zhiyong,Yu Jinjin,et al. Fully power optimization flow from RTL to GDS[J]. Application of Electronic Technique,2022,48(8):65-69.
Fully power optimization flow from RTL to GDS
Gu Donghua1,Zeng Zhiyong1,Yu Jinjin1,Huang Xuhui1,Zhu Jiajun2,He Xiangjun2,Chen Zefa2
1.Enflame Technology,Shanghai 200000,China;2.Cadence Design System,Inc.,Shanghai 200000,China
Abstract: Power as one part of PPA(Performance, Power and Area) becomes more and more important in large SoC chips, especially under 7 nm technology. AI chips schedule multi-cores in parallel for specific application scenario, which lead to very large power consumption. Power optimization for each core is highest priority for an AI chip design. With a typical power scenario or multi-scenario grouped together, we can do power optimization from RTL synthesis to GDS. The basic flow is using Joules-replay to convert RTL activity file(time-based formats-VCD/FSDB/SHM/PHY) to gate level activity file. Synthesis with Genus has 3 steps: syn-gen, syn-map and syn-opt, Joules-replay is added after each step, and the replayed activity file will be used in power optimization in next step, which increase power estimation accuracy. Innovus place and route also has 3 main steps: place-opt, CTS-opt and route-opt, same flow with Joules-replay can be involved after each step, and it generates stimulus activity for next step. At final timing signoff stage, we use post-sim activity for power opt in Tempus. With this full flow power optimization flow, we can achieve more than 10% power reduction, combined with MBFF(Multi-Bit Flip-Flop) optimization, we can get 21% power reduction finally.
Key words : power optimization;AI chip design;SoC physical design;Joules-replay;Genus;Innovus

0 引言

    芯片設計一直在追求最好的PPA,在28 nm之前的技術節點上,很多時候更多地優先考慮性能和面積。隨著技術節點向7 nm進化,標準單元的密度不斷提升,隨之而來的功耗密度也越來越大。因此作為PPA之一的功耗在設計中變得尤為重要。設計芯片需要在流程的各個節點盡量對功耗進行精確評估并進行優化,否則最終芯片的性能很可能由于功耗過大而無法充分發揮。




本文詳細內容請下載:http://m.jysgc.com/resource/share/2000004653




作者信息:

顧東華1,曾智勇1,余金金1,黃徐輝1,朱嘉駿2,何湘君2,陳澤發2

(1.燧原科技上海有限公司,上海200000;2.上海楷登電子科技有限公司,上海200000)




wd.jpg

此內容為AET網站原創,未經授權禁止轉載。
主站蜘蛛池模板: 97久久精品无码一区二区天美| 久久久久av综合网成人| 狼人香蕉香蕉在线28-百度| 四虎永久免费网站免费观看| 日韩在线第二页| 国产高清在线观看| jizz国产视频| 怡红院怡春院首页| 久久久久久福利| 日韩一中文字幕| 亚洲AV无码一区二区二三区软件| 欧美日韩国产成人高清视频 | 青青青国产精品国产精品美女| 国产男女猛烈无遮挡免费网站| 91手机视频在线| 在线观看欧洲成人免费视频| xxxx日本在线| 少妇被又大又粗又爽毛片久久黑人| 中文无码字幕中文有码字幕| 日本加勒比一区| 久久国产精品无码一区二区三区| 权明星商标查询| 亚洲va久久久噜噜噜久久天堂| 欧美日韩亚洲国产千人斩| 亚洲深深色噜噜狠狠爱网站| 波多野结衣被躁| 伺候情侣主vk| 秋霞免费理论片在线观看午夜| 午夜免费不卡毛片完整版| 紧扣的星星完整版免费观看| 四虎精品视频在线永久免费观看| 被公侵犯肉体中文字幕| 国产凌凌漆国语| 非洲一区二区三区不卡| 国产在线精品一区二区不卡| 91色视频网站| 国产成人精品免高潮在线观看| 亚洲综合20p| 国产无遮挡色视频免费视频| 欧美人与物videos另| 国产欧美日韩中文久久|