《電子技術應用》
您所在的位置:首頁 > 通信與網絡 > 業界動態 > 九章云極DataCanvas攜兩大開源產品打通中國開源之路

九章云極DataCanvas攜兩大開源產品打通中國開源之路

2021-10-26
來源:CSDN

  擁抱開源生態 賦能數字化轉型

  開源產業近年來在國內取得了世人矚目的成績,中國開發者也從一個開源的使用者,變成了全球主流的開源貢獻者。開源協作創新的開發模式,也成為了推動軟件產業持續創新發展的源泉。毋庸置疑,當前國內開源熱度空前高漲,而開源并不僅僅是“開放源代碼”,政府和企業組織使用開源也不是毫無規章,開源背后涉及的人、社區、管理等因素,都有其自身的規則。而由于國內開源整體起步較晚,政府和企業在采用開源加速創新的同時,也遇到了前所未有的挑戰。

  挑戰主要來源于三個方面,第一,對于政府和傳統型企業而言,要進行數智化轉型升級,打造高效的物聯網數據處理平臺是根基。中國是制造大國,要向智造大國轉型,打造數字化的工業互聯網平臺也是非常關鍵的一部。第二,隨著政府和企業數字化轉型的步伐加快,全球人工智能人才缺口很大,迫切需要推動人工智能教育體系的發展,夯實人工智能發展的基礎。隨著人工智能成為像互聯網一樣的基礎設施進度不斷加快,相關人才需求也勢必成為產業發展的關鍵。第三,數據的正確性和聚集,在數據上同樣會發現面臨的問題,數據量過大難以采集,數據相對分散沒有標準,沒有數據識別,人員協同較復雜等。數據的高效采集和處理是數智化轉型的核心基礎。

  在這種挑戰之下,AI的應用場景卻在不斷增加。現在很多智能化的場景已經走進了生活中,比如人臉識別技術、線下門店、智能家居、智能零售,再進一步像是智慧城市,這些技術的背后都是大量數據的綜合處理與分析。所以政府和企業的數智化轉型,有三個核心點:數據的采集和高效存儲、對實時分析的靈活支持、打造數據平臺底座,為其他系統提供支撐。中國工程院譚建榮院士表示“要掌握核心技術,要掌握高新技術,必須從基礎研究開始。”并在大會中提出,通過:智能制造+創新設計、智能制造+工藝提升、智能制造+強化質量、智能制造和衍生服務、智能制造+拓展市場五大方法將促進實現數字經濟和數字轉型。九章云極DataCanvas 自成立之初就深耕AutoML自動機器學習、AutoDL自動深度學習等自動化技術,堅持自主研發和開源開放,堅持不斷為業界輸出開源技術成多行業場景創新應用,全力帶動數據科學行業發展。“實現AI賦能,拓展無限現象”, DAT 自動機器學習工具包和 DingoDB 實時交互式分析數據庫的發布更堅定了開放開源,拓展 AI 的無限可能。

  應對時代挑戰,DAT和DingoDB的雙核驅動

  數據是新時代的石油,沒有數據智能便無從談起。目前在政府和大多數企業中,數據的價值主要體現在進行粗淺的數據分析,將數據做成包含餅圖、折線圖等的可視化報表,進而指導業務。而隨著政府和企業積累的數據越來越豐富,對數據分析的要求越來越高,過去的數據分析方式已經不能滿足政府和企業的需求。

  九章云極DataCanvas 董事長方磊表示,政府和企業數據的價值正在發生轉變,數據分析進入了“增強分析”階段,即通過機器學習或者人工智能增強數據分析能力。以“硬科技”立身的九章云極DataCanvas將持續在AutoML領域實現技術創新與研發,運用AutoML、AutoDL技術為金融、通信、制造、政府等眾多行業提供專業的技術服務,解決政府和企業在數智化升級中對于實時性的需求。正是在這樣的初心引導下,才有了今天面向自主建模、自動建模的DAT開源產品,以及面向高并發、能夠做實時分析的DingoDB數據庫的開源發布。

  DataCanvas AutoML Toolkit(DAT)

  DataCanvas AutoML Toolkit(DAT)是一個自動機器學習工具套件包,包含了一系列功能強大的 AutoML 開源工具,從底層的通用自動機器學習框架到用于結構化及非結構化領域端到端的自動建模工具。DAT的所有項目都是以開源方式來開發的,目前接收到來自于GitHub社區Star的數量超過2600個,來自于社區的安裝和下載次數超過6萬次。

  整個DAT的工具站,從面向任務來分,同時可以覆蓋結構化、以及非結構化;從面向人群來分,即可以面向于專業的AI從業人員,也可以讓沒有專業AI背景的人員,利用AutoML有相應的工具可以使用,即可以滿足AI使用者的需求,還有面向AutoML工具開發者的相應框架。

  因此,DAT并不是一個面向某一個場景來開發的工具,是希望AutoML能夠面向于不同人群,從不同角度和各個層面全方位地釋放AutoML能力,為用戶來賦能。

  DAT 的工具棧可以分為三層:首先是最底層的 AutoML 框架 Hypernets、機器學習和深度學習框架,中間是 AutoML 工具如 DeepTables、最上層是應用工具:HyperGBM、HyperDT、HyperKeras、Cooka。

  DingoDB

  DingoDB是新一代的實時交互式分析數據庫,能夠提供高并發的數據服務。現在政府和企業的數據架構基本上采用Lambda架構的模式, 它不僅僅是政府和企業主流的數據架構,也是很多互聯網公司主流的一種數據架構,但在許多方面存在潛在的風險和問題:

  (1)數據散列存儲的問題,存在多套存儲引擎,數據的融合會變的非常困難,由此引申出來一個新的領域,多數據庫模式的聯邦查詢。

  (2)數據存儲在多個存儲引擎中,數據的一致性和準確性變的非常困難,存在數據核對和多次矯正的問題。

  (3)高并發的數據服務和及時修改的能力較差,通常會在數據服務層增加各種緩存和KV數據庫來進行服務提速,來提高服務的并發性。

  總而言之,多套存儲引擎、計算引擎以及各種緩存的存在,讓政府和企業的數據平臺架構變的異常復雜,學習和運維的成本變的極高。研發新的數據構架迫在眉睫,因此DingoDB就誕生了。

  這兩款開源產品能夠讓數據分析的過程既快又簡單,幫助更多的非專業的數據科學家也可以使用進行數據的建模和分析。

  面向模型困局,數據側還能做什么

  數據要服務于人工智能的機器學習算法模型,但是在建模過程中“不均衡、概念漂移、泛化能力和大規模數據”這4大難點的呢?DAT針對這些難點做出了如下優化:

  不均衡

  使用降采樣的方法防止主類過擬合,同時通過多種樣本生成的方法去修補小類數據的真實分布,防止小類上面的欠擬合。

  概念漂移

  針對概念漂移的問題,會用一種受生成對抗網絡(GAN)啟發的半監督學習技術“對抗驗證(Adversarial Validation)”的方法,在建模之前就能夠有效的識別哪些特征發生了漂移,然后針對性的做一些處理,這樣就會提高整個模型的線上的一個穩定性,有效防止模型退化問題。

  泛化能力

  對于提升泛化能力,會通過自動特征工程中有針對性的特征篩選,在建模過程中會對一些正則化的參數進行優化,還有通過模型融合Ensemble這樣一系列的組合拳來提高模型整體的泛化能力。并引入了一些半監督的學習技術,像是偽標簽學習,在結構化數據中使用偽標簽學習也是相對比較先進的一種方式。

  大規模數據

  底層的計算引擎和整個的系統架構上用分布式的架構,同時能夠支持基于單機模式的訓練,也可以支持分布式集群的模式來訓練,整個的系統架構可以橫向伸縮,滿足任意量級的數據規模。

  DingoDB借鑒了TP系統和AP系統各自的優點,在存儲海量數據的同時,能夠進行高并發的數據查詢,實時的數據分析。數據從各種類型的渠道導入DingoDB,借助DingoDB的高并發查詢,實時數據分析和多維分析的能力,來支撐政府和企業若干業務應用。

  那相較于獨立的OLTP和OLAP這兩種開源數據產品,DingoDB這類混合型的HASP(Hybrid Serving & Analytical Processing實時分析數據庫)產品有哪些優勢呢?

  行列混合:采用了統一的存儲的設計,支持行存、列存和行列混合的存儲形式。

  標準SQL:支持ANSI SQL 語法,可以和Calcite客戶端、BI報表工具無縫銜接。

  實時高頻更新:Dingo數據庫能夠基于主鍵,實現數據記錄的 Upsert、Delete 操作;同時數據采用多分區副本機制,能夠將 Upsert、Delete 操作轉化為 Key-Value 操作,實現高頻更新。

  對于數據庫產品而言,僅僅做到性能上的出眾是遠遠不夠的,無論開發者看重的上手難度、學習成本,還是政府和企業看重的產品穩定性與業務兼容性,都是很重要的。DingoDB 在解決上述難題的同時,還能夠為政府和企業用戶提供完善的產品技術支持,并基于智能優化器實現交互式分析、高頻點查、修改和刪除操作,多副本機制、存算彈性擴展等創新能力。

  AI產業依然稚嫩,未來生態依舊奔騰

  當前,人工智能在中國市場已經經歷了3到5年的發展,雖然隨著技術創新當今產業已略有變化,但挑戰依然非常突出的,尤其是數據層面。超大預訓練模型,也是我們今年中國市場的特色之一,其解決了當前市場數據資源匱乏的問題,但是在基礎技術層面會存在著模型泛化能力有待提升等問題,模型泛化能力也是AI基礎領域的重要難題。

  藏在挑戰背后的,是機遇。近幾年國家出臺了一系列相關政策指引,激發人工智能產業的創新活力,工作重點面向智能核心基礎、智能公共支撐、智能產品應用等三個重點方向,培育國內具備掌握關鍵核心技術和創新能力的優勢單位,突破國內AI標志化產品。產業智能升級的平臺化落地策略也在加緊落實,將人工智能技術和價值和行業有機結合。對人工智能的發展趨勢,專家做出了研判,AutoML將成為人工智能重要技術趨勢之一。

  站在發展的角度去看當今的中國人工智能生態,“開源開放”已經不是一個全新的概念與名詞,亦不是一項新的技術行動,而中國人工智能領域在世界AI技術發展浪潮裹挾下的大勢所趨。以“自動化、云原生、開源開放”為核心的AI 基礎軟件將推動各行業企業加速數智化升級。CSDN認為,從去年的自動結構化深度學習工具DeepTables、自搜索神經網絡框架Hypernets,到今年的自動機器學習工具套件包DAT與實時交互式分析數據庫DingoDB,兩年間九章云極DataCanvas 在開源開放領域帶給了我們無限的驚喜。未來也將繼續關注九章云極在開源生態領域的最新動向,請拭目以待。




1.png

本站內容除特別聲明的原創文章之外,轉載內容只為傳遞更多信息,并不代表本網站贊同其觀點。轉載的所有的文章、圖片、音/視頻文件等資料的版權歸版權所有權人所有。本站采用的非本站原創文章及圖片等內容無法一一聯系確認版權者。如涉及作品內容、版權和其它問題,請及時通過電子郵件或電話通知我們,以便迅速采取適當措施,避免給雙方造成不必要的經濟損失。聯系電話:010-82306118;郵箱:aet@chinaaet.com。
亚洲一区二区欧美_亚洲丝袜一区_99re亚洲国产精品_日韩亚洲一区二区
欧美在线免费观看视频| 欧美日韩综合一区| 亚洲免费一在线| 一本色道88久久加勒比精品 | 香蕉成人伊视频在线观看| 国产精品99久久久久久人| 日韩图片一区| 亚洲精选视频免费看| 亚洲精品一区二区三区蜜桃久| 亚洲国产91精品在线观看| 在线日韩精品视频| 1024精品一区二区三区| 亚洲国产一区二区三区a毛片 | 亚洲欧美不卡| 欧美一级艳片视频免费观看| 午夜精品美女久久久久av福利| 亚洲欧美日韩综合aⅴ视频| 亚洲欧美一区二区精品久久久| 亚洲欧美一区二区激情| 欧美一区二区三区啪啪| 久久精品视频在线播放| 亚洲青色在线| 一区二区毛片| 亚洲自拍偷拍福利| 久久aⅴ国产欧美74aaa| 久久五月激情| 欧美 日韩 国产 一区| 欧美激情偷拍| 欧美四级在线| 国产欧美在线视频| 黄色成人在线网址| 亚洲福利在线看| 99re热精品| 亚洲欧美另类中文字幕| 欧美在线高清视频| 亚洲精品社区| 亚洲综合成人婷婷小说| 久久成人免费视频| 美女啪啪无遮挡免费久久网站| 欧美国产三级| 国产精品高潮呻吟久久| 国产香蕉97碰碰久久人人| 在线播放亚洲| 一区二区三区国产精品| 欧美亚洲综合网| 亚洲美女中出| 亚洲午夜在线| 久久久久久网| 男人插女人欧美| 欧美性色综合| 激情亚洲一区二区三区四区| 亚洲人精品午夜| 亚洲免费在线精品一区| 亚洲国产成人午夜在线一区| 一区二区三区成人精品| 久久精品国产精品亚洲精品| 欧美激情四色| 国产一区二区三区高清播放| 91久久在线| 性欧美超级视频| 一区二区欧美亚洲| 久久久噜噜噜| 欧美网站在线| 在线看日韩av| 亚洲免费小视频| av成人免费在线| 久久综合成人精品亚洲另类欧美| 欧美色图首页| 1024成人网色www| 亚洲综合99| 一级日韩一区在线观看| 久久综合激情| 国产精品尤物福利片在线观看| 亚洲福利视频在线| 香蕉久久夜色| 亚洲一级二级在线| 欧美91视频| 国产日韩欧美在线播放不卡| av不卡在线观看| 亚洲人线精品午夜| 久久人人爽人人| 国产农村妇女毛片精品久久麻豆| 亚洲精品国久久99热| 久久都是精品| 欧美中文字幕视频| 欧美网站在线| 亚洲九九爱视频| 亚洲精品国偷自产在线99热| 久久精品国语| 国产精品一区一区三区| 99国内精品久久久久久久软件| 亚洲欧洲日韩女同| 久久精品亚洲一区二区| 国产精品久久久一区二区| 亚洲精品网址在线观看| 亚洲国产精品美女| 久久先锋资源| 国产午夜精品福利| 亚洲尤物在线| 亚洲欧美另类中文字幕| 欧美日韩一区精品| 亚洲精品之草原avav久久| 亚洲精品社区| 欧美成在线视频| 亚洲成在线观看| 亚洲清纯自拍| 欧美77777| 亚洲国产mv| 亚洲精品1区2区| 蜜桃久久精品一区二区| 一区二区在线观看视频在线观看| 欧美在线|欧美| 久久精品亚洲| 国内伊人久久久久久网站视频| 亚洲欧美日本在线| 欧美在线播放| 国产一区二区三区视频在线观看| 午夜亚洲性色福利视频| 久久精品国产免费观看| 国产一区二区精品丝袜| 欧美一区网站| 久久一区二区三区av| 一区二区在线视频| 亚洲国产精品传媒在线观看| 久热国产精品| 亚洲国产精品免费| 日韩视频一区| 欧美激情综合五月色丁香小说 | 亚洲女爱视频在线| 久久爱www| 韩国女主播一区二区三区| 久久精品国产综合精品| 蜜臀av性久久久久蜜臀aⅴ四虎| 亚洲大片精品永久免费| 日韩视频三区| 欧美日韩在线视频一区| 一区二区三区蜜桃网| 午夜视频在线观看一区二区三区| 国产精品亚洲人在线观看| 亚洲免费人成在线视频观看| 亚洲经典在线看| 欧美日韩999| 亚洲视频在线观看免费| 欧美在线视频观看| 国模私拍视频一区| 亚洲精品一区二区三区樱花 | 欧美色视频在线| 亚洲主播在线| 久久久亚洲影院你懂的| 在线观看中文字幕不卡| 在线一区二区三区四区| 欧美日韩在线视频一区| 亚洲欧美欧美一区二区三区| 久久野战av| 亚洲日本欧美天堂| 亚洲欧美精品在线观看| 国产综合色精品一区二区三区| 亚洲国产精品毛片| 欧美日韩国产va另类| 亚洲一区二三| 美女尤物久久精品| 日韩视频在线观看| 欧美在线看片| 亚洲国产合集| 午夜精品久久久久久久久久久久| 国产在线高清精品| 亚洲剧情一区二区| 国产精品免费一区豆花| 亚洲第一黄网| 欧美四级在线观看| 亚洲成色精品| 欧美三级在线播放| 欧美一级黄色录像| 欧美精品videossex性护士| 亚洲一区二区三区四区在线观看 | 亚洲国产日韩美| 欧美日韩成人综合天天影院| 亚洲欧美国产精品va在线观看| 久久综合狠狠综合久久综青草| 亚洲另类春色国产| 欧美在线视频全部完| 亚洲人成在线免费观看| 久久精品国产久精国产一老狼 | 亚洲一区二区三区在线看| 免费日韩视频| 亚洲综合不卡| 欧美日韩国产色综合一二三四 | 国产在线精品成人一区二区三区 | 欧美高清在线一区| 亚洲欧美资源在线| 欧美日本国产精品| 久久国产日本精品| 国产精品美女一区二区| 亚洲区第一页| 国产又爽又黄的激情精品视频 | 精品动漫av| 久久99在线观看| 99热这里只有精品8| 另类酷文…触手系列精品集v1小说| 亚洲桃色在线一区|