《電子技術(shù)應(yīng)用》
您所在的位置:首頁 > 通信與網(wǎng)絡(luò) > 業(yè)界動態(tài) > Copilot 真會砸了程序員的飯碗?

Copilot 真會砸了程序員的飯碗?

2021-07-16
來源:CSDN
關(guān)鍵詞: Copilot 代碼

  最近OpenAI與GitHub聯(lián)合構(gòu)建的AI自動編程工具Copilot正式登場!Copilot基于自然語言處理模型GPT-3搭建而成,可在程序員編寫代碼時提供建議,甚至直接補齊代碼。

  目前Copilot預(yù)覽版已經(jīng)正式上線Visual Studio Code平臺。雖然Copilot AI碼自動生成器仍在逐漸完善當中,但它的出現(xiàn)卻提供了一個關(guān)于大型自然語言處理模型的發(fā)展思路,也讓我們程序員群體和對于自身未來是否會被AI取代的問題,產(chǎn)生深深的思考。

  初識OpenAI的GPT-3

  在2019年DOTA2的頂級賽事TI8的正賽完成之后,OpenAI的人工智能戰(zhàn)隊與TI8的冠軍OG舉行了一場表演賽,在英雄陣容限定17個,部分道具和功能禁用的前提下,OpenAI以2:0完勝了OG,尤其值得一提的是第二場比賽僅用時15分鐘OpenAI就把OG斬落馬下,這一系列的精彩表現(xiàn)也讓OpenAI在業(yè)界抱得大名。

  后來OpenAI開始轉(zhuǎn)戰(zhàn)自然語言處理領(lǐng)域,他們第一個引發(fā)廣泛關(guān)注的模型是GPT-2。2019年底著名魔幻電視劇集《權(quán)利的游戲》的最后一季上演了史詩級的爛尾,不過網(wǎng)友用GPT-2來重寫劇本而得到的新結(jié)局,卻意外得到了全網(wǎng)的普遍好評,這也讓GPT-2順利出圈。

  去年的六月初,OpenAI發(fā)布了全新一代的NLP模型——GPT-3(論文地址:https://arxiv.org/abs/2005.14165),這個模型的效果之好已經(jīng)到了令人嘆為觀止的程度,在筆者的印象中GPT-3一直在GitHub的趨勢榜的榜首位置上,且一直霸榜了兩個月(https://github.com/openai/gpt-3),一時之間各類GPT-3的神奇應(yīng)用層出不窮。GPT-3的出現(xiàn)再次證明了AI領(lǐng)域大力出奇跡的現(xiàn)象,這個模型的數(shù)據(jù)集達到了45TB,參數(shù)個數(shù)1750億,訓練成本接近500萬美元。

  與之前NLP領(lǐng)域的王者BERT模型不同,GPT-3雖然博采眾長,但從本質(zhì)上講GPT-3還是個自回歸模型,通俗的理解自回歸就是使用自身做回歸變量的過程。比如在見到一個時間序列“我愛北京天安門”,那自回歸模型要完成的任務(wù)就是收到“我愛北京天”這段輸入時,將后面的內(nèi)容補齊。

  假設(shè)我們天、安、門三段日志分別對應(yīng)X_1、X_2、X_3,那么如果我們要建模“天安門”這段主義序列時,就要通過貝葉斯公式解出,在在所有語料信息中,“天安門”這個序列出現(xiàn)的聯(lián)合概率分布 P(X_1,X_2,X_3)。由于這些概率分布彼此之間并不獨立的,我們僅統(tǒng)計P(X_1)、P(X_2)、P(X_3)三個概率是不夠的。因為X_1還依賴于其它變量存在條件分布 P(X_2|X_1) 和 P(X_3|X_1)。對于X_2和X_3也是一樣,我們可以將這三個模型組合起來獲得期望聯(lián)合分布 P(X_1,X_2,X_3)=P(X_1)P(X_2|X_1)P(X_3|X_1,X_2)。在自回歸模型中都考慮了順序信息,也就是說他看到“天安”之后極有可能續(xù)寫出后面的“門”來,這樣的條件概率算法是自回歸模型的基礎(chǔ)。也就是說GPT-3,一旦看到“天安”這個輸入之后,就能判斷出后面是“門”字的概率大幅度增加,因此從原理上看GPT-3的確更適合做文本的生成與續(xù)寫工作。

  誤打誤撞,Copilot成GPT-3的首個商業(yè)應(yīng)用

  在去年GPT-3最火的階段,代碼補全這個應(yīng)用雖然也被業(yè)界關(guān)注,但其熱度根本不夠看,當時像對話機器人、自動診斷、自動作詩、自動作曲的應(yīng)用才是比較吸引眼球的,即使是在編程方面,代碼補全的應(yīng)用也沒有到大放異彩的程度,早在去年7月上線的那個能根據(jù)需求直接生成前端代碼的debuid.co,都曾經(jīng)被認為是AI編程的未來趨勢。

  不過GPT-3的知識儲備雖然豐富,但本質(zhì)上卻還是對以往代碼的模仿,很難有創(chuàng)造性的靈動表現(xiàn),在很多情況下GPT-3無法獨立完成創(chuàng)作。因此與人類程序員配合,由人類程序員完成功能模塊的一部分,再由AI幫助續(xù)寫剩余代碼,似乎成為了一個相當合理的選擇,在這樣的背景下Copilot就應(yīng)運而生了。

  Copilot使用的Codex深度學習模型,就是基于GPT-3的編程任務(wù)微調(diào)版本,它以部分完成的代碼及注釋作為輸入,輸出完整的代碼建議。Copilot的官方網(wǎng)站(https://t.co/eWPueAXTFt?)將其描述為“程序員結(jié)對編程實踐中的AI對手”,筆者看到不少參加初測的網(wǎng)友都提到,很多時候提供函數(shù)簽名,Copilot就可以完成整個函數(shù)的代碼編寫了,有時甚至只需要一個簡單的注釋描述,Copilot就能把整個功能模塊全寫出來。

  神經(jīng)網(wǎng)絡(luò)非常擅長從大型訓練數(shù)據(jù)集中得到有效的發(fā)現(xiàn)與建議,從這個角度來看,使用GPT-3的微調(diào)版本,幫助程序員在GitHub的源代碼庫尋找解決方案的做法,有著非常大的意義。

  前途雖光明,但道路依舊曲折

  根據(jù)GitHub官方說法來看,如果Copilot技術(shù)預(yù)覽成功,Copilot的商業(yè)版本也將很快問世。我們知道目前程序員的時薪很高,一般從10美元到150美元之間,只要能節(jié)省幾個小時的編程時間或稍稍提高一些開發(fā)速度,就能產(chǎn)生不低的效益。尤其是對于一些有著豐富經(jīng)驗的程序員來說,Copilot意味著更加容易的跨界,在它的加持下Rust將不會那么勸退,C++也不會再那么令人愛恨交加。而且Copilot需要定期更新和微調(diào),這對于GitHub這樣的開源公司來說還會帶來持續(xù)性的收入,AI編碼未來很可能會成為一個價值數(shù)十億美元的產(chǎn)業(yè),不過光明的前途不意味著Copilot的發(fā)展將一帆風順,從目前情況來看,其主要問題有以下幾點:

  不分許可證的引用代碼是否涉嫌侵權(quán)?正如前文所說GPT-3能夠成功依靠就是海量的訓練集,根據(jù)Copilot的主頁顯示,Codex的訓練代碼由公開來源的英語注釋及源代碼而來,這其中包括 了GitHub上公共存儲庫中的源代碼及注釋,而有跡象表明Codex用于訓練的代碼,并沒有按照不同的開源許可證進行區(qū)分對待。

  我們知道Copilot未來肯定要有商業(yè)版本推出,那么問題就來了,如果Copilot將那些已經(jīng)明確不允許用于商業(yè)用途的代碼,通通拿來進行AI訓練的話,這種做法是否涉嫌侵權(quán)?針對這個問題網(wǎng)上已經(jīng)有很多不同的聲音了,筆者認為如果AI最終給出的建議代碼與原先訓練集中的代碼一模一樣的話,那么這種情況肯定會涉嫌侵權(quán),但建議代碼與原訓練代碼的相似度如何判斷才是關(guān)鍵所在,當然截止目前這還依舊是個開放性問題,業(yè)界尚未形成共識。

  無效建議拖慢開發(fā)效率:根據(jù)GitHub給出的官方說法Copilot試圖理解程序員的意圖,并盡可能生成最好的代碼,但它建議的代碼可能并不總是有效,甚至沒有意義。也有不少程序員親測后反饋說,如果想提高Copilot建議的正確率,你就必須按照其他程序員那樣,使用一個大眾化的代碼風格以及變量名、函數(shù)名的命名規(guī)范,如果你的代碼規(guī)范和變量命名都特別有個性,那么你得到的建議很可能會是沒有意義的代碼。

  歸根結(jié)底Copilot等模型根本就不理解源代碼的目的和結(jié)構(gòu),更不了解程序運行的目的,他能做的就是高度模仿之前大量存在過的類似代碼,因此他給出的結(jié)果很可能是沒有意義的,如果這些無效建議的比例過高,會使程序員的編程思路混亂,甚至拖慢開發(fā)的節(jié)奏。

  引用老舊類庫,增加安全風險:筆者注意到GitHub還警告說,Copilot可能會建議舊的或者不推薦使用的類庫和代碼,這可能會導(dǎo)致安全問題。正如前文所言,Copilot本質(zhì)上是對歷史上全部代碼的學習與模仿,但是從實操來講,你又很難對如此大量的代碼進行有效標注,因此即便Copilot的建議即使有效而且能夠正常運行,也不能代表這些代碼沒有安全漏洞,這樣的特性就使得開發(fā)人員完全審查AI生成的代碼變得非常重要。

  可以說AI自動化編碼工具的發(fā)展還遠遠沒有達到我們的期望,程序員在使用Copilot時必須時刻小心翼翼,你不能把Copilot這樣的AI自動生成工具當成不會出錯的編程機器。如果由于工期緊迫,而完全依賴Copilot提供代碼,不去進行安全審核的話,那么Copilot帶來的風險很可能比產(chǎn)生的效益還大。

  不過無論如何Copilot前途還是非常光明的,從歷史經(jīng)驗來看,新的編程工具必然帶來新的編程風險。我們必須仔細跟AI自動編程這個新領(lǐng)域的發(fā)展趨勢,才能做到不落后于趨勢,也不引入風險。

  馬超,CSDN博客專家,阿里云MVP、華為云MVP,華為2020年技術(shù)社區(qū)開發(fā)者之星。




電子技術(shù)圖片.png

本站內(nèi)容除特別聲明的原創(chuàng)文章之外,轉(zhuǎn)載內(nèi)容只為傳遞更多信息,并不代表本網(wǎng)站贊同其觀點。轉(zhuǎn)載的所有的文章、圖片、音/視頻文件等資料的版權(quán)歸版權(quán)所有權(quán)人所有。本站采用的非本站原創(chuàng)文章及圖片等內(nèi)容無法一一聯(lián)系確認版權(quán)者。如涉及作品內(nèi)容、版權(quán)和其它問題,請及時通過電子郵件或電話通知我們,以便迅速采取適當措施,避免給雙方造成不必要的經(jīng)濟損失。聯(lián)系電話:010-82306118;郵箱:aet@chinaaet.com。
亚洲一区二区欧美_亚洲丝袜一区_99re亚洲国产精品_日韩亚洲一区二区
99这里只有精品| 午夜精品福利在线观看| 亚洲在线视频| 亚洲第一页中文字幕| 99视频精品全国免费| 一区一区视频| 欧美大尺度在线| 久久久999精品免费| 亚洲男人的天堂在线| 亚洲精品在线一区二区| 久久精品女人| 小辣椒精品导航| 一本久久综合| 亚洲国产女人aaa毛片在线| 国产热re99久久6国产精品| 欧美日韩另类丝袜其他| 免费在线国产精品| 久久久免费观看视频| 午夜亚洲精品| 亚洲一区二区免费| 99精品久久免费看蜜臀剧情介绍| 亚洲电影中文字幕| 午夜久久电影网| 亚洲婷婷综合久久一本伊一区| 亚洲精品一区二区三区蜜桃久| 尤物99国产成人精品视频| 国产一区二区中文字幕免费看| 欧美日韩一级黄| 欧美日本国产| 久久岛国电影| 一区二区三区欧美日韩| 最新69国产成人精品视频免费| 亚洲欧美亚洲| 亚洲第一综合天堂另类专| 好吊色欧美一区二区三区四区| 国产视频欧美| 国产欧美精品在线| 国产精品午夜在线| 国产精品美女| 国产精品视频观看| 久久蜜桃资源一区二区老牛| 久久超碰97中文字幕| 性欧美1819性猛交| 午夜精品在线看| 翔田千里一区二区| 欧美一区午夜视频在线观看| 亚洲美女电影在线| 一片黄亚洲嫩模| 亚洲午夜av电影| 亚洲欧美99| 老色批av在线精品| 久久国产精品网站| 久久亚洲精品一区| 免费亚洲电影在线观看| 欧美黄色一级视频| 欧美日韩视频| 国产精品日韩在线一区| 国产亚洲欧洲| 在线成人www免费观看视频| 亚洲第一毛片| 亚洲精选中文字幕| 亚洲亚洲精品在线观看| 亚洲无线视频| 欧美一级视频免费在线观看| 久久黄色小说| 亚洲美女电影在线| 亚洲专区在线视频| 久久国产精品久久久久久| 久久综合九九| 欧美久色视频| 国产精品美女999| 国产一区二区看久久| 在线看欧美日韩| 亚洲欧洲综合| 亚洲综合欧美| 亚洲国产欧美一区| 一区二区国产精品| 欧美亚洲在线| 久久精品国产第一区二区三区| 美女性感视频久久久| 欧美日韩精品国产| 国产精品午夜国产小视频| 狠狠色丁香婷婷综合影院| 亚洲人永久免费| 亚洲伊人色欲综合网| 亚洲国产成人久久综合一区| 亚洲社区在线观看| 久久久av水蜜桃| 欧美激情一区二区久久久| 国产精品女人久久久久久| 韩国福利一区| 亚洲国产精品成人| 亚洲欧美春色| 亚洲乱码日产精品bd| 一区二区久久久久| 久久精品国产免费| 欧美日韩国产一级片| 国产久一道中文一区| 亚洲第一网站| 一本色道久久综合亚洲精品不| 亚洲欧美成人| 久热re这里精品视频在线6| 国产精品色网| 亚洲精品欧美极品| 亚洲国产裸拍裸体视频在线观看乱了中文| 亚洲欧美在线播放| 欧美视频在线观看视频极品| 91久久精品久久国产性色也91| 欧美一区二区三区精品 | 亚洲五月婷婷| 欧美美女福利视频| 亚洲国产美女| 亚洲人成在线观看| 女生裸体视频一区二区三区| 国产一区日韩欧美| 午夜精品久久久久久久蜜桃app| 亚洲一区免费| 国产精品sss| 一区二区三区国产精品| 一区电影在线观看| 欧美日韩国产首页| 亚洲精品一区二区三区在线观看| 91久久黄色| 欧美阿v一级看视频| 亚洲大胆美女视频| 亚洲精品看片| 欧美激情四色 | 国产精品麻豆va在线播放| 一区二区三区久久精品| 亚洲婷婷在线| 国产精品ⅴa在线观看h| 亚洲天堂免费观看| 性娇小13――14欧美| 国产伦精品一区二区三区视频孕妇| 亚洲午夜在线| 亚洲欧美国产高清va在线播| 国产精品视频久久久| 欧美有码视频| 嫩草影视亚洲| 亚洲理伦在线| 亚洲一区二区三区在线| 国产精品入口66mio| 午夜视频久久久| 久久视频免费观看| 在线免费高清一区二区三区| 99国内精品久久| 欧美日韩一区二区视频在线| 亚洲天堂av在线免费| 久久精品国产亚洲精品| 精品福利免费观看| 亚洲裸体视频| 国产精品免费视频观看| 欧美一区二区大片| 免费在线观看日韩欧美| 99精品福利视频| 欧美一区二区久久久| 一区二区视频欧美| 一本高清dvd不卡在线观看| 欧美丝袜一区二区| 欧美伊人精品成人久久综合97 | 最新高清无码专区| 亚洲男人第一网站| 国产一区二区av| 亚洲久久视频| 国产精品免费观看视频| 亚洲第一网站免费视频| 欧美日韩极品在线观看一区| 亚洲午夜激情网站| 久久午夜av| 一本色道久久综合亚洲二区三区 | 午夜精品久久久久久久| 欧美96在线丨欧| 一区二区三区四区五区在线| 欧美自拍丝袜亚洲| 在线看欧美视频| 亚洲四色影视在线观看| 国产日本亚洲高清| 亚洲日韩欧美一区二区在线| 亚洲国产日韩欧美| 性欧美暴力猛交另类hd| 另类欧美日韩国产在线| aa级大片欧美三级| 欧美在线看片| 亚洲人成啪啪网站| 久久精品1区| 亚洲剧情一区二区| 久久久精品欧美丰满| 亚洲精品影院| 久久久精品网| 一区二区精品在线观看| 久久久久免费| 制服丝袜激情欧洲亚洲| 久久综合久久久| 亚洲小说春色综合另类电影| 美国十次成人| 亚洲免费在线| 欧美精品一区二区三区蜜臀| 久久国产福利国产秒拍| 国产精品乱子乱xxxx| 99精品热视频|