新智元報(bào)道
(相關(guān)資料圖)
編輯:編輯部
【新智元導(dǎo)讀】谷歌神秘項(xiàng)目Pitchfork曝光!這次,會(huì)有多少碼農(nóng)被迭代?
做一個(gè)程序員,壓力有多大?
反正,最近的一個(gè)傳聞,是讓碼農(nóng)們瑟瑟發(fā)抖。
傳說(shuō)谷歌正在研發(fā)一個(gè)秘密的新項(xiàng)目,教AI寫(xiě)代碼。
據(jù)說(shuō),學(xué)會(huì)之后,AI不僅能寫(xiě)代碼,還會(huì)修復(fù)bug。
寫(xiě)代碼這件事,就應(yīng)該讓代碼自己來(lái)
傳聞,谷歌的這個(gè)秘密項(xiàng)目,會(huì)通過(guò)機(jī)器學(xué)習(xí)訓(xùn)練代碼,讓它們自己編自己,自己修復(fù)bug,還能自己更新。
這個(gè)項(xiàng)目表明,谷歌向生成式人工智能(generational artificial intelligence)更近了一步。
現(xiàn)在的AI,是愈發(fā)無(wú)所不能了。它們可以創(chuàng)建圖像、視頻,還能寫(xiě)代碼。
如果這個(gè)AI再進(jìn)化下去,未來(lái)還需要寫(xiě)代碼的碼農(nóng)嗎?
據(jù)知情人士透露,這個(gè)項(xiàng)目起初是由Alphabet的登月部門——X部門開(kāi)發(fā)的,代號(hào)為Pitchfork。
今年夏天,它被轉(zhuǎn)移到了谷歌實(shí)驗(yàn)室。
眾所周知,谷歌實(shí)驗(yàn)室看重的是「長(zhǎng)期投資」,包括VR和AR項(xiàng)目。
現(xiàn)在,Pitchfork已經(jīng)成為了谷歌實(shí)驗(yàn)室下「AI開(kāi)發(fā)者援助團(tuán)隊(duì)」的一名員工。
根據(jù)內(nèi)部資料,Pitchfork的作用是「教代碼自行編寫(xiě)、自行重寫(xiě)」。
它能夠?qū)W習(xí)不同的編程風(fēng)格,并且根據(jù)這些風(fēng)格寫(xiě)出代碼。
現(xiàn)在,這個(gè)團(tuán)隊(duì)正在探索不同的用例,來(lái)幫助開(kāi)發(fā)者。
一名谷歌員工表示,開(kāi)發(fā)Pitchfork的初衷是希望建立一個(gè)工具,將谷歌的Python代碼庫(kù)更新到新版本。
在不用雇傭多余軟件工程師的情況下,怎么從一個(gè)版本過(guò)渡到下一個(gè)版本呢?
Pitchfork應(yīng)運(yùn)而生。
團(tuán)隊(duì)負(fù)責(zé)人Hatalsky表示,隨著時(shí)間的推移,Pitchfork項(xiàng)目的目標(biāo)逐漸變成了建立一個(gè)通用系統(tǒng)。
從去年年底開(kāi)始,Pitchfor已經(jīng)可以降低for X的成本。
AlphaCode:吊打72%程序員
其實(shí),AI編程這件事,早就不新鮮了。
2022年2月,Alphabet的另一家子公司、谷歌的兄弟公司DeepMind,就推出了一個(gè)名為「AlphaCode」的系統(tǒng),可以使用人工智能生成代碼。
根據(jù)DeepMind的說(shuō)法,AlphaCode可以與人類匹敵。
DeepMind使用編程競(jìng)賽平臺(tái)Codeforces上托管的10個(gè)現(xiàn)有競(jìng)賽來(lái)測(cè)試AlphaCode,總體排名位于前 54.3%,也就是說(shuō)它擊敗了46%的參賽者 。
DeepMind聲稱,在使用編程競(jìng)賽平臺(tái)Codeforces進(jìn)行檢測(cè)時(shí),AlphaCode解決了100萬(wàn)個(gè)樣本中34.2%的問(wèn)題。
另外在過(guò)去6個(gè)月參加過(guò)比賽的用戶中,AlphaCode的數(shù)據(jù)排到了前28%,可以說(shuō)「吊打72%人類程序員」!
當(dāng)時(shí),DeepMind就指出,雖然AlphaCode目前只適用于具有競(jìng)爭(zhēng)性編程領(lǐng)域,但顯然,它未來(lái)的能力絕不會(huì)止步于此。
它為創(chuàng)造某些工具打開(kāi)了大門,而這些工具將使編程變得更容易被人們接受,并且有朝一日可以完全實(shí)現(xiàn)自動(dòng)化。
Copilot:程序員的好幫手
再往前,在2021年,GitHub與OpenAI共同推出了一款A(yù)I編程神器——GitHub Copilot。
輸入代碼時(shí),Copilot會(huì)自動(dòng)提示程序中接下來(lái)可能出現(xiàn)的代碼片段,就像一個(gè)經(jīng)過(guò)訓(xùn)練用Python或JavaScript說(shuō)話的自動(dòng)補(bǔ)全機(jī)器人。
Copilot能夠填充必要的代碼塊,只要它們不是特別復(fù)雜或者特別有創(chuàng)造性,這對(duì)于相當(dāng)于手工勞動(dòng)的編程,可太有用了。
此外,Copilot還優(yōu)化了多名程序員間的線上協(xié)作功能,因此,它是生成式AI早期最成功的項(xiàng)目之一。
2022年6月22日,Copilot正式面向C端上線,定價(jià)10美元/月或100美元/年,并向?qū)W生用戶和流行開(kāi)源項(xiàng)目的維護(hù)者免費(fèi)提供。
現(xiàn)在,成千上萬(wàn)的開(kāi)發(fā)者都在用Copilot。
在十幾種最流行的語(yǔ)言編寫(xiě)代碼中——有高達(dá)40%是依靠它來(lái)生成的。
GitHub預(yù)測(cè),開(kāi)發(fā)人員將在五年內(nèi)使用Copilot編寫(xiě)多達(dá)80%的代碼。
微軟首席技術(shù)官Kevin Scott還表示:「我們確信:GitHub Copilot可以應(yīng)用到數(shù)千種不同類型的工作中。」
不過(guò),因?yàn)樯嫦忧謾?quán),在發(fā)布不到5個(gè)月后,Copilot已經(jīng)被憤怒的程序員一舉告上法庭,索賠90億美元。
Codex:AI實(shí)時(shí)自動(dòng)編程
OpenAI開(kāi)創(chuàng)了文本生成的先河。
從2019年,OpenAI開(kāi)始使用一種名為GPT-2的算法,在業(yè)內(nèi)引發(fā)轟動(dòng);2021年底,OpenAI推出了GPT-2的升級(jí)版GPT-3,可供任何人使用。
GPT-3擁有1750億個(gè)參數(shù),是上一代模型GPT-2的100倍,也一舉將此前同類NLP模型的參數(shù)紀(jì)錄提升了10倍。
在圖像生成領(lǐng)域,OpenAI在2021年1月官宣了DALL-E,它可以為文本提示生成原始圖像。
在2022年4月,DALL-E 2發(fā)布,它能夠渲染更復(fù)雜的圖像。
2021年6月30日,通過(guò)搭載自家的Codex模型,OpenAI與GitHub聯(lián)合發(fā)布了 「AI代碼補(bǔ)全神器」GitHub Copilot。
不過(guò)當(dāng)時(shí),Codex并沒(méi)有透露過(guò)多細(xì)節(jié),始終保持著神秘感。
去年8月10日,OpenAI終于推出了改進(jìn)版本的Codex,還發(fā)布了基于自身API的私測(cè)版。
與之前的版本相比,Codex的改進(jìn)版本不僅可以解讀簡(jiǎn)單的自然語(yǔ)言命令,還可以自動(dòng)創(chuàng)建并完成代碼,更加靈活和先進(jìn)。
例如在OpenAI的太空游戲《space game》中,用戶輸入自然語(yǔ)言命令「Make it be smallish」,Codex系統(tǒng)便會(huì)自動(dòng)生成控制代碼,使圖中飛船的尺寸就縮小。
另外,還有一個(gè)能自己寫(xiě)軟文的神奇工具——Jasper。
「Jasper」是一款A(yù)I內(nèi)容平臺(tái),搭載GPT-3的文本生成技術(shù),可幫助人類突破創(chuàng)意障礙,并以10倍的速度自動(dòng)生成文本供公司使用,用于營(yíng)銷、博客和電子郵件等。
就在10月,Jasper宣布籌集了1.25億美元的資金,目前估值已達(dá)15億美元,并聲稱有望在今年帶來(lái)7500萬(wàn)美元的收入。
從去年到今年,井噴的生成式AI
要說(shuō)現(xiàn)在業(yè)界最火熱的詞匯,「生成性人工智能」肯定是其中之一。
用技術(shù)一點(diǎn)的說(shuō)法,「生成性人工智能」是指無(wú)監(jiān)督和半監(jiān)督的機(jī)器學(xué)習(xí)算法,它使計(jì)算機(jī)能夠使用文本、音頻和視頻文件、圖像甚至代碼,來(lái)創(chuàng)建新內(nèi)容。
AI根據(jù)用戶提示生成的藝術(shù)作品、文本和代碼,一次次讓人類驚艷。
Gartner在「2022 年新興技術(shù)和趨勢(shì)影響雷達(dá)報(bào)告」中,就將生成式AI列為能帶來(lái)生產(chǎn)力革命的技術(shù)之一。
根據(jù)Gartner的預(yù)測(cè),到2025年,生成式AI將生成所有數(shù)據(jù)的10%(現(xiàn)在不到1%),以及面向消費(fèi)者用例的所有測(cè)試數(shù)據(jù)的20%。
并且,到2025年,50%的藥物發(fā)現(xiàn)和開(kāi)發(fā)都會(huì)使用生成式AI。
投資人工智能的大型生物制藥公司
而到2027年,30%的制造商將使用生成式AI來(lái)提高產(chǎn)品開(kāi)發(fā)效率。
現(xiàn)在,生成式AI已經(jīng)引發(fā)了硅谷的「淘金熱」。
風(fēng)投公司紅杉資本就在最近的一篇博文中,闡述了生成人工智能的潛力,涉及語(yǔ)音合成、視頻編輯、生物和化學(xué)等領(lǐng)域。
在文章最后,該公司得出結(jié)論:在未來(lái),所有的圖像,以及一部分文本和算法,都是使用AI生成的。
人類會(huì)因?yàn)锳I而失業(yè)嗎?
可以預(yù)見(jiàn),隨著生成式人工智能井噴,未來(lái)也將有更多、更先進(jìn)的AI編程模型陸續(xù)出現(xiàn),擠壓程序員的生存空間。
那么,人類程序員會(huì)因?yàn)锳I技術(shù)的發(fā)展而失業(yè)嗎?
一個(gè)業(yè)界共識(shí)是:想要取代人類,「AI程序員」們還有許多問(wèn)題需要解決。
這主要體現(xiàn)在「商業(yè)化前景」和「法規(guī)倫理」兩個(gè)方面。
Foundation Capital的合伙人、Jasper的早期投資者Joanne Chen表示,想要將一家生成式AI工具變成一家有價(jià)值的公司仍然很困難。
前不久,「AI編程神器」Kite宣布停止開(kāi)發(fā),運(yùn)營(yíng)僅8年便徹底涼涼。
在發(fā)布于Kite官網(wǎng)的最后一期博客中,創(chuàng)始人Adam Smith表示「我們擁有了50萬(wàn)名月活用戶,但幾乎沒(méi)有產(chǎn)生任何收入。」
他認(rèn)為僅僅使開(kāi)發(fā)人員在編寫(xiě)代碼時(shí)速度提高18%,這對(duì)于他們來(lái)說(shuō)也不夠轟動(dòng),也并不足以使他們花錢購(gòu)買增值服務(wù)。
產(chǎn)品的商業(yè)化前景不夠明晰,這或許也是許多付費(fèi)AI輔助軟件的通病。
「?jìng)惱砼c版權(quán)」則是阻礙生成式AI技術(shù)走入人們生活的另一只攔路虎。
本月早些時(shí)候,GitHub就被提起集體訴訟,指控使用了Copilot工具使用人工智能復(fù)制開(kāi)源代碼,并視軟件隱私于不顧。
一些開(kāi)發(fā)人員也抱怨,Copilot所建議的代碼看起來(lái)像他們自己的工作。
雖然GitHub表示,在極少數(shù)情況下,該工具會(huì)生成復(fù)制的代碼,當(dāng)前版本試圖過(guò)濾和阻止與GitHub公共存儲(chǔ)庫(kù)中現(xiàn)有代碼匹配的建議。但這仍然在一些程序員社區(qū)中產(chǎn)生了相當(dāng)大的焦慮。
Chen還表示,生成式人工智能的熱潮可能意味著監(jiān)管的缺位,并使它們用于「一些令人討厭或危險(xiǎn)的用途」。例如制作傳播錯(cuò)誤信息的視頻等。
因此就谷歌可能推出的Pitchfork來(lái)說(shuō),雖然該項(xiàng)目尚處于早期階段,但仍需要考慮如何訓(xùn)練這些模型的棘手倫理問(wèn)題,例如偏見(jiàn)和潛在的版權(quán)問(wèn)題。
所以,程序員是在自己「殺」自己么?
參考資料:
https://www.deepmind.com/blog/competitive-programming-with-alphacode
https://www.businessinsider.com/google-ai-write-fix-code-developer-assistance-pitchfork-generative-2022-11
關(guān)鍵詞: 谷歌神秘項(xiàng)目曝光能寫(xiě)代碼還會(huì)改Bug的AI 讓碼農(nóng)瑟瑟發(fā)