亚洲图片你懂的_亚洲精品一卡二卡_av伦理在线_日韩一二三区_不卡av在线免费观看_久久久精品日韩欧美_欧美色偷偷大香_免费av片风间由美在线

您當前的位置: 首頁 > 新聞 > 其他

最強AI程序員砸飯碗:84秒跑通代碼 像人一樣思考

來源:量子位   編輯:非小米 時間:2024-08-13 15:30人閱讀

繼Devin之后,又一個AI軟件工程師被刷屏了——

它叫Genie,號稱目前地表最強,已經可以像人一樣思考和行動了!

最強AI程序員砸飯碗:84秒跑通代碼 像人一樣思考

那么這個“地表最強”,到底強到什么程度?

先來看下評測分數(shù)。

在權威榜單SWE-Bench中,Genie以解決了30.07%問題的成績奪得榜首。

(SWE-Bench是一個用來評估大模型解決現(xiàn)實中軟件問題的基準。)

而這個成績可謂是遙遙領先第二名19.27%,解鎖了提升SOTA的最大增幅——57%!

最強AI程序員砸飯碗:84秒跑通代碼 像人一樣思考

至于Genie的實際效果,用團隊的話來說就是:

它可以做到像人類工程師一樣解決現(xiàn)實生活中的軟件問題。

首先,你可以用4種方式讓Genie開始工作,分別是提示詞、GitHub Issue、Linear Ticket或者API。

最強AI程序員砸飯碗:84秒跑通代碼 像人一樣思考

以解決GitHub Issue為例,先喂給Genie一個repo的鏈接,它就開始自動解析問題了:

最強AI程序員砸飯碗:84秒跑通代碼 像人一樣思考

Genie會自動迭代思考如果想要解決這個問題它都需要哪些文件,直到它覺得找到了自己滿意的為止:

最強AI程序員砸飯碗:84秒跑通代碼 像人一樣思考

緊接著,它將對問題做一個自動迭代分析的過程:

最強AI程序員砸飯碗:84秒跑通代碼 像人一樣思考

然后Genie就開始“唰唰唰”地自動寫+跑代碼了:

最強AI程序員砸飯碗:84秒跑通代碼 像人一樣思考

最強AI程序員砸飯碗:84秒跑通代碼 像人一樣思考

如果運行代碼過程中出現(xiàn)bug,Genie會只針對出問題的地方再重復分析、寫代碼和運行的過程,直至跑通為止。

而整個過程,僅僅耗時84秒!

最強AI程序員砸飯碗:84秒跑通代碼 像人一樣思考

用團隊的話來說:

Genie已經觀察并學習人類程序員如何解決軟件問題的次數(shù)達到了數(shù)百萬次。

這是任何一個人類程序員一輩子都無法達到的數(shù)量。

最強AI程序員砸飯碗:84秒跑通代碼 像人一樣思考

但更令人意想不到的是,Genie背后的團隊——Cosine,才僅僅5人。

而且CEO Alistair還發(fā)文感謝OpenAI:

沒有你們,我們做不出來Genie。

最強AI程序員砸飯碗:84秒跑通代碼 像人一樣思考

那么Cosine團隊,究竟是如何打造Genie的呢。

最強AI工程師是如何煉成的?

Genie的主要特點,是能夠模仿人類工程師的認知過程、邏輯和工作流。

為做到這一點,Genie團隊透露過去一年收集了一個包含真實人類程序員開發(fā)活動的數(shù)據(jù)集。

其中不僅使用了成果分析、靜態(tài)分析、自我對弈、逐步驗證等方法,還用到了基于大量標記數(shù)據(jù)訓練的AI模型。好處是,當基礎模型能力提升時,它們能夠提取的數(shù)據(jù)質量也會相應提高。

最終Genie使用該專有數(shù)據(jù)進行訓練。

數(shù)據(jù)集中編碼了人類推理的完整過程,包括完美的信息溯源、增量知識發(fā)現(xiàn),還有基于軟件工程師實際工作案例的逐步決策過程。

Genie的推理過程包括規(guī)劃、檢索、代碼編寫和代碼運行四個主要步驟,突破了其它AI工程師依靠在基礎模型之上添加網頁瀏覽器、代碼解釋器等額外工具的限制,能夠像人一樣處理多樣化的、高度情境的、前所未見的問題。

最強AI程序員砸飯碗:84秒跑通代碼 像人一樣思考

這種訓練方法,讓網友們立刻想到,之前Karpathy也提出的類似想法:

對于LLM來說,理想的訓練數(shù)據(jù)并不是你所寫的內容本身,而是你在寫作過程中的完整思考過程和每一個編輯動作。然而,我們只能盡力利用現(xiàn)有的資源。

最強AI程序員砸飯碗:84秒跑通代碼 像人一樣思考

除此之外,Genie訓練中還引入了自我改進機制。

初始訓練數(shù)據(jù)多為可正常運行的沒有錯誤的代碼,導致Genie導致難以應對錯誤情況。為解決這個問題,團隊使用初代版本的Genie生成包含錯誤的合成數(shù)據(jù),然后用這些數(shù)據(jù)訓練下一版模型。

具體來說,使用舊版本Genie提出解決方案,如果解決方案錯誤,就利用掌握的任務最終狀態(tài)來教它從當前狀態(tài)達到正確狀態(tài)。

不斷重復這一過程,Genie提出的初始解決方案逐漸變得更準確,在多數(shù)情況下能直接給出正確答案,即使出錯也只需在數(shù)據(jù)集中作較少的修正。

Genie能力提升的另一大關鍵,在于OpenAI提供的大模型支持。

團隊表示,最初開發(fā)Genie時,只能訪問微調16-32k范圍內的短上下文模型,他們用這些模型進行了大量早期開發(fā),用超1億token的數(shù)據(jù)訓練模型,雖然發(fā)現(xiàn)設計的架構有一定優(yōu)勢,但從根本上受限于模型在特定時間內可以處理的信息量。

嘗試了各種壓縮/分塊方法后,唯一的解決方法就是使用更大上下文的模型。

OpenAI提供了長上下文模型支持,最新版本的Genie經過了數(shù)十億token的數(shù)據(jù)訓練。

團隊認為,相比超參數(shù)調整和數(shù)據(jù)量,數(shù)據(jù)的質量才是關鍵。因此他們還在數(shù)據(jù)混合方面進行了大量實驗,包括語言、任務類型、任務長度等多個維度,以下是訓練Genie的不同編程語言數(shù)據(jù)的占比:

最強AI程序員砸飯碗:84秒跑通代碼 像人一樣思考

還有不同類型實例的數(shù)據(jù)占比:

最強AI程序員砸飯碗:84秒跑通代碼 像人一樣思考

只有5個人的團隊

正如我們在上文提到的,Cosine這個初創(chuàng)團隊人數(shù)目前僅僅為5人。

在官網的介紹中,他們也非常直接的將自己形容為:

Small but mighty.雖小但有力。

最強AI程序員砸飯碗:84秒跑通代碼 像人一樣思考

從介紹來看,成員有的是從獨角獸企業(yè)出身,有的擁有管理全球團隊的經驗,甚至還有從8歲就開始編程的。

但Cosine最初成立之際是僅有3人,他們的目標是想把人類推理這件事兒給搞明白。

最強AI程序員砸飯碗:84秒跑通代碼 像人一樣思考

值得一提的是,團隊成員中還有一位是華人,Yang Li,是Cosine的聯(lián)合創(chuàng)始人,在2021年登上過福布斯30 under 30。

最強AI程序員砸飯碗:84秒跑通代碼 像人一樣思考

除此之外,對于Genie本身,CEO Alistair還表示:

早在2022年我們就開始構想Genie了,但當時從技術角度來說是不可行的。

直到過去半年多來,隨著大模型的逐步成熟,Genie才能走入現(xiàn)實。

最強AI程序員砸飯碗:84秒跑通代碼 像人一樣思考

嗯,不得不說,大模型又立功了。

Genie目前是可以申請Waitlist了,感興趣的小伙伴可以戳文末鏈接~

Waitlist地址:https://cosine.sh/register

參考鏈接:[1]https://x.com/alistairpullen/status/1822981361608888619?s=46[2]https://cosine.sh/blog/genie-technical-report[3]https://cosine.sh/blog/state-of-the-art[4]https://x.com/AlistairPullen/status/1823030874579120223[5]https://x.com/yangli_

本站所有文章、數(shù)據(jù)、圖片均來自互聯(lián)網,一切版權均歸源網站或源作者所有。

如果侵犯了你的權益請來信告知我們刪除。郵箱:business@qudong.com

標簽: 程序員 代碼

相關文章

伊人网站在线| 亚洲一区自拍| 3d性欧美动漫精品xxxx软件| 久久bbxx| 天堂√中文最新版在线| 久久青草免费| 精品一级毛片| 真实原创一区二区影院| 亚洲看片一区| 懂色av一区二区三区免费观看| 91丨九色porny丨蝌蚪| 一区二区三区中文字幕电影 | 永久av在线| 99久久精品一区二区成人| 九九九精品视频| 欧美99在线视频观看| 国模大尺度一区二区三区| 国产精品天干天干在线综合| 色婷婷精品大视频在线蜜桃视频| 精品久久久久久久久久久久久久久久久 | 日韩精品99| 影音先锋日韩在线| 91麻豆免费视频| 欧美午夜片在线看| 在线免费中文字幕| 国产精品一区二区日韩| 啪啪激情综合网| 性欧美精品高清| 亚洲午夜一二三区视频| 在线国产福利| 国产69精品久久久久9999人| 亚洲国内欧美| 亚洲亚洲精品在线观看| www.三区| 99ri日韩精品视频| 国产在线观看免费一区| 欧美性jizz18性欧美| 亚洲欧美日韩天堂一区二区| 国产蜜臀av在线播放| 91综合网人人| 一区二区高清视频在线观看| 日本中文视频| 午夜先锋成人动漫在线| 99国产精品久| 日韩高清免费观看| 韩日精品一区| 日韩中文字幕一区二区三区| 欧洲中文字幕精品| 蜜桃视频在线观看播放| 在线一区欧美| 一区二区三区中文字幕精品精品 | 欧美大电影免费观看| 亚洲大片在线| 91精品欧美综合在线观看最新| av片在线观看网站| 激情综合电影网| 欧美日韩性生活| av在线国产精品| 欧美极品美女视频| 亚洲综合在线一区| 亚洲成人三区| 欧美日韩精品一二三区| 91成人抖音| 91日韩一区二区三区| 久久精品国产亚洲a∨麻豆| 一区三区在线欧| 欧美无砖砖区免费| 国产丝袜在线播放| 91在线看国产| 在线一区二区三区精品| 亚洲二区精品| 日韩午夜精品视频| 日本一本不卡| 欧美日韩国产不卡| 精品视频在线播放一区二区三区 | 免费福利在线观看| 美日韩一区二区| 麻豆影视在线观看| 欧美**vk| 日韩国产欧美精品一区二区三区| 天天精品视频| 欧美成人高清电影在线| 欧美精品一区二区三区精品| 欧美性精品220| 91精品在线免费视频| 高跟丝袜一区二区三区| 日韩国产在线不卡视频| 欧美日韩午夜精品| 国产精品18hdxxxⅹ在线| 91精品国产美女浴室洗澡无遮挡| 欧美美女在线| 日韩av在线免费观看一区| 蜜桃伊人久久| 亚洲日韩欧美视频| 成人国产精品免费| 久久青草视频| 欧美性猛xxx| 国产精品中文| 亚洲的天堂在线中文字幕| 亚洲激情五月| 四虎精品成人影院观看地址| 成人丝袜18视频在线观看| 九色porny自拍视频在线观看 | 亚洲精品电影| 在线视频三级| 亚洲精品少妇30p| 91青青国产在线观看精品| 亚洲免费av片| 91视频一区二区三区| av不卡一区| 伊人久久青青草| 亚洲激情五月婷婷| 午夜久久一区| 乱人伦视频在线| 午夜精品久久久久久久| 亚洲伦伦在线| 变态调教一区二区三区| 一本大道久久a久久综合婷婷| 你懂的成人av| 欧美办公室脚交xxxx| 欧美高清视频不卡网| 久久精品二区三区| 性欧美1819sex性高清| 日韩国产在线播放| 亚洲午夜久久久久久久久电影网| 奇米狠狠一区二区三区| 成人在线app| 香蕉成人伊视频在线观看| 免费高清在线一区| 成人线上播放| 性欧美高清come| 日韩精品在线播放| 亚洲综合在线五月| 国产成人亚洲精品狼色在线| 久久91成人| 国产盗摄——sm在线视频| 国产女主播在线| 亚洲精品视频一区二区| av3级在线| 好吊妞这里只有精品| 91久久精品网| 中文字幕视频一区二区三区久| 日本在线播放一区二区三区| 天堂俺去俺来也www久久婷婷| 超碰在线免费公开| 亚洲第一中文字幕在线观看| 亚洲伊人色欲综合网| 蜜臀av一区二区在线观看| 天天综合精品| 大香伊人久久精品一区二区| 免费成人在线电影| 日本福利片在线| 日韩三级在线观看| 亚洲一区二区3| 国产精品传媒入口麻豆| 久久电影网站中文字幕| 欧美亚洲专区| 欧美三级小说| 久久亚洲成人| 亚洲欧洲av| 亚洲色图综合| 欧美va在线观看| 成人一级福利| 欧美aaaaa性bbbbb小妇| 不卡一区中文字幕| 水蜜桃久久夜色精品一区的特点| 国产精品x453.com| 欧美日韩视频| 日韩成人a**站| 综合色一区二区| 伊人情人综合网| 午夜精品久久99蜜桃的功能介绍| 久久视频在线| 91tv官网精品成人亚洲| 天天插综合网| 久久aⅴ乱码一区二区三区| 亚洲黄色免费| 韩国v欧美v亚洲v日本v| 国产成人精品亚洲777人妖| 国产一区二区三区四区五区入口| 国产美女视频一区| 国产精品88av| 亚洲欧美激情插| 日韩欧美精品中文字幕| 欧美日韩综合在线| 亚洲精品电影网在线观看| 亚洲成人网在线观看| 精品国产一区二区国模嫣然| 国产三级免费观看| 免费人成在线观看网站| 色yeye免费人成网站在线观看| 国产中文字幕在线看| caoporm免费视频在线| 爱情电影社保片一区| 精品按摩偷拍| 欧美视频福利| 91亚洲大成网污www| 日韩欧美亚洲一二三区| 精品亚洲一区二区三区在线播放 | 成人午夜大片|