新京報(bào)貝殼財(cái)經(jīng)訊(記者羅亦丹)國(guó)內(nèi)AI大模型廠商在AI編程領(lǐng)域的競(jìng)爭(zhēng)近期呈現(xiàn)白熱化趨勢(shì)。7月23日,阿里開源全新的通義千問AI編程大模型Qwen3-Coder,通義千問官方在微信公號(hào)上表示“這是我們迄今為止最具代理能力的代碼模型。”


據(jù)了解,Qwen3-Coder是千問系列模型中首個(gè)采用混合專家MoE架構(gòu)的代碼模型,總參數(shù)達(dá)480B,激活35B參數(shù),原生支持256K token的上下文并可擴(kuò)展至1M長(zhǎng)度。Qwen3-Coder在代碼占比70%的7.5T數(shù)據(jù)上預(yù)訓(xùn)練,在后訓(xùn)練階段進(jìn)行了編程任務(wù)及智能體任務(wù)的強(qiáng)化學(xué)習(xí),最終實(shí)現(xiàn)了通用能力、代碼能力及Agent能力的飛升:在瀏覽器調(diào)用(WebArena)、工具調(diào)用(BFCL)等Agent能力評(píng)測(cè)中,Qwen3-Coder刷新開源模型紀(jì)錄,超越GPT4.1;在考察模型自主規(guī)劃解決編程任務(wù)的SWE-Bench評(píng)測(cè)中,Qwen3-Coder取得了開源最佳效果,可媲美Claude4。這意味著其編程能力登頂全球開源模型陣營(yíng),并超越GPT4.1等閉源模型,比肩“全球最強(qiáng)”編程模型Claude4。


阿里方面表示,Qwen3-Coder在代碼能力及Agent調(diào)用能力方面取得重大突破,擅長(zhǎng)解決多步驟的長(zhǎng)任務(wù),它能通觀全局自主安排工作內(nèi)容,支持Agent調(diào)用各種工具深入鉆研,最終解決復(fù)雜編程任務(wù)?;赒wen3-Coder,網(wǎng)頁(yè)開發(fā)、AI搜索、深度研究等智能體應(yīng)用將變得更智能、更高效。實(shí)測(cè)數(shù)據(jù)顯示,在執(zhí)行任務(wù)時(shí),Qwen3-Coder能夠調(diào)用的工具數(shù)量比Claude多幾倍,“借助Qwen3-Coder,剛?cè)胄械某绦騿T一天就能完成資深程序員一周的工作,生成一個(gè)品牌官網(wǎng)最快只需5分鐘。”


Qwen3-Coder已在魔搭社區(qū)、HuggingFace等平臺(tái)開源,全球開發(fā)者都可以免費(fèi)下載使用。Qwen3-Coder很快將接入阿里的AI編程產(chǎn)品通義靈碼,API也已上線阿里云百煉。為方便開發(fā)者更好地使用Qwen3-Coder,通義團(tuán)隊(duì)還開源了一款命令行工具Qwen Code,可充分發(fā)揮Qwen3-Coder在代理式編程上的潛力。此外,Qwen3-Coder的API可以和Claude Code、Cline等工具協(xié)同使用。


貝殼財(cái)經(jīng)記者注意到,2024年9月,阿里巴巴CEO吳泳銘曾在云棲大會(huì)上表示,“大模型技術(shù)快速迭代,技術(shù)可用性大幅提升。去年,大模型還只能幫助程序員寫簡(jiǎn)單的代碼,今天已經(jīng)能直接理解需求,完成復(fù)雜的編程任務(wù)?!北敬我园⒗锇桶偷拿x發(fā)布Qwen3-Coder,足以證明阿里巴巴集團(tuán)對(duì)這款產(chǎn)品的重視程度。


編輯 楊娟娟

校對(duì) 楊利