把a(bǔ)iXcoder等同于一個(gè)模型是最大的誤解。
作者|蘇霍伊
編輯|王博
國資進(jìn)入AI編程賽道了。
「甲子光年」獨(dú)家獲悉,硅心科技(aiXcoder)前不久完成了A++輪融資,投資方為中關(guān)村發(fā)展集團(tuán)旗下中關(guān)村資本,硅心科技成為了國內(nèi)首家國資投資的專注AI+軟件工程的企業(yè)。據(jù)公開資料顯示,aiXcoder目前共獲得4輪融資,吸引了伽利略資本、高瓴創(chuàng)投、彬復(fù)資本、清流資本、三七互娛等多家頂級風(fēng)險(xiǎn)投資機(jī)構(gòu)的持續(xù)注資。
盡管AI編程賽道火熱,但國資的進(jìn)入往往有著更深層次的技術(shù)自主性、產(chǎn)業(yè)生態(tài)構(gòu)建的意義。
「甲子光年」觀察到,當(dāng)前的AI編程市場需求已經(jīng)從“能寫代碼”向“能交付特定任務(wù)”轉(zhuǎn)變。
通用大模型如GPT、Claude、Llama等,能夠根據(jù)自然語言描述生成代碼。但是通用大模型主要利用互聯(lián)網(wǎng)上的公有數(shù)據(jù)進(jìn)行訓(xùn)練,無法覆蓋私域數(shù)據(jù),通常僅能支持通用領(lǐng)域的軟件開發(fā)。然而,更多的軟件開發(fā)需求來源于特定行業(yè),通用大模型在面對特定業(yè)務(wù)場景和需求時(shí),其孤立性和對業(yè)務(wù)邏輯的理解不足,導(dǎo)致了其對復(fù)雜需求的處理雖表面上可行,實(shí)際上卻缺乏可信度,無法提供充分的支持。
這是AI難以實(shí)現(xiàn)企業(yè)特定領(lǐng)域化應(yīng)用的的痛點(diǎn),同時(shí)也是aiXcoder團(tuán)隊(duì)的著力點(diǎn)。
aiXcoder團(tuán)隊(duì)由北京大學(xué)軟件工程研究所孵化,是國際上“基于深度學(xué)習(xí)的程序理解與生成”的先驅(qū)性研究者。團(tuán)隊(duì)自2013年起就開始探索深度學(xué)習(xí)技術(shù)在代碼生成和代碼理解方面的應(yīng)用,累計(jì)在國內(nèi)外頂級學(xué)術(shù)期刊/專業(yè)期刊發(fā)表論文100多篇,其中多篇是智能化軟件工程領(lǐng)域的首篇和引用率最高的論文。2021年12月發(fā)布全球首個(gè)超過十億參數(shù)量的aiXcoder 1.3B代碼大模型;2022年6月發(fā)布國內(nèi)首款13B代碼大模型。自主研發(fā)的“aiXcoder代碼大模型”是業(yè)內(nèi)首批完成國家備案的代碼大模型企業(yè)。核心產(chǎn)品智能化軟件開發(fā)系統(tǒng)一直在向B端企業(yè)客戶和C端開發(fā)者提供實(shí)時(shí)智能開發(fā)輔助,并持續(xù)通過深度定制方案解決大模型與領(lǐng)域知識融合的難題,幫助企業(yè)提升軟件開發(fā)效率和研發(fā)效能。
近期,aiXcoder產(chǎn)品升級,最新推出Agent(智能體)模式,并內(nèi)置MCP(大模型上下文協(xié)議)功能,創(chuàng)新為軟件開發(fā)行業(yè)帶來全流程自動(dòng)化解決方案。該技術(shù)通過模擬人類開發(fā)者的任務(wù)規(guī)劃、工具調(diào)用、自主反思、邏輯推理等能力,可智能完成項(xiàng)目級代碼生成、修改、調(diào)試、重構(gòu)等復(fù)雜軟件開發(fā)任務(wù),顯著提高企業(yè)研發(fā)效率,大幅縮短研發(fā)周期,助力企業(yè)數(shù)字化轉(zhuǎn)型。
總的來說,aiXcoder通過獨(dú)特的深度定制解決方案,專業(yè)代碼大模型的個(gè)性化訓(xùn)練,結(jié)合Agent協(xié)同能力和Prompt工程化,并融合業(yè)界成熟的工具鏈和工程實(shí)踐,實(shí)現(xiàn)軟件開發(fā)效率與質(zhì)量的全面提升,讓模型輸出更貼合企業(yè)和用戶的實(shí)際需求。
目前aiXcoder已在金融、軍工、航天、IT等領(lǐng)域落地,服務(wù)眾多行業(yè)頭部客戶,打造多元場景標(biāo)桿案例。
無論是從科研成果轉(zhuǎn)化角度,還是專業(yè)領(lǐng)域模型與通用大模型的競爭角度,亦或是AI模型應(yīng)用落地角度來看,aiXcoder都走出了一條新的路徑,而國資的注入就是對這條新路徑的認(rèn)可。
1. 最新推出內(nèi)置MCP功能的軟件開發(fā)領(lǐng)域Agent產(chǎn)品
從“高級代碼生成與補(bǔ)全工具”進(jìn)化為真正的“AI軟件工程師”,除了需要“腦子”——大模型之外,還需要“手”——自主調(diào)用工具的能力。
近期,aiXcoder產(chǎn)品升級,創(chuàng)新推出Agent模式,并內(nèi)置MCP功能,助力企業(yè)實(shí)現(xiàn)復(fù)雜軟件開發(fā)任務(wù)的自動(dòng)化處理,可以針對性適配企業(yè)已有的開源大模型。相比Cursor每月20-40美元費(fèi)用,aiXcoder Agent功能計(jì)劃在插件端免費(fèi)開放,使用Agent無門檻,推動(dòng)AI Coding行業(yè)發(fā)展。
aiXcoder Agent實(shí)現(xiàn)原理
開發(fā)者可通過aiXcoder Agent快速配置安裝MCP Servers,將常用軟件開發(fā)工具和企業(yè)專屬工具無縫集成至平臺。當(dāng)大模型處理需求時(shí),aiXcoder Agent智能中樞會(huì)通過MCP協(xié)議棧實(shí)時(shí)分析任務(wù)上下文,自主選擇最優(yōu)工具進(jìn)行調(diào)用,進(jìn)而完成多類型任務(wù)。
在Agent模式下,AI相對于開發(fā)者來說,更像一個(gè)Partner,雙方通過自然語言交互,即可完成端到端的軟件開發(fā)任務(wù)。開發(fā)者不再需要逐行編寫大量的代碼或反復(fù)操作多個(gè)文件,只需要在關(guān)鍵節(jié)點(diǎn),點(diǎn)擊接受或者拒絕,顯著提高工作效率的同時(shí),可以將更多精力集中在核心業(yè)務(wù)邏輯的設(shè)計(jì)和架構(gòu)優(yōu)化上。
“Agent是一個(gè)具備完整執(zhí)行鏈條和工具能力的系統(tǒng),它不是聊天式的,不是純推薦代碼的,它是工程意義上的、可以執(zhí)行任務(wù)的系統(tǒng)。”aiXcoder聯(lián)合創(chuàng)始人劉洋告訴「甲子光年」,“它能把一個(gè)復(fù)雜問題拆解成多個(gè)分支任務(wù),在執(zhí)行中與人不斷交互確認(rèn),最終生成貼合真實(shí)業(yè)務(wù)需求的結(jié)果。”
以開發(fā)金融業(yè)務(wù)系統(tǒng)的后臺管理頁面為例。傳統(tǒng)的做法可能是需要手動(dòng)分析需求、設(shè)計(jì)架構(gòu)、編寫代碼、調(diào)試測試并逐步迭代優(yōu)化,這通常是一個(gè)耗時(shí)且復(fù)雜的過程。
但是在aiXcoder Agent模式下,開發(fā)者只需輸入指令:“根據(jù)提供的API,制作一個(gè)交互友好的后臺管理頁面。”Agent就會(huì)立即結(jié)合總體目標(biāo)拆分任務(wù),實(shí)現(xiàn)需求解析、多文件編輯、邏輯設(shè)計(jì)、各功能模塊構(gòu)建等全流程自動(dòng)化,期間還會(huì)自動(dòng)執(zhí)行終端指令與調(diào)用瀏覽器啟動(dòng)服務(wù)和進(jìn)行效果驗(yàn)證,不到30分鐘就可以自主完成金融系統(tǒng)的后臺管理頁面開發(fā)上線。
在上線了Agent功能后,aiXcoder為智能化軟件開發(fā)賦予了更多的主動(dòng)性。總體而言分為三類:
復(fù)雜任務(wù)規(guī)劃能力:能夠?qū)?fù)雜任務(wù)分解為多個(gè)合適的、可執(zhí)行、可驗(yàn)證的步驟,并自主規(guī)劃執(zhí)行;
自主學(xué)習(xí)與優(yōu)化能力:根據(jù)用戶反饋和任務(wù)結(jié)果不斷學(xué)習(xí)或調(diào)整計(jì)劃,比如生成的代碼有編譯錯(cuò)誤時(shí)Agent會(huì)自動(dòng)解決;
實(shí)時(shí)交互與協(xié)作能力:用戶能隨時(shí)介入任務(wù)執(zhí)行過程,調(diào)整需求或方向。
“我們希望aiXcoder Agent能夠像一位經(jīng)驗(yàn)豐富的高級開發(fā)者一樣工作,不僅能夠理解需求,還能夠主動(dòng)提供解決方案,甚至在復(fù)雜任務(wù)中分解問題并逐步解決。”劉洋介紹。
2.一個(gè)專業(yè)代碼大模型的自我修煉
智能化軟件開發(fā)離不開一個(gè)專業(yè)的代碼大模型。
aiXcoder 7B就是aiXcoder團(tuán)隊(duì)在2024年4月正式推出并開源的全自研代碼大模型,基于1.2T高質(zhì)量代碼數(shù)據(jù)集、專門結(jié)合代碼特性、針對代碼相關(guān)任務(wù)進(jìn)行了預(yù)訓(xùn)練,具有易部署、易定制、易組合等特性。
在多個(gè)主流測評集上,aiXcoder 7B代碼生成與補(bǔ)全能力超越同級別及更高參數(shù)規(guī)模的開源模型。
aiXcoder 7B與同級別模型對比
aiXcoder 7B在企業(yè)真實(shí)開發(fā)場景下的代碼處理能力如何呢?aiXcoder基于16000多條來自真實(shí)開發(fā)場景的數(shù)據(jù),構(gòu)建了一個(gè)大規(guī)模測評代碼生成補(bǔ)全數(shù)據(jù)集,并對多個(gè)大模型進(jìn)行測評。結(jié)果顯示,aiXcoder 7B不僅在代碼生成與補(bǔ)全方面效果最好,且生成的代碼更加簡潔,更接近人類編碼風(fēng)格。
現(xiàn)有通用大模型在實(shí)際軟件開發(fā)中表現(xiàn)受限的核心原因,在于其將代碼簡單等同于自然語言文本的處理方式,忽視了代碼作為結(jié)構(gòu)化邏輯實(shí)體的本質(zhì)特性。真正的軟件開發(fā),需要AI不僅能“背代碼”,還要理解代碼背后的“語法規(guī)則”和“工程邏輯”。
在AI編程領(lǐng)域,aiXcoder 7B提出的“將代碼特性引入大模型訓(xùn)練”是一個(gè)突破性創(chuàng)新,其核心在于通過代碼的結(jié)構(gòu)化特征重構(gòu)訓(xùn)練范式。aiXcoder 7B針對代碼特性所采取的創(chuàng)新訓(xùn)練方法有:高質(zhì)量訓(xùn)練數(shù)據(jù)構(gòu)建、基于代碼結(jié)構(gòu)的模型訓(xùn)練、項(xiàng)目級多代碼文件排序。其創(chuàng)新之處遠(yuǎn)非簡單使用代碼數(shù)據(jù)訓(xùn)練模型,而是系統(tǒng)性地將代碼的本質(zhì)特性轉(zhuǎn)化為模型學(xué)習(xí)目標(biāo)。
這種轉(zhuǎn)變也讓代碼大模型從“高級代碼生成與補(bǔ)全工具”進(jìn)化為真正的“AI軟件工程師”,核心能力邊界從字符序列擴(kuò)展到完整的軟件工程語義空間。
aiXcoder 7B相關(guān)論文被軟件工程領(lǐng)域國際頂級會(huì)議 ICSE 2025收錄,以嚴(yán)格著稱的ICSE審稿人如此評價(jià)aiXcoder 7B的相關(guān)論文:“這篇論文涉及了一個(gè)阻礙大模型進(jìn)行代碼應(yīng)用部署的關(guān)鍵問題,即最先進(jìn)的LLM模型體積龐大,且為提升性能而傾向于增大模型規(guī)模。它讓代碼補(bǔ)全時(shí)間過長,進(jìn)而影響用戶體驗(yàn)。本文通過提出一種改進(jìn)的代碼補(bǔ)全模型訓(xùn)練方法來解決這一問題。”“本文推導(dǎo)了一個(gè)新的代碼補(bǔ)全基準(zhǔn),這對希望評估LLM在代碼補(bǔ)全方面表現(xiàn)的研究人員和從業(yè)者來說,具有重大貢獻(xiàn)。”
審稿人提到的關(guān)鍵問題就是aiXcoder團(tuán)隊(duì)從用戶體驗(yàn)角度出發(fā)去解決的,他們沒有盲目追求參數(shù)規(guī)模,而是在訓(xùn)練初期就聚焦實(shí)際應(yīng)用場景。
劉洋告訴「甲子光年」:“我們選7B模型,是對模型速度和能力的權(quán)衡。越大的模型生成越慢,而開發(fā)者更希望‘毫秒級’響應(yīng),不打斷工作思路。”
這一年,aiXcoder 7B為企業(yè)實(shí)現(xiàn)大模型的低成本部署和領(lǐng)域化應(yīng)用提供了全新解決方案。而通過企業(yè)領(lǐng)域代碼個(gè)性化訓(xùn)練,aiXcoder團(tuán)隊(duì)還可以根據(jù)企業(yè)需求訓(xùn)練企業(yè)專屬代碼大模型。
企業(yè)領(lǐng)域代碼個(gè)性化訓(xùn)練
在真實(shí)軟件開發(fā)場景中,代碼大模型往往需要處理不同類型的上下文,比如當(dāng)前文件的上文、跨文件上下文、相關(guān)代碼段等,以實(shí)現(xiàn)高精度代碼補(bǔ)全。這種復(fù)雜的上下文形式與通常的模型預(yù)訓(xùn)練時(shí)的上下文形式不一致,所以限制了模型在實(shí)際應(yīng)用中的代碼補(bǔ)全準(zhǔn)確率。
「甲子光年」了解到,為解決這個(gè)問題,aiXcoder團(tuán)隊(duì)計(jì)劃在今年上半年推出aiXcoder 7B 2.0,在多種主流編程語言及框架下的多行補(bǔ)全上,相較于去年4月發(fā)布aiXcoder 7B 1.0,經(jīng)過優(yōu)化的新模型在Exact Match(完全匹配)指標(biāo)上效果提升13%。
3.把a(bǔ)iXcoder等同于一個(gè)模型是最大的誤解
由于aiXcoder 7B的知名度,不少人會(huì)把a(bǔ)iXcoder簡單理解一個(gè)專業(yè)代碼大模型開發(fā)團(tuán)隊(duì),但這是對aiXcoder最大的誤解。
“我們相信,軟件交付的其實(shí)是業(yè)務(wù)價(jià)值。”aiXcoder商業(yè)合伙人兼總裁劉德欣告訴「甲子光年」。
aiXcoder團(tuán)隊(duì)所做的事情是:通過專業(yè)代碼大模型的個(gè)性化訓(xùn)練,結(jié)合多個(gè)Agent協(xié)同和Prompt工程化,并融合業(yè)界成熟的工具鏈和工程實(shí)踐,實(shí)現(xiàn)軟件開發(fā)效率與質(zhì)量的全面提升,讓模型輸出更貼合企業(yè)和用戶的實(shí)際需求。
與AI編程賽道的其他產(chǎn)品,如GitHub Copilot、Cursor、Codeium及國內(nèi)的AI+代碼產(chǎn)品相比,aiXcoder有著獨(dú)特性的差異。
以GitHub Copilot為代表的產(chǎn)品,其在IDE(集成開發(fā)環(huán)境)中以插件形式集成,在用戶輸入時(shí)提供灰色候選建議。Copilot在全球使用者眾多,但本質(zhì)上依然是“被動(dòng)式”的:僅在用戶輸入后進(jìn)行響應(yīng),不會(huì)主動(dòng)任務(wù)規(guī)劃與執(zhí)行。此外由于其采用云端推理,也讓企業(yè)用戶在處理敏感代碼時(shí)充滿隱私和數(shù)據(jù)安全顧慮。
而被稱為“聊天式編程”的Cursor則從交互層面做出了更為激進(jìn)的創(chuàng)新。它類似VSCode的編輯器,集成了GPT-4、Claude 3.5等LLM模型,支持對話驅(qū)動(dòng)的代碼理解、定位與修改,適合處理上下文超長的個(gè)人項(xiàng)目。但目前來看,Cursor的部署方式更契合個(gè)人開發(fā)或初創(chuàng)團(tuán)隊(duì)的需求,在企業(yè)級定制化能力和權(quán)限管理支持方面仍相對有限。
另外,我們也發(fā)現(xiàn)這些針對于C端提供的編程助手,在引入Agent以后,對整體的項(xiàng)目改動(dòng)是沒有嚴(yán)格邊界的,有的時(shí)候會(huì)改動(dòng)程序員不希望修改的很多文件,導(dǎo)致程序員并不知道自己的哪些項(xiàng)目被修改過。從程序員角度出發(fā),構(gòu)建企業(yè)級產(chǎn)品,我們首先要做到給程序員以安全感,大模型以Agentic方式做自動(dòng)化生成沒問題,但我們需要確保全程可控, 程序員始終知道大模型是在按照他的意圖完成工作,而不是替他做主完成工作。
aiXcoder走出了一條新的路徑:不是做一個(gè)“寫得更快的IDE插件”,而是構(gòu)建一個(gè)可以規(guī)劃任務(wù)、調(diào)動(dòng)工具、生成代碼并負(fù)責(zé)結(jié)果的“AI軟件工程師”。
aiXcoder把智能化軟件開發(fā)分成了兩個(gè)階段:第一階段通過引入大模型技術(shù),集中實(shí)現(xiàn)一些初級的自動(dòng)化場景,但在關(guān)鍵的業(yè)務(wù)應(yīng)用中,模型輸出的準(zhǔn)確性和實(shí)用性受到質(zhì)疑,限制了相關(guān)產(chǎn)品在實(shí)際企業(yè)環(huán)境中的應(yīng)用效果和用戶的信任度,目前超過90%的企業(yè)落地大模型還處于該階段;第二階段面向企業(yè)領(lǐng)域知識做有效個(gè)性化訓(xùn)練,聚焦打造企業(yè)領(lǐng)域化解決方案,同時(shí)需要緊貼著企業(yè)的軟件開發(fā)框架,將企業(yè)內(nèi)部那些穩(wěn)定的、大量的業(yè)務(wù)邏輯和高頻代碼場景,利用AI的方式找出來并提取為Prompt體系,然后在用戶輸入的應(yīng)用節(jié)點(diǎn),以背景信息的形式、靈活的以智能化的方式提供給大模型,從而顯著提升模型的業(yè)務(wù)理解力和輸出準(zhǔn)確率,這種方式確保了模型輸出更貼合企業(yè)和用戶實(shí)際需求。
如果說Copilot是“AI代碼補(bǔ)全工具”,Cursor是“對話式集成開發(fā)環(huán)境”,那么aiXcoder就是一個(gè)與實(shí)際場景深度融合的智能化軟件開發(fā)平臺。aiXcoder的思路更“聚焦”也更“深入”,劉洋坦言:“我們要做的,就是把大廠做不動(dòng)的麻煩事給做透。”
因此他們選擇了一條B端+C端的“雙輪驅(qū)動(dòng)”路徑。
在B端,aiXcoder針對企業(yè)客戶提供私有化部署的AI編程助手和配套的專業(yè)服務(wù),包括大模型的訓(xùn)練微調(diào)、咨詢及軟件開發(fā)流程優(yōu)化等。
“我們現(xiàn)在大部分客戶來自于B端,主要是集中在企業(yè)的私有化部署、模型的領(lǐng)域化訓(xùn)練和軟件開發(fā)流程的優(yōu)化等方面。通過軟件訂閱加專業(yè)服務(wù)的方式收費(fèi),客單價(jià)比較高,粘性也比較大。”劉德欣說。
「甲子光年」發(fā)現(xiàn),aiXcoder的客戶集中在金融、軍工、航空航天、能源、交通等行業(yè),這些行業(yè)對代碼生成的精度、安全和合規(guī)有著近乎苛刻的要求。以銀行業(yè)務(wù)為例,代碼中不僅充滿大量金融術(shù)語,而且需嚴(yán)格遵循監(jiān)管與審計(jì)規(guī)范。
“銀行的客戶更關(guān)注它的合規(guī)。我們通過私有化部署幫他們訓(xùn)練之后,整個(gè)代碼的合規(guī)性整體提升了50%,研發(fā)成本也下降了約20%。”劉德欣介紹,“此外我們曾為某頭部證券公司進(jìn)行了兩輪個(gè)性化訓(xùn)練,將模型的準(zhǔn)確率從約10%提升至35%。他們也曾嘗試通過LoRA 等微調(diào)方式自主優(yōu)化,升幅僅為3%到4%。”
而在與航天502所的合作中,雙方聯(lián)合推出首個(gè)先進(jìn)人工智能技術(shù)與軟件工程相結(jié)合、自動(dòng)將控制算法生成程序代碼的軟件開發(fā)產(chǎn)品,極大提高航天軟件開發(fā)效率和質(zhì)量,引領(lǐng)航天軟件智能化開發(fā)新模式。該項(xiàng)目也因此入選AIIA(中國人工智能產(chǎn)業(yè)發(fā)展聯(lián)盟)發(fā)布的先鋒案例。
這些高壁壘場景要求模型不僅懂編程語言,更要理解行業(yè)術(shù)語、代碼規(guī)范和系統(tǒng)架構(gòu)。在傳統(tǒng)開源大模型層面,這些能力往往缺失,無法滿足企業(yè)的工程化需求。
為了滿足這些行業(yè)的高要求,aiXcoder提出了一種可標(biāo)準(zhǔn)化交付的“深度定制化”路線,核心思路是將大模型“馴化”為熟悉客戶業(yè)務(wù)的專用助手。
但這是否意味著aiXcoder走上了傳統(tǒng)To B行業(yè)的“費(fèi)時(shí)費(fèi)力做定制化服務(wù)”的老路呢?
對此,劉德欣回應(yīng):“我們不做那種人力密集的定制化‘二開’,而是利用我們多年沉淀的工具和流程,去賦能客戶和伙伴可復(fù)制、規(guī)模化的模型調(diào)優(yōu)能力。”
在aiXcoder的解決方案中,有一個(gè)非常關(guān)鍵的環(huán)節(jié)——深度定制,可以有效解決大模型與企業(yè)領(lǐng)域化融合難題。不同于市場上普遍存在的弱定制方案——使用PEFT(高效參數(shù)微調(diào))、SFT等常規(guī)微調(diào)方式和RAG的方式,aiXcoder深度定制方案層層遞進(jìn)且又相互獨(dú)立,企業(yè)可結(jié)合自身情況和需求對號入座,獲得量身定制的專屬方案。
比如aiXcoder會(huì)根據(jù)客戶已有代碼與業(yè)務(wù)流程構(gòu)建高質(zhì)量訓(xùn)練數(shù)據(jù),并通過輕量級微調(diào)技術(shù)實(shí)現(xiàn)模型能力遷移。“計(jì)算資源我們只用一到兩張推理卡,也能讓模型的微調(diào)結(jié)果達(dá)到甚至超過全參微調(diào)的能力,”劉德欣說,“我們的目標(biāo)是讓企業(yè)能用最低的代價(jià)訓(xùn)練出效果最好企業(yè)專有模型。”
此外,aiXcoder還獨(dú)創(chuàng)了基于提示詞的軟件開發(fā)方案PBSD(Prompt-based Software Development)。該方案有別于傳統(tǒng)的提示詞工程,而是沿著企業(yè)的軟件開發(fā)框架,以智能化的方式把企業(yè)內(nèi)部那些支撐企業(yè)業(yè)務(wù)的海量基礎(chǔ)業(yè)務(wù)代碼找出來,并Prompt化,然后把這些Prompts以結(jié)構(gòu)化的方式管理起來,幫助模型在生成時(shí)實(shí)時(shí)引用背景知識,提高了上下文命中率和準(zhǔn)確率。
這種深度貼合客戶業(yè)務(wù)邏輯的策略,讓aiXcoder能快速進(jìn)入客戶的核心開發(fā)流程。
“敢去啃硬骨頭的企業(yè)不多,而我們愿意去深入解決企業(yè)領(lǐng)域化的問題。雖然未來模型會(huì)替換,但這些沉淀下來的技術(shù)會(huì)持續(xù)發(fā)揮價(jià)值。”劉洋告訴「甲子光年」。
而在私有化部署與企業(yè)場景的打磨中,aiXcoder起步很早。劉德欣認(rèn)為,許多企業(yè)在部署大模型時(shí)最大的難點(diǎn)是“搞不懂”、“訓(xùn)不轉(zhuǎn)”、“學(xué)不會(huì)”,“企業(yè)私域數(shù)據(jù)的訓(xùn)練是大模型落地最關(guān)鍵也最難的一步,模型的訓(xùn)練和微調(diào)不是照著網(wǎng)上的教程去做微調(diào)就可以解決,而是要基于企業(yè)客戶的實(shí)際業(yè)務(wù)情況,去幫他們靈活構(gòu)建符合他們的Transformer模型和算法。很多人不是不想做,是沒有工程和模型積累做不了。”
今年年初,在DeepSeek-V3/R1大模型發(fā)布后,aiXcoder第一時(shí)間接入了DeepSeek系列模型。不僅如此,基于多年軟件工程領(lǐng)域的深厚積淀與實(shí)踐,aiXcoder推出一套工程化、高效能的模型訓(xùn)練解決方案,幫助企業(yè)迅速落地DeepSeek并實(shí)現(xiàn)個(gè)性化應(yīng)用,讓AI真正成為企業(yè)內(nèi)在驅(qū)動(dòng)力。
而在C端,aiXcoder更側(cè)重于為開發(fā)者提供工具產(chǎn)品。
aiXcoder推出了IDE插件,為個(gè)人開發(fā)者提供類似于GitHub Copilot的代碼自動(dòng)補(bǔ)全和生成能力。目前這一開發(fā)者版工具以免費(fèi)基礎(chǔ)功能為主,吸引用戶和社區(qū)反饋,共同完成開發(fā)者社區(qū)生態(tài)的建設(shè);未來計(jì)劃加入高級功能并通過訂閱變現(xiàn)。
4.AI編程賽道全球競速與國產(chǎn)突圍
2021年,GitHub推出的Copilot點(diǎn)燃了AI輔助編程的熱潮。短短三年內(nèi),這款由OpenAI模型體系驅(qū)動(dòng)的代碼助手已經(jīng)積累了數(shù)百萬開發(fā)者用戶,此前微軟在7月公布的財(cái)報(bào)中透露,GitHub Copilot的年化經(jīng)常性收入(ARR)達(dá)到3億美元,占GitHub整體收入增長的40%。
技術(shù)迭代也在持續(xù)推動(dòng)行業(yè)裂變。2024年崛起的Cursor可基于GPT-4、Claude 3.5 Sonnet等AI模型的深度學(xué)習(xí)能力,可實(shí)時(shí)預(yù)測開發(fā)者需求并成代碼。據(jù)外媒信息,Cursor近期估值高達(dá)約100億美元。同期Devin、Magic等新晉玩家嘗試突破功能邊界——前者探索多文件代碼架構(gòu)規(guī)劃,后者引入Agent自動(dòng)執(zhí)行編譯驗(yàn)證。
去年7月,Stack Overflow發(fā)布的2024年度開發(fā)者調(diào)查報(bào)告顯示,76%的受訪者表示正在或計(jì)劃在開發(fā)過程中使用 AI 工具,較上年提升6個(gè)百分點(diǎn);Stack Overflow還詢問了開發(fā)者是否認(rèn)為AI對其工作構(gòu)成威脅,有70%的專業(yè)人士認(rèn)為AI不會(huì)對他們的工作構(gòu)成威脅。
去年底,美國AI獨(dú)角獸企業(yè)Anthropic從用戶與Claude的對話中隨機(jī)選取了100萬條,進(jìn)行分析和總結(jié)后發(fā)現(xiàn),用戶在Claude.ai上的主要使用場景排在第一位的是網(wǎng)頁和移動(dòng)應(yīng)用開發(fā),占比為10.4%。Anthropic介紹,軟件開發(fā)人員主要利用Claude執(zhí)行調(diào)試代碼、解釋Git操作及概念等任務(wù)。
代碼及開發(fā)領(lǐng)域由于具備高質(zhì)量的數(shù)據(jù)、豐富的應(yīng)用場景以及多樣的用戶人群,成為了AI應(yīng)用落地的最關(guān)鍵的場景之一。Markets and Markets報(bào)告顯示,全球AI編程工具市場預(yù)計(jì)將從2023年的43億美元增長到2028年的126億美元,預(yù)測期內(nèi)復(fù)合年均增長率為24.0%。
圖片來源:Markets and Markets
在AI編程賽道的全球競速中,國產(chǎn)AI編程企業(yè)正通過差異化創(chuàng)新與生態(tài)協(xié)同實(shí)現(xiàn)突圍。
而突破口在哪里?答案或許就是技術(shù)自主化和垂直場景深耕。
「甲子光年」觀察到,目前AI編程的市場需求正在從“能寫代碼”轉(zhuǎn)向“能交付特定任務(wù)”,aiXcoder在模型調(diào)優(yōu)定制和行業(yè)適配方面下足了功夫,并形成了良好的落地效果,這就已經(jīng)跑在了市場需求的前面。
劉洋判斷,隨著底層大模型的加速發(fā)展,智能編程的普及速度會(huì)“越來越快”,將有“越來越多的人、更多的企業(yè)開始使用這些工具”。他預(yù)計(jì),2025年各家產(chǎn)品將會(huì)對標(biāo)、追平Cursor的技術(shù)水平。“軟件自動(dòng)化是人們幾十年來一直追求的。”劉洋表示。
劉德欣認(rèn)為,未來幾年可落地的市場規(guī)模每年以約30%的速度擴(kuò)張是“比較正常”的趨勢。
中國市場的廣闊與特殊需求也給了aiXcoder機(jī)遇。國內(nèi)開發(fā)者群體龐大,據(jù)自工業(yè)和信息化部的數(shù)據(jù),我國的軟件開發(fā)者數(shù)量已經(jīng)突破940萬,開源參與者數(shù)量排名位居全球第二。企業(yè)數(shù)字化轉(zhuǎn)型對高效開發(fā)工具的需求迫切,而數(shù)據(jù)合規(guī)和本地部署要求也讓海外SaaS難以多方位布局,此刻無疑是國產(chǎn)SaaS平臺發(fā)展發(fā)展的黃金時(shí)期。
這次aiXcoder引入國有資本投資,除了資金支持,更是一種重要的背書,讓aiXcoder在金融、軍工等高安全需求行業(yè)客戶中也獲得了信任度。劉洋很感謝國資的注入:“這是對我們企業(yè)的肯定,也對后續(xù)開拓政府和國企市場是一個(gè)加分項(xiàng)。”
在“百家爭鳴”行業(yè)爆發(fā)期,aiXcoder沒有急于去“橫掃C端”,而是圍繞一個(gè)難而慢的問題:如何把AI嵌入到真實(shí)的企業(yè)開發(fā)流程中,做一名值得信賴的智能軟件開發(fā)合作伙伴。
而AI編程賽道真正的競爭,或許從現(xiàn)在才剛剛開始。
(封面圖來源:aiXcoder )
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.