OpenAI GPT Agent以為只比Manus們差了一步,
但7月份帶著一堆更新回歸的MiniMax Agent告訴它其實已經慢一圈了。
還在卷PPT、可視化網頁制作、報告制作的時候,MiniMax已經可以完成:
全棧開發和部署(做出來的網頁支持登陸、注冊、前后臺、以及Stripe支付)
我真的可以搬出那句人人都可以是獨立開發者了,這一整套流程都安排好,真的不夸張,這樣一套無代碼的開發系統,去年是1500左右/月,我都用下不去手。
- 多模態的輸入輸出(圖片、音頻、視頻)
- 定制自己需要的MCP Servers
- 還支持定時任務(每天更新AI日報都不是壓力測試了)
我從快80個真實案例里面分為6大類,一起來看看這個豪華的目錄吧:
- 1.全棧開發:開發互動論壇 & Strip支付課程購買網站
- 2.自動化工作流:AI日報 & OpenAI日報(舉例)
- 3.MCP自建:酒店比價MCP
- 4.多模態內容:圖片位置識別 & 30s視頻短片生成
- 5.交互式學習:初一數學游戲化學習
- 6. PPT制作:有一個好看的案例太想分享了
Here we go!
我跟MiniMax Agent的聊天記錄和提示語都打包整理好了,還是老規矩,公眾號回復“mmagent”就行,兩個m哦
01|全棧開發
MiniMax Agent 應該是第一個敢把“全棧開發”這四個字說出來且確實能做出來的 Agent。
試著用它開發了一個在線論壇,整個需求是 Agent 自己分析出來的:首頁要有帖子列表、每個帖子有詳情頁、支持注冊登錄、有評論功能,甚至還自動檢測登錄態安全、接口健壯性這些細節,真像個經驗豐富的前端+后端全職程序員做的。
從發到我郵箱里的郵件信息可以看出是接入了Supbase(簡單理解成云端數據庫),整體邏輯都非常順,注冊、驗證、登陸、發帖都沒有卡頓,頁面之間的路由跳轉絲滑得不像AI搭的。
06f75ewdtw.space.minimax.io
最簡單也最困難的登陸功能能做的話,
距離完成一個基礎的Saas網頁就差個收款功能了。
這一點可能不同的人想法不一致,但是就拿我自己做的網頁來說,除了基礎UI外,我首先要的是基礎的信息整理,比方說ai工具的開源替代(存個20頁左右),再加一個登陸功能,吸引用戶收藏、評論等等。真的就差個收款功能了,可能是讓用戶可以自定義分類,或者提交自己的工具等等。
在MiniMax里加一個新需求:
開發一個帶Stripe支付功能的在線課程購買網站
kcvaoey6ln.space.minimax.io
它就能自己構建商品展示頁、添加購物車、生成訂單、調用 Stripe SDK 并處理支付成功/失敗的回調邏輯,全流程自己跑了一遍測試,交付前還會主動跟你確認體驗是否流暢。
總的來說,我能清晰感受到 MiniMax Agent 是有工程意識的,它不是湊頁面交差,沒有多余的功能,而是真心想交一個“可用”的項目。
02|自動化工作流
現階段的搜索組件有太多選擇了,有AI搜索、聯網搜索的MCP、有平臺會自帶Deep Research或者Deep Search,
所以我前段時間也放棄了繼續做每日AI日報,比起每一條信息的壓縮和挑選,更難的是要每天更新。
MiniMax Agent算是圓了我一個小遺憾
對信息自動收集來說,我還是建議大家將一個個主體做成獨立的信息源,
不然光是要生成全網前十的AI新聞的話,得到的信息只能是非常零碎的,實在不行分平臺來收集信息效果都會好點。
制作一個網頁,通過后端調用serper API每分鐘更新并搜索獲取OpenAI新聞。希望整體UI風格接近OpenAI官方網站油畫質感。無需手動刷新按鈕。
cth57sk0va.space.minimax.io
那再提升一下,讓MiniMax自己用serper API做信息檢索、用Gemini API完成內容合成和排版,用Subpase存儲最近5天的日報、還要每天八點自動啟動工作流:
q9s4jxcvv6.space.minimax.io
照樣可以做,我現在真有點想把AI日報升級一下重新開放出來了,
之前囤的幾百個信息源我現在只把一部分做成了Rss,光自己看的話每天都看不過來。
03|MCP自建
這里的開頭我挺想引用一下我看到的@idoubi和@深繪關于MCP的一段對話。我感覺會消除不少人的疑惑,我濃縮摘要了一下:
提問:
說實話,我還是Get不到MCP的點。
這件事的本質,其實就是AI發起一個工具調用請求,服務方給出工具執行結果,AI添加到上下文,然后回答用戶或者繼續調用。
如果說這是為了統一標準,OpenAPI不是已經是標準了嗎?全世界的API都在用OpenAPI文檔,AI也能直接讀懂,工具調用完了結果該怎么加到上下文還是怎么加,為啥還要搞個MCP?
- a.不是所有 api 都有文檔,沒有文檔 AI 不知道調用什么 API。mcp 在定義工具的時候,相當于是在寫文檔
- b.不是所有寫代碼的都喜歡對接 api,寫一個 mcp client,就能一次性接入很多個 api 提供的功能
- c.在 OpenAI 創建的 gpts,你不能在其他地方用。用 mcp 制作的服務器,你可以用在任何 chatbot
AI 時代的萬物互聯,需要 MCP 這樣的協議
那現在MCP Servers的問題是數量還是太少了,想要把自己的服務打包成MCP,我在之前的教程里面也給出了相對簡單的實現路線,也要一個固定模版、一套API文檔、以及Claude來幫幫場。
在 MiniMax 里,一句話就能搞定:
編寫一個能夠比較Agoda和Booking酒店價格并包含酒店名稱的MCP程序
enmm,提示語就是如此簡單,從它的執行過程中看,首先是會找有沒有類似的MCP,發現實在是沒有之后,就到了程序員的快樂超市Github找了一個“看起來很有前途”的項目(這是它原話)。
但是這個庫更新的時間已經是很久之前了,所以MiniMax是參考它的結構重新生成了完整的配置文件。
在生成的README里面是有安裝說明書的,
連上ChatWise之后,也是幫我找到了下個月巴厘島的優惠酒店了
04|多模態內容
接下來就是考考MiniMax的多模態能力,上面的case我都輸入的文本,那圖片、音頻、甚至是視頻呢?
分析照片拍攝的確切位置
這個case當時o3 pro出來的時候都在測,很多模型都是蒙的,經不起推敲。
所以MiniMax建立了一個計劃文檔,首先做圖像分析,看到了櫻花、大樓、特色的道路設計,然后換了幾個不同的搜索源確認哪些地方是以夜櫻燈飾出名的,最后搜索了一大堆衛星圖像,確定了位置坐標,甚至還推測出了當時是在舉辦 Midtown Blossom 活動,分析到一半它還會再看一遍圖像來刷新記憶。
輸入好了,輸出怎么樣?我不是才更新了視頻Agent的橫評嘛,所以來吧:
寫一個30秒的小故事,主角是一個穿著宇航服的女孩,在下雨天的便利店門口偶遇了未來的自己。要畫面氛圍感強,補充完整的劇情,有配音和背景音樂
配音很有復古感,而且分了角色,這個很難得,畫面整體的邏輯都還不錯,成功率也很高。畫面的場景和人物一致性也很好,但我看著更像女孩懷念離開的媽媽,不太像遇見未來的自己,劇情這一塊可以進一步優化。
05|交互式學習
值得分享還是太多太多了,我們再來個互動感拉滿的案例吧,
幫我做一個網站,展示和教學初一數學的所有知識點,數學公式要正常展示,如果有圖形幾何等知識點要用動畫效果教學,索引知識點的方式可以做的像通關游戲一樣
cghopcufj0.space.minimax.io
Amazing啊,能用來學習的Agent又多一個,MiniMax會先拆解教學目標,再根據教學節奏做出章節劃分,然后每章配小游戲、小測試和答疑模塊,甚至還需要先做對前面幾關才能解鎖后續。。
所以理論上積分足夠的話,
我完全可以在MiniMax Agent里輕松完成搭建一套帶前后臺、收款、多模態輸入輸出、有豐富交互細節的網站,還能順手做出一大堆MCP。
06|PPT制作
幫我做一個新世紀福音戰士介紹PPT
雖然PPT不是這次最主要的更新,但是作為Eva廚,從MiniMax出品的PPT頁數、背景圖片和文本的匹配程度、模塊組件的磨砂感和色塊、甚至還知道將MAGI這個超級電腦說的話用經典的黑綠命令行模版來說,都可以看出MiniMax這次的提升。
而且從生成過程中看,MiniMax并不是每一步都是成功的,特別是網頁信息提取的步驟,但它會將失敗的步驟集合起來重新運行,這一操作能降低卡住某個todo的幾率。
最后一個,真的是最后一個了
寶可夢太可愛了真的。
可能很多人第一次看到 MiniMax Agent,會覺得只是另一個「會寫代碼的AI」。
但親自體驗一遍之后,我意識到它不是做了一堆網頁,而是做了一些“可以上線運營的產品”;不只是跑通了流程,而是成了一次真實世界里的需求閉環。
很多時候,我給的提示語并不完美,它也不是每一步都能一次成功,但你就是能看到,它會不斷嘗試、不斷修復,直到那個「你想要的答案」真的出現。
MiniMax Agent 做到了。
而這,也正是我愿意把它留在常用Agent第一排的理由。
@ 作者 / 卡爾
最后,感謝你看到這里如果喜歡這篇文章,不妨順手給我們點贊|在看|轉發|評論
如果想要第一時間收到推送,不妨給我個星標
更多的內容正在不斷填坑中……
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.