99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

<abbr id="3vhgm"><table id="3vhgm"><pre id="3vhgm"></pre></table></abbr>

<u id="3vhgm"></u>

<kbd id="3vhgm"><samp id="3vhgm"></samp></kbd>

<menuitem id="3vhgm"><form id="3vhgm"><address id="3vhgm"></address></form></menuitem>

網易首頁

網易新聞
網易公開課
網易紅彩
網易嚴選
郵箱大師
網易云課堂

注冊免費郵箱

注冊VIP郵箱（特權郵箱，付費）
免費下載網易官方手機郵箱應用

移動端
網易公開課
網易嚴選
支付
郵箱

網易首頁 > 網易號 > 正文申請入駐

巧妙！一個傳統技術讓國產視覺基礎模型直接上大分

2025-05-23 14:20:11　來源: 量子位

北京舉報

0

分享至

金磊發自凹非寺
量子位 | 公眾號 QbitAI

咱就是說啊，視覺基礎模型這塊兒，國產AI真就是上了個大分——

Glint-MVT，來自格靈深瞳的最新成果。

先來看下成績——線性探測（LinearProbing）：

簡單來說，線性探測是一種測試預訓練模型效果的小技巧，測的就是基本功扎不扎實。它的做法是：

把模型最后一部分換成簡單的線性層，其他部分全部保持原樣不動；然后只訓練這個新加的線性層，通過它的表現來判斷模型之前學到的特征好不好用。

這個測試是在26個分類測試集中跟CLIP和OpenCLIP做了對比，結果顯示，國產視覺基礎模型平均準確率比OpenCLIP高2.3%，比CLIP高1.1%。

再來看應用效果。

如果說視覺基礎模型是一個底座，那么它的下游任務，像“圖像理解+分割一切”，便是更為直觀的效果展現。

例如下面這張圖片，然后我們可以問一下AI：

你能提供一個分割掩膜給這個圖像中觸摸籃球的人嗎？

很顯然，這個任務的難點在于拿籃球的人被其他人的手、身體等部位擋住，分割難度也大幅增加。

然而，國產AI是不在怕的，啪的一下，超精細地把要求的人物給摳了出來：

我們再來看下更加復雜的案例：

面對如此繁雜的圖片，不論要求AI分割哪種食物，它都能精準無誤地識別出來。

Glint-MVT中的MVT，全稱叫做Margin-based pretrained Vision Transformer，是團隊自研、設計的視覺預訓練Transformer模型。

它的一大亮點，就是創新性地把原先用于人臉識別的間隔Softmax（Margin Softmax）損失函數引入了進來，再通過構造百萬級虛擬類別訓練模型，顯著降低數據噪聲影響，提升泛化能力。

并且從實測和性能效果上來看，在各種專業下游任務中的表現，要比CLIP等其他ViT模型的結果更好。

在Glint-MVT這個底座之上，團隊針對引用表達分割（RES，Referring Expression Segmentation）和圖像理解，還分別訓練出了多模態模型：Glint-RefSeg模型和MVT-VLM模型。

Glint-RefSeg是無需特別搜集訓練就可以分割一切，從剛才的例子中也是感受到其實力，并且相比其他RES任務的模型，它取得了當前的SOTA。

至于MVT-VLM，它在圖像理解的實力，可以用下面的例子來展示：

請分別告訴我圖中運動員的性別以及衣服顏色和號碼。

即使圖片中紅衣服的號碼呈現出刁鉆的角度，它也能輕松識別：

那么Glint-MVT還有哪些效果，我們繼續來看。

視頻、具身智能都用上了

首先在分割這件事上，除了圖像之外，Glint-RefSeg也是可以用在視頻上的。

例如給定一段Bruno Mars的唱跳視頻，效果是這樣的：

視頻地址：
https://mp.weixin.qq.com/s/CXEGGF9tJUycreIpPgV98Q

可以看到，不論畫面、角度如何切換，任務要求的“穿粉色西裝的男子”，穩穩地被AI鎖定住了。

而且即使Bruno Mars動作幅度再大、變化再快，也絲毫不影響AI分割的效果，尤其是手部等細微之處，可以說是拿捏得相當到位。

而且除了傳統場景之外，像具身智能這樣的fashion場景，Glint-MVT也是用上了。

例如這樣：

在看完機械臂的操作之后，如果問AI：

把橙子放到白色碗里，（結果是）合適的嗎？請回答是或否。

AI就會根據當前的場景回答：

是。

從種種的效果來看，不得不說Glint-MVT這個視覺基礎模型，基本功是有夠扎實的。

那么接下來的一個問題就是：

怎么做到的？

正如我們剛才提到的，Glint-MVT技術核心亮點，就是把間隔Softmax引入了進來。

具體而言，Glint-MVT采用基于大類別分類的間隔Softmax損失函數進行訓練，通過引入 “類別間隔” 和 “特征緊湊性” 的雙重約束，解決傳統Softmax在大規模分類中語義區分不足的問題。

在此基礎上，格靈深瞳團隊提出了進一步的優化方案。

首先是虛擬類別構造。

團隊利用圖像文本特征聚類技術，將大規模數據集（如LAION 400M）劃分為100萬虛擬類別，替代傳統人工標注標簽，可以高效地提升數據規模。

其次是噪聲抑制與計算優化。

團隊在訓練時僅隨機選取部分負類中心（采樣比例約 10%），如此一來，就可以降低類別間沖突對模型的干擾，同時減少計算量和顯存占用。

相比CLIP的實例對比學習，間隔Softmax通過顯式建模類別間邊界，能讓模型更聚焦語義結構，在圖像檢索、分類等任務上表現更優。

以上就是Glint-MVT效果提升的關鍵，而Glint-RefSeg和MVT-VLM等模型也是基于這個大底座而來。

例如Glint-RefSeg采用MVT v1.1（MLCD）作為核心視覺編碼組件，并融合了大語言模型與SAM解碼器的技術優勢。

這一設計使得模型能夠理解用戶的自然語言描述，并精確識別和分割圖像中相應的目標對象，輸出高質量的分割掩膜。

并且從結果來看，已然是處于業界SOTA：

但格靈深瞳團隊在技術上的動作還遠不止于此。

他們已經將技術錨點鎖定到了更復雜的多模態大模型和視頻理解方面，而且也即將推出相應的模型：MVT v1.5和MVT v2.0（Video）。

視覺領域的精耕者

除了技術上的創新，格靈深瞳之所以能夠在視覺基礎模型上有如此的突破，團隊的發展，也是關鍵因素之一。

格靈深瞳可以說是國內計算機視覺領域的早期探索者，從2013年起便始終專注于視覺技術的研發與落地。

從早期的安防、金融行業解決方案，到如今聚焦視覺大模型與多模態技術，其技術演進始終圍繞一個核心：讓AI真正解決產業痛點。

這次發布的Glint-MVT就是對這句話非常好的詮釋。

因為它并非單純追求學術指標，而是通過提升下游任務（如分類、檢測、分割）的能力，為實際應用場景賦能。

由此可見，即便進入大模型時代，格靈深瞳依舊沒有盲目追逐參數規模和噱頭，而是堅持“從業務需求中來到產品落地中去”的研發邏輯。

與此同時，格靈深瞳還是一家主動擁抱開源，但拒絕跟風的企業。

它的開放策略目標非常明確，正如CEO吳一洲強調“回到初心，能貢獻什么就貢獻什么”，通過充分的開放和分享，期待能激發更多社區伙伴的創新，從而形成創新互哺的良性循環，伙伴越聚越多，技術越玩越強。她在公司里也鼓勵團隊“勇敢點”、“浪一點”。她認為當下技術迭代快，但也更加進入了深水區，要更加擁有直面技術和應用本質的勇氣。

再如格靈深瞳算法研究院院長馮子勇，在2016年博士畢業之后，便加入格靈深瞳。

他帶領的格靈深瞳靈感實驗室，聚焦于視覺及相關模態特征表達與應用。主要研究方向有視覺基礎大模型、多模態大模型、圖文多模態表征、大規模分布式訓練等。

馮子勇主導了多項關鍵算法的技術攻關，特別在“人臉識別與聚類算法技術”以及“視頻解析算法技術”等專業領域取得了顯著成就。

例如在銀行場景中，實現了倒地檢測在上萬路攝像頭下實際使用，獲得客戶高度認可。相關技術在國際賽事中表現優異，還斬獲了OpenFAD2023人體動作識別競賽和首屆SkatingVerse花樣滑冰動作識別競賽雙料冠軍。

他所帶來的年輕化思維與豐富實踐經驗顯得格外寶貴。

而在格靈深瞳的身上，我們或許還能看到大模型時代發展的一個縮影——

既需要頭部玩家，也離不開格靈深瞳這樣的精耕者。

格靈深瞳堅持從場景中提煉技術、以開源回報生態的路徑，或許正是AI落地“最后一公里”的關鍵解法。

AI技術已從通用探索進入垂直深耕階段，不同企業需要像“打仗”一樣各司其職，找準自己的軍種角色，比盲目擴張更重要；格靈深瞳更像是“特種兵”，通過視覺基礎模型為下游任務提供訓練支持。

這種務實與開放并存的哲學，或許正是格靈深瞳在視覺長跑中持續領跑的密碼。

Glint-MVT體驗地址：
https://glint-mvt.com

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦

熱點推薦

論壇報名已啟動，速來鎖定席位！解碼具身智能模型革命

機器之心Pro 2025-05-23 16:23:24
0 跟貼 0
智能體大爆發，騰訊要怎么做？

虎嗅APP 2025-05-23 01:25:21
0 跟貼 0

19歲少年「破解」谷歌新AI？每秒1479 token，擴散再戰GPT!

新智元 2025-05-23 18:15:53
0 跟貼 0

華為的三個黑科技，要顛覆AI計算？

虎嗅APP 2025-05-23 18:12:08
1 跟貼 1
AI輔助編碼帶來思維方式轉變：從人寫代碼到人審代碼

量子位 2025-04-18 17:04:43
0 跟貼 0

谷歌Veo3可生成有聲視頻！告別默片時代！

量子位 2025-05-21 18:25:12
0 跟貼 0

垂直小模型精準補位，MVP驗證成本更低更高效了

量子位 2025-04-21 14:49:47
0 跟貼 0
Flowith Neo或成AI新生黑馬，全球首款無限Agent來了

量子位 2025-05-21 21:15:31
0 跟貼 0

宇樹科技G1機器人展示武打動作：算法升級任意動作任意學

財聯社 2025-02-25 23:59:43
0 跟貼 0
下個萬億美元市場！老黃：人形機器人要落地

量子位 2025-05-19 20:06:49
0 跟貼 0
Codex效果網友實測：12分鐘搭好一個AI業務

量子位 2025-05-21 21:15:33
0 跟貼 0
騰訊混元圖像2.0一手實測，毫秒級響應

量子位 2025-05-18 12:49:08
0 跟貼 0
一經發布就火爆全網 Flowith Neo或成AI新生黑馬

量子位 2025-05-21 21:20:33
0 跟貼 0
傅里葉人形機器人在商湯技術交流日展區展示實時視覺能力

智東西 2025-04-11 14:25:09
0 跟貼 0
大模型正在打破教育領域的“不可能三角〞

量子位 2025-04-17 19:02:09
0 跟貼 0
人人都能做開發者！連小學生都能輕松上手的0代碼開發平臺來了

量子位 2025-04-15 11:59:12
0 跟貼 0
最強編碼模型Claude4，24小時暢玩寶可夢

量子位 2025-05-23 19:24:47
0 跟貼 0
AI正大大降低動漫等虛擬內容制作門檻

量子位 2025-04-25 14:16:10
0 跟貼 0
o3/o4-mini實測太炸裂：看照片反推定位

量子位 2025-04-17 22:23:17
0 跟貼 0
研發自動化的初衷是讓每一個研究員都有Agent助理

量子位 2025-04-23 08:05:00
0 跟貼 0
Claude 4登陸Amazon Bedrock，交付最強編程模型，加速企業Agents開發

智東西 2025-05-23 21:09:26
0 跟貼 0
大模型月級迭代下，金融AI Agent如何平衡創新與風險合規

每日經濟新聞 2025-05-19 23:01:58
0 跟貼 0
每周3000萬人在看的動畫竟由AI制作？解密背后團隊和制作過程

智東西 2025-05-23 22:41:49
0 跟貼 0
激光雷達是個偽命題？買車到底應該選純視覺還是激光雷達

優視汽車 2025-05-23 15:54:36
0 跟貼 0
印度宣稱擊落巴基斯坦戰機，配圖像摩托車的發動機，怎么回事？

張斌說 2025-05-21 11:34:34
1 跟貼 1
新一屆 “35歲以下科技創新35人” 中國區名單正式發布

DeepTech深科技 2025-05-23 22:22:18
0 跟貼 0
美國政府暫停哈佛大學招收國際學生資格

央視新聞客戶端 2025-05-23 07:05:20
10836 跟貼 10836
RSS 2025|物理驅動的世界模型PIN-WM:直接從視覺觀測估計物理屬性

機器之心Pro 2025-05-23 10:43:02
0 跟貼 0
理想汽車全系標配激光雷達，頭部車企開卷“安全”賽道

雪豹財經社 2025-05-23 12:05:11
15 跟貼 15
黃楊鈿甜父親涉及的7億景區開發項目未招到投資商？官網多份文件顯露端倪

揚子晚報 2025-05-23 07:06:58
10120 跟貼 10120
百年前后的地位變化

楊軼 2025-05-22 13:54:32
10212 跟貼 10212
女子買房辦不了按揭，被開發商拒退124萬首付款？雙方回應

封面新聞 2025-05-23 00:26:05
7040 跟貼 7040
中國大壩改寫巴基斯坦國運！印度慌了這技術我們沒有

領略非凡 2025-05-23 04:03:51
4 跟貼 4
「WHYLAB」為什么我們的手機屏幕越來越“暖”？

WHYLAB 2025-05-19 19:30:31
1 跟貼 1
《異度神劍3》程序化資產生成大幅減少了工時

3DM游戲 2025-05-23 21:51:12
0 跟貼 0
005號航母模型曝光，排水量或將迎來升級，超越福建艦

深度解析熱點 2025-05-23 02:36:19
0 跟貼 0
“模型”也能站C位？馬來西亞航展“殲10”展臺現場擠爆了！

AI次世代 2025-05-22 21:00:19
1 跟貼 1
為什么救生衣總是橙色的？

爆笑搞笑配音 2025-05-22 16:00:51
0 跟貼 0
創業黑馬：公司天啟大模型已經適配Deepseek大模型

每日經濟新聞 2025-05-23 17:38:39
0 跟貼 0
基礎科學有多燒錢？科學家：動輒上百億元，而且不一定有成果

一飲山河 2025-05-20 09:40:13
1 跟貼 1

反華機構承認了：好感度全球比拼中國碾壓美國!

反華機構承認了：好感度全球比拼中國碾壓美國!

看看新聞Knews

2025-05-23 16:27:20

文某一把火，燒掉老板所有心血，也燒毀了自己的一生，值嗎？

文某一把火，燒掉老板所有心血，也燒毀了自己的一生，值嗎？

界史

2025-05-23 10:40:45

震驚！中國尋親網將于7月15日起停運，關閉服務器，公司將注銷…

震驚！中國尋親網將于7月15日起停運，關閉服務器，公司將注銷…

火山詩話

2025-05-23 19:00:18

巴鐵損失慘重？印媒稱擊毀17架戰機，誓言讓全世界看清印大勝真相

巴鐵損失慘重？印媒稱擊毀17架戰機，誓言讓全世界看清印大勝真相

說天說地說實事

2025-05-23 20:55:38

美聯儲！降息，大消息！

中國基金報

2025-05-23 00:11:57

爭四強！女單全體抗日，最難的不是王曼昱而是孫穎莎，理由有三

爭四強！女單全體抗日，最難的不是王曼昱而是孫穎莎，理由有三

海闊山遙YAO

2025-05-23 13:15:44

員工疑為800元燒廠后續，已被刑拘，企業注資2.6億，幕后老板被扒

員工疑為800元燒廠后續，已被刑拘，企業注資2.6億，幕后老板被扒

葡萄說娛

2025-05-23 15:22:25

李嘉誠公司出事兒了！

鈞言堂

2025-05-23 20:48:42

世乒賽亂套！女雙世界第一出局，國乒已丟1冠，中國女將2-4被淘汰

世乒賽亂套！女雙世界第一出局，國乒已丟1冠，中國女將2-4被淘汰

知軒體育

2025-05-22 22:27:29

24歲女幼師當街被刺身亡！遇害時正和母親視頻通話，受害者家屬申請再對兇手做精神鑒定

24歲女幼師當街被刺身亡！遇害時正和母親視頻通話，受害者家屬申請再對兇手做精神鑒定

揚子晚報

2025-05-23 14:25:54

善惡終有報？體面了一輩子的國家一級演員奚美娟，在70歲人設崩了

善惡終有報？體面了一輩子的國家一級演員奚美娟，在70歲人設崩了

白面書誏

2025-05-23 14:13:16

農村的表哥40歲了，他不抽煙，不喝酒，為人安分守己，依然沒結婚

農村的表哥40歲了，他不抽煙，不喝酒，為人安分守己，依然沒結婚

人情皆文史

2025-05-22 16:34:55

河南省委決定，派出6個督導組

政知新媒體

2025-05-23 22:43:17

A股午盤跳水原因找到了！銀行也跳了，比亞迪新高，巴菲特踏空了？

A股午盤跳水原因找到了！銀行也跳了，比亞迪新高，巴菲特踏空了？

看財經show

2025-05-23 17:10:17

朱媛媛骨灰已撒入大海，遺產全部捐給癌癥兒童，不給女兒和丈夫！

朱媛媛骨灰已撒入大海，遺產全部捐給癌癥兒童，不給女兒和丈夫！

來條娛吃

2025-05-22 21:58:15

官方通報鳳陽縣鼓樓樓宇瓦片大面積脫落調查處置情況：鳳陽文旅局長等2人被免職

官方通報鳳陽縣鼓樓樓宇瓦片大面積脫落調查處置情況：鳳陽文旅局長等2人被免職

界面新聞

2025-05-23 20:07:19

國務院新規：6月1日起機關事企拖欠款不得超過60天逾期按日萬分之五計算違約金

國務院新規：6月1日起機關事企拖欠款不得超過60天逾期按日萬分之五計算違約金

閃電新聞

2025-05-23 13:56:53

四川宜賓“800哥”火燒紡織廠，警方發布通報知情人透露驚人信息

四川宜賓“800哥”火燒紡織廠，警方發布通報知情人透露驚人信息

小人物看盡人間百態

2025-05-23 10:39:26

哈佛近7000名國際學生往哪兒去？

哈佛近7000名國際學生往哪兒去？

每日經濟新聞

2025-05-23 14:38:31

街道辦回應任賢齊祖宅翻修：他捐款修路、為家鄉做貢獻，村民自發籌款修繕表感激

街道辦回應任賢齊祖宅翻修：他捐款修路、為家鄉做貢獻，村民自發籌款修繕表感激

魯中晨報

2025-05-22 17:40:02

追蹤人工智能動態

10542文章數 176151關注度

往期回顧全部

科技要聞

特朗普：iPhone不在美國制造就收25%關稅

頭條要聞

美媒最新披露：馬斯克在特朗普核心圈地位顯著下滑

頭條要聞

美媒最新披露：馬斯克在特朗普核心圈地位顯著下滑

體育要聞

臺下掌聲一片！65歲安帥揮手告別：感謝皇馬

娛樂要聞

趙麗穎否認戀情，與趙德胤沒在一起？

財經要聞

特朗普威脅自6月1日起對歐盟征收50%關稅

汽車要聞

續航720km/充電10分鐘補能500公里理想i8信息曝光

態度原創

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

旅游

數碼

房產

健康

軍事航空

旅游要聞

熱聞|清明假期將至，熱門目的地有哪些?

數碼要聞

掌靜脈識別VS人臉識別VS指紋識別：華為智能門鎖 2 Pro安全又便捷

房產要聞

連續17次提前交付！海口這座頂流紅盤，業主贏麻了！

唇皰疹和口腔潰瘍是"同伙"嗎？

軍事要聞

朝驅逐艦下水事故最新調查結果公布

© 1997-2025 網易公司版權所有 About NetEase | 公司簡介 | 聯系方法 | 招聘信息 | 客戶服務 | 隱私政策 | 不良信息舉報 Complaint Center | 廉正舉報 | 侵權投訴

無障礙瀏覽進入關懷版主站蜘蛛池模板：门头沟区| 白山市| 五台县| 荥经县| 广东省| 招远市| 恩平市| 肃北| 南和县| 西丰县| 铜山县| 临潭县| 扎赉特旗| 怀安县| 公主岭市| 图木舒克市| 广饶县| 乐陵市| 望都县| 滦南县| 全州县| 双江| 阿克陶县| 商水县| 牙克石市| 鸡西市| 宣城市| 长垣县| 台东县| 客服| 武胜县| 法库县| 光山县| 普宁市| 望城县| 玉环县| 海阳市| 肇源县| 荥经县| 卓尼县| 兴宁市|

<abbr id="bw4rv"><center id="bw4rv"></center></abbr>

<em id="bw4rv"></em>

<abbr id="bw4rv"></abbr>