99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

網易首頁 > 網易號 > 正文 申請入駐

剛剛,阿里又開源了,超長上下文大模型

0
分享至


大家好,我是Ai學習的老章

阿里又開源新模型了,這次是通義千問文檔團隊帶來的QwenLong-L1-32B——首個通過強化學習訓練、專為長上下文推理設計的大語言模型。

解決的問題是:

大型推理模型(LRMs)通過強化學習(RL)展現出強大的推理能力,但局限于短上下文推理任務,這個 QwenLong-L1 框架,通過漸進式上下文擴展將短上下文 LRMs 適配至長上下文場景。


效果:

在七個長上下文文檔問答基準測試上的實驗表明,QwenLong - L1 - 32B優于OpenAI - o3 - miniQwen3 - 235B - A22B等旗艦大推理模型,性能與Claude - 3.7 - Sonnet - Thinking相當,在當前最先進的大推理模型中表現領先。


框架通過強化學習訓練中的漸進式上下文擴展,增強了短上下文語言推理模型的能力。

該框架包含三個核心組件:用于初始化穩健策略的預熱監督微調(SFT)階段、通過課程引導實現從短上下文到長上下文穩定適應的強化學習階段,以及可調整各階段訓練復雜度的難度感知回溯采樣機制,以此激勵策略探索。借助包括 GRPO 和 DAPO 在內的最新強化學習算法,框架整合了結合基于規則和基于模型的二元結果獎勵的混合獎勵函數,以平衡精確率與召回率。通過在策略優化中策略性地利用群體相對優勢,它引導語言推理模型學習對實現穩健長上下文理解及卓越推理能力至關重要的有效推理模式。


該框架由多個具有漸進式上下文擴展的訓練階段組成。每個階段都針對越來越長的上下文長度,允許模型從短文本熟練度逐漸適應到長文本專業知識。 實際應用

QWENLONG-L1 出自通義千問文檔團隊,感覺最適合的場景還是對上下文要求比較高的幾個場景:

  • 研究和科學發現:處理大量的文獻和數據集

  • 文檔分析:自動分析法律文件、研究論文和報告

  • 知識檢索:跨大型知識庫進行復雜的問題回答


安裝

# Create the conda environment conda create -n qwenlongl1 python==3.10 conda activate qwenlongl1 # clone repo git clone https://github.com/Tongyi-Zhiwen/QwenLong-L1 cd QwenLong-L1 # Install requirements pip3 install -r requirements.txt # Install verl cd verl pip3 install -e . # Install vLLM pip3 install vllm==0.7.3  # Install flash-attn pip3 install flash-attn --no-build-isolation
使用

這個新模型還沒有適配VLLM和SGLang,只能通過transformers運行

from transformers import AutoModelForCausalLM, AutoTokenizer model_name = "Tongyi-Zhiwen/QwenLong-L1-32B" # load the tokenizer and the model tokenizer = AutoTokenizer.from_pretrained(model_name) model = AutoModelForCausalLM.from_pretrained(     model_name,     torch_dtype="auto",     device_map="auto" ) # prepare the model input template = """Please read the following text and answer the question below. $DOC$ $Q$ Format your response as follows: "Therefore, the answer is (insert answer here)".""" context = " " question = " " prompt = template.replace('$DOC$', context.strip()).replace('$Q$', question.strip()) messages = [     {"role": "user", "content": prompt} ] text = tokenizer.apply_chat_template(     messages,     tokenize=False,     add_generation_prompt=True ) model_inputs = tokenizer([text], return_tensors="pt").to(model.device) # conduct text completion generated_ids = model.generate(     **model_inputs,     max_new_tokens=10000,     temperature=0.7,     top_p=0.95 ) output_ids = generated_ids[0][len(model_inputs.input_ids[0]):].tolist()  # parsing thinking content try:     # rindex finding 151649 ()     index = len(output_ids) - output_ids[::-1].index(151649) except ValueError:     index = 0 thinking_content = tokenizer.decode(output_ids[:index], skip_special_tokens=True).strip("\n") content = tokenizer.decode(output_ids[index:], skip_special_tokens=True).strip("\n") print("thinking content:", thinking_content) print("content:", content)

借助大模型,我把這篇文論轉成了PPT,感興趣可以深入看看

方法如下:




















制作不易,如果這篇文章覺得對你有用,可否點個關注。給我個三連擊:點贊、轉發和在看。若可以再給我加個,謝謝你看我的文章,我們下篇再見!

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
別了,馬英九

別了,馬英九

愛下廚的阿釃
2025-06-27 15:49:45
安徽一女子網購5斤荔枝,一口氣剝完后僅退款,網友:氣死了

安徽一女子網購5斤荔枝,一口氣剝完后僅退款,網友:氣死了

大笑江湖史
2025-06-26 17:55:06
央視撤檔僅7天后,人民日報的發文,沒有給易建聯留“一絲體面”

央視撤檔僅7天后,人民日報的發文,沒有給易建聯留“一絲體面”

悠閑歷史
2025-06-27 16:57:31
不想被電車背刺的人,都去搶小米YU7了

不想被電車背刺的人,都去搶小米YU7了

源Auto
2025-06-26 21:57:28
A股重磅改革,ST股將告別5%漲跌幅限制,與主板保持一致!滬深交易所大動作,劍指微盤股連板炒作,ST股炒作邏輯徹底被顛覆

A股重磅改革,ST股將告別5%漲跌幅限制,與主板保持一致!滬深交易所大動作,劍指微盤股連板炒作,ST股炒作邏輯徹底被顛覆

金融界
2025-06-27 18:25:17
83歲蔡瀾去世,在新加坡安葬,無兒女繼承遺產,自曝有61個女友

83歲蔡瀾去世,在新加坡安葬,無兒女繼承遺產,自曝有61個女友

180視角
2025-06-27 17:40:07
正式宣布落選!CBA得分王無人問津,連現場都沒去

正式宣布落選!CBA得分王無人問津,連現場都沒去

德譯洋洋
2025-06-27 12:24:26
伊朗外長:以色列目前擁有90枚核彈頭,除以之外中東其他國家沒有一個擁核;外界估計以色列掌握核武器介于90-200枚之間

伊朗外長:以色列目前擁有90枚核彈頭,除以之外中東其他國家沒有一個擁核;外界估計以色列掌握核武器介于90-200枚之間

揚子晚報
2025-06-27 08:08:24
1棵樹采購價近80萬!福州煙臺山公園“天價樹”調查:已有多棵死亡

1棵樹采購價近80萬!福州煙臺山公園“天價樹”調查:已有多棵死亡

揚子晚報
2025-06-27 10:38:28
蔚來沈斐:看完YU7發布會,可以放心買樂道L60了

蔚來沈斐:看完YU7發布會,可以放心買樂道L60了

三言科技
2025-06-27 13:53:07
山航SC4667航班,飛機故障備降南京

山航SC4667航班,飛機故障備降南京

極目新聞
2025-06-27 20:26:02
史上“最嚴禁酒令”之后,各地深入“查擺”,即將升級為一次變革

史上“最嚴禁酒令”之后,各地深入“查擺”,即將升級為一次變革

17譚
2025-06-27 08:17:53
李尚福烈士家屬可享受哪些撫恤政策?

李尚福烈士家屬可享受哪些撫恤政策?

世界有奇事
2025-05-24 09:30:36
選秀總評:開拓者豪賭楊瀚森全明星潛力C- 湖人向上交易摘阿杜B+

選秀總評:開拓者豪賭楊瀚森全明星潛力C- 湖人向上交易摘阿杜B+

直播吧
2025-06-27 18:58:40
美軍公開B-2駕駛艙,中控換上大屏幕,落后轟-20一個時代

美軍公開B-2駕駛艙,中控換上大屏幕,落后轟-20一個時代

科羅廖夫
2025-06-27 15:02:15
核談判幕后細節首曝光!美政府“開秘密條款”

核談判幕后細節首曝光!美政府“開秘密條款”

大象新聞
2025-06-27 20:15:15
海軍參謀長李漢軍,被罷免全國人大代表職務

海軍參謀長李漢軍,被罷免全國人大代表職務

觀察者網
2025-06-27 17:03:08
小米回應馮某包養200人大瓜,馮某曾是食堂切菜工,因曠工被開除

小米回應馮某包養200人大瓜,馮某曾是食堂切菜工,因曠工被開除

180視角
2025-06-27 15:09:53
開拓者知名球迷網站發布聲明:關于楊瀚森選秀的澄清與立場

開拓者知名球迷網站發布聲明:關于楊瀚森選秀的澄清與立場

羅說NBA
2025-06-27 16:49:52
下半生的社交劇本,Ta告訴你答案

下半生的社交劇本,Ta告訴你答案

Live智
2025-06-27 18:04:57
2025-06-27 21:51:00
機器學習與Python社區 incentive-icons
機器學習與Python社區
機器學習算法與Python
3014文章數 11024關注度
往期回顧 全部

科技要聞

雷軍:小米汽車成功沒靠營銷,靠的是能力

頭條要聞

美國打擊伊朗核設施后 美軍一將領進入特朗普核心圈

頭條要聞

美國打擊伊朗核設施后 美軍一將領進入特朗普核心圈

體育要聞

曼城“庫里”連線,送尤文晚安好夢

娛樂要聞

炸裂!榜一大姐深夜怒錘頂流

財經要聞

合新鐵路建設材料以次充好 多家單位被罰

汽車要聞

配置升級/貴賓座椅 全新GL8陸上公務艙售22.99萬

態度原創

游戲
房產
數碼
藝術
教育

英雄聯盟新英雄蕓阿娜模型圖 溫泉皮有“玉足”

房產要聞

最強黑馬殺出!海南這些區域,教育正悄悄崛起!

數碼要聞

極摩客 EVO-X2 AI 桌面主機圖賞:輕巧緊湊,銳龍AI Max+ 395加持

藝術要聞

故宮珍藏的墨跡《十七帖》,比拓本更精良,這才是地道的魏晉寫法

教育要聞

昌平感知覺統合培訓班結業式暨鞏華中心小學一體化生態課間研討會

無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 渝中区| 莎车县| 平阳县| 酉阳| 堆龙德庆县| 台中县| 潍坊市| 双柏县| 额敏县| 托克托县| 长乐市| 潜山县| 茌平县| 织金县| 黑龙江省| 彭泽县| 桐城市| 邳州市| 平潭县| 肃宁县| 木里| 大渡口区| 邛崃市| 江陵县| 新蔡县| 鹤峰县| 即墨市| 呼玛县| 景东| 碌曲县| 安岳县| 漳浦县| 阳曲县| 德令哈市| 双桥区| 盐山县| 舞钢市| 桦甸市| 青海省| 建德市| 泸水县|