99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

網易首頁 > 網易號 > 正文 申請入駐

Rice大學團隊揭秘大模型推理中的致命精度陷阱

0
分享至


這項由Rice大學、明尼蘇達大學雙城分校和Adobe公司的研究團隊共同完成的開創性研究,于2025年6月發表在arXiv預印本平臺上。論文題目為《Give Me FP32 or Give Me Death? Challenges and Solutions for Reproducible Reasoning》,有興趣深入了解的讀者可以通過arXiv:2506.09501v1訪問完整論文。研究團隊包括Rice大學的袁嘉藝和胡霞教授,明尼蘇達大學的李昊、丁鑫恒等多位研究者,以及Adobe公司的多位工程師。

想象一下,你精心準備了一道菜,嚴格按照食譜的每一個步驟操作,甚至連調料的分量都精確到克,但每次做出來的味道都不一樣。這聽起來很荒謬,對吧?然而,在人工智能的世界里,這樣的事情卻每天都在發生。當前最先進的大語言模型,即使使用完全相同的輸入和設置,竟然也會產生截然不同的輸出結果。這個令人困擾的現象,正是這項研究要解決的核心問題。

在日常生活中,我們習慣了精確和一致性。比如,當你在計算器上輸入"2+2"時,無論何時何地,答案都是4。但在大模型的世界里,情況卻復雜得多。研究團隊發現,即使是看似最簡單的"貪婪解碼"(也就是讓模型每次都選擇概率最高的詞),在不同的硬件配置下也會產生不同的結果。這就像是同一臺計算器在不同的桌子上計算"2+2"會得出不同答案一樣令人不安。

這個問題的根源隱藏在計算機處理數字的方式中。就像古代商人用算盤計算時,算盤珠子的精度決定了計算結果的準確性一樣,現代計算機也有自己的"算盤珠子"——不同的數值精度格式。目前主流的有三種:FP32(32位浮點數)、FP16(16位浮點數)和BF16(腦浮點16位)。如果把這些比作不同精度的尺子,FP32就像是毫米級精度的工程尺,而BF16更像是厘米級精度的普通尺子。

研究團隊的發現令人震驚。他們測試了四個最新的大語言模型,包括兩個專門用于推理的模型:DeepSeek-R1-Distill-Qwen-7B和DeepSeek-R1-Distill-Llama-8B,以及兩個通用模型:Qwen2.5-7B-Instruct和Llama-3.1-8B-Instruct。在相同的數學競賽題目面前,僅僅因為使用了不同數量的GPU或不同的批處理大小,這些模型的準確率竟然能相差高達9%。更令人驚訝的是,生成的回答長度竟然能相差9000個詞匯!這就像是同一個學生參加同一道數學題的考試,僅僅因為坐在不同的教室里,答案的長短就完全不同。

一、浮點運算的隱秘陷阱

要理解這個問題,我們需要深入了解計算機是如何處理數字的。想象你在做一個復雜的烘焙項目,需要把很多小量的配料混合在一起。如果你有一個非常精確的電子秤,能夠精確到0.01克,那么無論你按什么順序添加配料,最終的重量都應該是一樣的。但如果你只有一個精度較低的秤,只能精確到1克,那么添加配料的順序就可能影響最終的讀數。

計算機處理數字時也面臨類似的問題。在數學的理想世界里,加法具有"結合律",也就是說(a+b)+c應該等于a+(b+c)。但在現實的計算機世界里,由于精度限制,這個等式并不總是成立。研究團隊用一個簡單的例子證明了這一點:當計算0.1加0.2再加(-0.1)時,不同的計算順序在低精度格式下會產生不同的結果。

這種看似微小的差異在大模型中會產生蝴蝶效應。想象一下多米諾骨牌效應:第一張牌的微小偏移可能導致整個鏈條的倒塌方向完全改變。在大模型的推理過程中,早期計算步驟中的微小數值差異會逐步放大,最終導致模型選擇完全不同的詞匯。這種現象在需要長篇推理的任務中尤其明顯,因為推理鏈越長,累積的誤差就越大。

研究團隊深入分析了這種現象的機制。他們發現,當模型面臨兩個概率非常接近的詞匯選擇時,微小的數值差異就足以改變最終的決定。這就像是在天平的兩邊放置幾乎相等重量的物品時,哪怕是一根羽毛的重量都可能改變天平的傾斜方向。在推理任務中,這種情況特別常見,因為復雜的邏輯推理往往涉及多個合理的中間步驟,每一步的選擇都可能影響最終答案。

二、硬件配置的意外影響

更令人意外的是,即使保持所有軟件設置不變,僅僅改變硬件配置也會影響結果的一致性。研究團隊系統地測試了12種不同的運行配置,包括兩種GPU類型(NVIDIA L40S和A100)、兩種GPU數量(2個和4個)、以及三種批處理大小(8、16和32)。結果發現,這些硬件層面的變化會顯著影響模型輸出的穩定性。

這種現象可以用餐廳的比喻來理解。想象一家餐廳有不同數量的廚師和不同大小的炒鍋。即使使用完全相同的食譜和配料,廚師數量的不同(對應GPU數量)和鍋子大小的不同(對應批處理大小)都可能影響最終菜品的味道。這是因為不同的并行處理方式會改變計算操作的執行順序,而在精度有限的情況下,順序的改變就可能導致不同的舍入誤差累積。

研究團隊發現了幾個有趣的規律。首先,使用更多GPU通常會導致更大的輸出變異性,這可能是因為更多的并行計算線程增加了操作順序的不確定性。其次,較小的批處理大小往往產生更高的變異性,這與直覺相反,但可以解釋為較小批次需要更多的序列化處理步驟,累積了更多的舍入誤差。最后,不同的GPU型號即使在相同配置下也表現出不同的穩定性水平,這反映了硬件層面的浮點運算實現差異。

特別值得注意的是,這些硬件相關的因素往往是用戶無法控制的。在實際應用中,研究人員可能因為資源可用性的限制而被迫使用不同的硬件配置,但他們往往沒有意識到這種配置差異會影響實驗結果的可重現性。這就像是科學家們使用不同品牌的天平進行實驗,卻沒有意識到天平精度的差異可能影響實驗結論。

三、推理模型的特殊脆弱性

研究中最令人關注的發現之一是,專門設計用于復雜推理的模型對數值精度問題特別敏感。這些模型被訓練來生成詳細的"思維鏈",就像是在紙上展示完整的數學解題過程一樣。然而,正是這種詳細的推理過程使它們更容易受到數值不穩定性的影響。

想象一個偵探正在破案,他需要按照線索一步步推理。如果在推理過程的早期階段,某個微小的細節被誤解或忽略,那么整個推理鏈都可能偏離正確方向,最終得出完全錯誤的結論。推理模型也面臨類似的困境:在生成長篇推理文本的過程中,早期的一個微小數值差異可能導致選擇了不同的推理路徑,進而影響整個解答過程。

研究團隊通過一個具體的數學競賽題目展示了這種現象。在相同的幾何問題面前,僅僅因為批處理大小的不同,同一個模型生成了兩個截然不同的解答過程。一個版本得出答案是480,另一個版本得出答案是960。更有趣的是,兩個解答過程在前面幾步是相同的,但在某個關鍵點上分叉了,從那以后就走上了完全不同的推理道路。

這種現象的根本原因在于推理模型在每一步都面臨著多個看似合理的選擇。在數學問題中,通常有多種正確的解題方法,每種方法都有其合理性。當數值精度問題導致某些選擇的概率發生微小變化時,模型可能從選擇方法A轉向選擇方法B,而這種轉換會導致完全不同的解答路徑。

四、隨機采樣的雙重困擾

有人可能認為,既然貪婪解碼(總是選擇概率最高的選項)存在問題,那么使用隨機采樣是否能夠避免這些困擾呢?研究團隊的實驗結果表明,情況并非如此簡單。隨機采樣確實引入了預期的隨機性,但數值精度問題仍然會在這種隨機性之上疊加額外的不確定性。

這就像是在一個已經存在自然風的環境中使用風力發電機。自然風代表預期的隨機性,而數值精度問題就像是額外的、不可預測的氣流擾動。這種額外的擾動不僅沒有幫助,反而讓整個系統變得更加不穩定和不可預測。

在隨機采樣模式下,研究人員通常通過多次運行來計算平均性能,這種方法被稱為Pass@K評估。理論上,隨著運行次數的增加,這些隨機變異應該會被平均掉,得到穩定的性能估計。然而,研究團隊發現,當底層存在數值精度問題時,這種平均化過程的效果會大打折扣。數值精度引入的額外方差會與隨機采樣的固有方差混合,使得研究人員需要更多的運行次數才能獲得可靠的結果。

更重要的是,當研究人員報告標準差而不考慮數值精度的影響時,他們可能會嚴重高估模型的真實不確定性。這種混淆會導致錯誤的科學結論,就像是用一把本身就不準確的尺子去測量物體的長度變化,最終得出的變化幅度數據是不可靠的。

五、LayerCast:創新的解決方案

面對這些挑戰,研究團隊提出了一個巧妙的解決方案,他們稱之為"LayerCast"。這個方法的核心思想是在內存效率和計算精度之間找到一個平衡點,就像是設計一個既輕便又精確的便攜式天平。

LayerCast的工作原理可以用一個裝修工人的比喻來解釋。想象一個工人需要處理各種不同精度要求的任務。對于存儲工具(對應模型權重),他使用輕便的工具箱來節省空間,但當實際進行精密操作時,他會臨時取出高精度的工具。LayerCast也是如此:它將模型的權重以節省內存的BF16格式存儲,但在進行實際計算時,會臨時將這些權重轉換為高精度的FP32格式。

這種方法的優勢是顯而易見的。首先,它保持了與BF16相似的內存占用,這對于處理大型模型至關重要。同時,由于所有實際計算都在FP32精度下進行,它能夠提供與全FP32推理相當的數值穩定性。實驗結果表明,LayerCast在穩定性方面幾乎達到了FP32的水平,而內存使用量比純FP32方案減少了34%。

LayerCast的實現相對簡單,這也是它的一個重要優勢。研究團隊將其作為現有推理框架vLLM的一個補丁發布,只需要幾行代碼的修改就能應用。這種易于部署的特性使得研究社區能夠快速采用這種解決方案,而不需要對現有工作流程進行大幅修改。

六、實驗驗證的全面性

為了驗證他們的發現和解決方案,研究團隊進行了極其全面的實驗。他們測試了四個不同的大語言模型,涵蓋了從數學競賽題目到編程挑戰的五個不同數據集。這種廣泛的測試范圍確保了研究結果的普遍適用性,而不僅僅是特定模型或任務的特殊現象。

實驗設計的嚴謹性體現在對多種變量的系統控制上。研究團隊不僅測試了不同的數值精度格式,還考慮了各種硬件配置的組合。這種多維度的實驗設計就像是一個全面的健康檢查,確保沒有遺漏任何可能影響結果的因素。

在數學推理任務中,研究團隊使用了AIME'24和MATH500這兩個具有挑戰性的數據集。AIME'24包含美國數學競賽的題目,而MATH500則涵蓋了更廣泛的數學領域。這些題目的特點是需要多步驟的邏輯推理,正是這種特性使得它們成為測試數值穩定性的理想選擇。

在編程任務方面,研究團隊使用了LiveCodeBench數據集的三個難度級別。編程任務的獨特之處在于它們不僅需要邏輯推理,還需要精確的語法和結構。這種雙重要求使得編程任務對數值精度的敏感性可能與數學推理任務有所不同,因此提供了額外的驗證維度。

七、深度分析:發散現象的解剖

研究團隊不滿足于僅僅觀察到問題的存在,他們深入分析了發散現象的具體機制。通過引入"發散指數"(Divergence Index)這一創新指標,他們能夠精確測量不同運行配置下模型輸出開始分叉的具體位置。

發散指數的概念可以用兩個人沿著同一條路徑行走的比喻來理解。起初,兩個人走的是完全相同的路線,但在某個岔路口,由于微小的判斷差異,他們選擇了不同的方向。發散指數就標記了這個關鍵岔路口的位置。在模型輸出中,這個"岔路口"就是模型第一次為同一個位置選擇不同詞匯的地方。

研究結果顯示,在BF16精度下,超過90%的測試樣本都出現了某種程度的發散,而且發散往往發生在輸出序列的早期階段。相比之下,在FP32精度下,發散現象大幅減少,僅有約2.2%的樣本出現發散,而且即使出現發散,也通常發生在序列的較后位置,對最終結果的影響相對較小。

更細致的分析揭示了發散與模型決策難度之間的關系。研究團隊發現,在推理任務中,模型經常面臨多個概率非常接近的候選詞匯。這種情況就像是在一個非常接近的比賽中進行投票,微小的計數差異都可能改變最終的獲勝者。他們通過分析top-1和top-2候選詞匯之間的概率差距,發現這個差距往往小于數值精度誤差的范圍,這就解釋了為什么微小的計算差異會導致完全不同的選擇。

八、對科學研究的深遠影響

這項研究的意義遠遠超出了技術層面的改進,它觸及了現代AI研究中一個基礎性的問題:結果的可重現性。在傳統的科學研究中,實驗的可重現性是驗證科學發現有效性的金標準。如果其他研究者無法重現你的實驗結果,那么你的發現就會受到質疑。

然而,在AI研究領域,由于計算資源的限制和復雜性,完全重現實驗往往是困難的。研究人員通常依賴于發布的基準測試結果來比較不同方法的性能。但是,如果這些基準測試結果本身就不穩定,那么基于這些結果的科學結論也就變得不可靠了。

這個問題就像是用一把會隨溫度變化的尺子來測量物體的長度。如果不同的研究者在不同的溫度條件下進行測量,他們可能會得出不同的結果,但這種差異并不反映被測量物體的真實差異,而是測量工具本身的不穩定性造成的。

研究團隊的發現表明,許多看似微小的實驗配置差異實際上可能對結果產生顯著影響。這意味著當一個研究團隊報告某種新方法比現有方法性能提升3%時,這種提升可能部分來自于數值精度的差異,而不是方法本身的優越性。這種混淆會誤導整個研究領域的發展方向。

九、實踐建議與未來展望

基于他們的研究發現,研究團隊提出了一系列實用的建議來改善AI研究的可重現性。這些建議不僅具有技術價值,更重要的是它們為整個研究社區提供了一個新的質量標準。

對于那些計算資源充足的研究項目,研究團隊建議使用隨機采樣配合多次運行的方法。這就像是進行多次獨立的實驗來驗證結果的穩定性,而不是依賴單次實驗的結果。在這種情況下,研究者應該報告平均準確率、平均回答長度以及相應的誤差范圍,這樣可以更好地反映模型性能的真實分布。

對于資源受限的研究項目,如果必須使用貪婪解碼進行單次運行,研究團隊強烈建議使用FP32精度。雖然這會增加內存和計算成本,但這種額外的投入是獲得可靠結果的必要代價。或者,研究者可以采用LayerCast這樣的折中方案,在保持合理資源消耗的同時獲得更好的穩定性。

更重要的是,研究團隊呼吁學術界建立新的報告標準。在發表研究結果時,作者應該明確說明使用的數值精度、硬件配置以及其他可能影響可重現性的技術細節。這就像是在科學論文中詳細描述實驗條件一樣,這些信息對于其他研究者重現實驗至關重要。

十、技術細節的深入探討

為了幫助讀者更好地理解這個問題的技術本質,讓我們深入探討浮點數表示的工作原理。現代計算機使用IEEE 754標準來表示浮點數,這個標準定義了如何在有限的比特數內表示實數。

想象你要在一張有限大小的紙上記錄一個非常大或非常小的數字。你需要在精度和范圍之間做出權衡:要么你能表示很大范圍的數字但精度有限,要么你能獲得很高的精度但只能表示較小范圍的數字。浮點數格式就是這種權衡的體現。

FP32格式使用32個比特,其中23個比特用于表示精度(尾數),8個比特用于表示范圍(指數),1個比特用于符號。相比之下,BF16只有7個比特用于尾數,這意味著它的精度遠低于FP32。這種精度差異就像是用不同倍率的放大鏡觀察同一個物體,看到的細節程度會有很大差異。

當多個浮點數進行運算時,舍入誤差會逐步累積。在單次運算中,這種誤差可能微不足道,但在涉及數百萬次運算的大模型推理過程中,累積的誤差就可能變得顯著。這就像是一個微小的測量誤差在重復測量過程中被放大,最終導致顯著的偏差。

LayerCast的創新之處在于它識別了運算過程中的關鍵環節。雖然權重存儲不需要極高精度,但權重之間的運算確實需要高精度來避免誤差累積。這種設計就像是使用精密儀器進行關鍵測量,但用普通容器存儲測量工具,既保證了精度又節省了存儲空間。

這項由Rice大學領導的跨機構研究為我們揭示了AI系統中一個隱藏已久的問題。數值精度看似是一個技術細節,但它對研究結果的可重現性有著深遠的影響。研究團隊不僅發現了問題,更重要的是提出了實用的解決方案,為整個AI研究社區提供了寶貴的指導。

說到底,這項研究提醒我們,在追求模型性能提升的同時,不能忽視結果的可靠性和可重現性。就像建造一座大樓需要堅實的地基一樣,AI研究的進步也需要建立在可靠的實驗基礎之上。LayerCast這樣的解決方案雖然看起來是技術層面的改進,但它實際上是在為整個領域的可持續發展奠定基礎。

對于普通人來說,這項研究的意義在于它提醒我們,即使是最先進的AI系統也不是完美無缺的。當我們使用AI工具時,應該意識到結果可能存在的不確定性,特別是在需要高精度或高可靠性的應用場景中。同時,這項研究也展示了科學研究的自我糾錯能力:當問題被發現時,研究社區會積極尋找解決方案,推動技術向更可靠的方向發展。

對于有志于AI研究的讀者,這項工作提供了一個重要的啟示:關注技術細節往往能夠帶來意想不到的重要發現。數值精度這樣看似枯燥的技術問題,實際上可能影響整個研究領域的發展方向。真正的創新往往來自于對基礎問題的深入理解和系統性解決。

最后,這項研究再次證明了跨機構合作在現代科學研究中的重要性。來自學術界和工業界的研究者們匯聚各自的專長,共同解決復雜的技術挑戰。這種合作模式不僅能夠產生更全面的研究成果,也為技術的實際應用鋪平了道路。有興趣深入了解技術細節的讀者,強烈建議訪問原論文進行更深入的學習。

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
內塔尼亞胡稱與特朗普通話,美以設定共同目標!是否會推翻哈梅內伊?以總理回應!伊朗公布其破壞力最強導彈發射畫面

內塔尼亞胡稱與特朗普通話,美以設定共同目標!是否會推翻哈梅內伊?以總理回應!伊朗公布其破壞力最強導彈發射畫面

每日經濟新聞
2025-06-19 21:41:07
許家印最大靠山,死刑!

許家印最大靠山,死刑!

三農老歷
2025-06-19 08:57:49
網傳京東創始人劉強東視察工作時入住四季酒店,點外賣后豪氣給了騎手1000元小費!還親切地摟著騎手合影

網傳京東創始人劉強東視察工作時入住四季酒店,點外賣后豪氣給了騎手1000元小費!還親切地摟著騎手合影

和訊網
2025-06-19 18:11:44
曝中國三成車企短期資金緊張,比亞迪負流動資產1254億,2026或進入全行業淘汰階段

曝中國三成車企短期資金緊張,比亞迪負流動資產1254億,2026或進入全行業淘汰階段

回旋鏢
2025-06-19 20:37:30
太及時!人民網發聲解釋違規吃喝范疇,引全網怒贊!餐飲業有救了

太及時!人民網發聲解釋違規吃喝范疇,引全網怒贊!餐飲業有救了

娛樂看阿敞
2025-06-19 09:18:16
這棵外強中干的大樹眼看就要倒下了

這棵外強中干的大樹眼看就要倒下了

通往遠方的路
2025-06-18 09:43:26
索羅斯之子與希拉里貼身幕僚結婚,94歲索羅斯提前一天舉辦祝福儀式

索羅斯之子與希拉里貼身幕僚結婚,94歲索羅斯提前一天舉辦祝福儀式

紅星新聞
2025-06-19 19:58:40
男子7萬元買腕表平臺不發貨不退款,萬表網:愿分期退款

男子7萬元買腕表平臺不發貨不退款,萬表網:愿分期退款

澎湃新聞
2025-06-19 15:54:27
暴雷40億!康養巨頭跌落神壇,4萬老人血本無歸!

暴雷40億!康養巨頭跌落神壇,4萬老人血本無歸!

藍色海邊
2025-06-19 05:37:18
汽車屏幕突然彈出廣告,差點出事!這可能導致中國車遭到全球抵制

汽車屏幕突然彈出廣告,差點出事!這可能導致中國車遭到全球抵制

毒sir財經
2025-06-18 23:11:15
18歲身價150萬!王鈺棟刷爆紀錄,亞洲球員排第4,3人身價暴漲

18歲身價150萬!王鈺棟刷爆紀錄,亞洲球員排第4,3人身價暴漲

奧拜爾
2025-06-19 17:54:09
廣東一市委原書記被查!最新通報→

廣東一市委原書記被查!最新通報→

魯中晨報
2025-06-19 22:29:57
網傳央企設計院兩位領導被設計師暴揍!

網傳央企設計院兩位領導被設計師暴揍!

黯泉
2025-06-19 14:13:51
四川17歲白血病男孩去世!臨終哀嚎不想死,曝最大遺憾讓人淚崩

四川17歲白血病男孩去世!臨終哀嚎不想死,曝最大遺憾讓人淚崩

楊哥歷史
2025-06-19 16:35:50
李迅雷:預計2027年我國總人口將跌破14億 鼓勵生育政策具有“功在當代、利在千秋”的效應,應該高度重視

李迅雷:預計2027年我國總人口將跌破14億 鼓勵生育政策具有“功在當代、利在千秋”的效應,應該高度重視

金融界
2025-06-19 20:26:03
央視:足協原本給伊萬買了往返票,但自上而下的力量讓他下課

央視:足協原本給伊萬買了往返票,但自上而下的力量讓他下課

懂球帝
2025-06-19 20:57:14
哪吒汽車正式被申請破產

哪吒汽車正式被申請破產

新京報
2025-06-19 21:45:14
熬夜等伊朗的「大驚喜」?泥石超重型導彈已經改變戰爭格局

熬夜等伊朗的「大驚喜」?泥石超重型導彈已經改變戰爭格局

清游說娛
2025-06-19 11:33:49
互聯網大廠員工,在靜音艙做出不雅行為,女方褲子“不翼而飛”

互聯網大廠員工,在靜音艙做出不雅行為,女方褲子“不翼而飛”

社會醬
2025-06-19 17:44:58
特朗普再度炮轟美聯儲主席鮑威爾為 “蠢人”,不滿其拒絕降息,專業人士:美聯儲不是政府的附庸工具

特朗普再度炮轟美聯儲主席鮑威爾為 “蠢人”,不滿其拒絕降息,專業人士:美聯儲不是政府的附庸工具

魯中晨報
2025-06-19 17:33:14
2025-06-20 00:47:00
至頂頭條 incentive-icons
至頂頭條
記錄和推動數字化創新
12164文章數 49634關注度
往期回顧 全部

科技要聞

羅永浩數字人爆火,可怕的不是5500萬GMV

頭條要聞

美打擊伊核設施計劃披露 特朗普鼓勵以總理"繼續干"

頭條要聞

美打擊伊核設施計劃披露 特朗普鼓勵以總理"繼續干"

體育要聞

22年,云南足球走出了一條自己的路

娛樂要聞

章子怡“吃蛋糕”戲在全網爆火

財經要聞

Labubu黃牛價腰斬 誰會是最后的接盤俠

汽車要聞

5.99萬起/空間大續航長 純電小車凱翼拾月Mate上市

態度原創

手機
房產
親子
公開課
軍事航空

手機要聞

小米紅米新品下周來 新品開箱體驗搶先看

房產要聞

預定爆款!江東CBD+海中,海口這一國企大盤,即將引爆市場!

親子要聞

小葉教我句話還讓我挺意外,原來中外文化差異這么大

公開課

李玫瑾:為什么性格比能力更重要?

軍事要聞

俄羅斯告誡美國不要攻擊伊朗

無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 方城县| 隆化县| 剑阁县| 炉霍县| 兴业县| 茌平县| 和政县| 二手房| 鄂尔多斯市| 犍为县| 横峰县| 凤翔县| 寿光市| 依兰县| 阜宁县| 湖口县| 龙门县| 新兴县| 新田县| 桑日县| 曲靖市| 互助| 扬中市| 内乡县| 高唐县| 贵溪市| 深州市| 夹江县| 凌云县| 蒙城县| 湾仔区| 青海省| 将乐县| 栖霞市| 漳州市| 永济市| 汤原县| 五家渠市| 孟州市| 兴国县| 搜索|