首先,這個東西一定有事實數據,但問題是我接觸不到。這樣的事情有很多,于是我只能用數學手段模擬合理的區間,從而建立自己的信念。希望數學不會騙我。
其次,這類問題一定不要相信身邊統計學,因為你的注意力會騙你。
本文通過簡單的建模說明當至少一半學生的成績離開原本分段的情況下才會呈現出實際觀測的統計分析結果。這變相回答了題目的問題:中考成績能否預測高考成績?我的結論是不能,至少有一半不能
這也回答了之前短文用到的一個假設,高中通過中考成績掐尖優質生源有用嗎?我覺得用處不大。與其去賭一半的概率,不如相信自己的學生。
- 問題抽象
- 模擬結果與討論
- 建模過程
- 箱間交換的情況
問題抽象
中考成績能否預測高考成績,這個問題很簡單,只需要跟蹤每名考生,記錄他的中考、高考成績并作統計分析即可。我沒有渠道獲得這類數據。
我能查到是這樣幾篇文章<高考中考成績相關性研究報告.pdf>,總分的相關系數為
在<高考、中考成績相關性研究報告_王慶燦教育工作室_新浪博客>中,他們得到的結論是
- 1.各學科中、高考成績相關性分析 (1)從總體上看,理科各科中、高考成績屬于實正相關或微正相關,高考總分和中考總分屬于實正相關。 (2)理科高考英語與中考英語、高考數學與中考數學成績屬于實正相關,其中高考英語與中考英語成績的相關程度是這幾科中最高的,接近顯著正相關。 (3)理科高考語文與中考語文、高考化學與中考化學、高考物理與中考物理成績屬于微正相關,其中高考物理與中考物理成績相關性最低,接近不相關。
他們得到的最強的相關性是“實正相關”,那么什么是實正相關呢?實正相關(Substantial Positive Correlation):
- 指兩個變量之間存在統計學上顯著實際意義較強的正向關聯。
- 不僅要求相關系數(如皮爾遜相關系數)為正,還需滿足:
- 統計顯著性();
- 相關系數達到一定強度(通常或更高,具體閾值因學科而異)。
由于他們并沒有給出具體數值,因此有理由認為相關系數值不會超過。
因此,接下來的問題是:學生的排名發生怎樣的變化才能導致這樣的相關系數?也就是問,如果一名同學中考排名在,那么他的高考排名是怎樣的?能否預測?
模擬結果與討論
建模過程
下面開始建模。首先獲取北京中考、高考一分一檔的成績分布。由于分析的范圍是重點高中,因此取頭部名考生作為分析對象。為了模擬某所高中的情況,我采用無放回平均采樣的方法采樣名考生,將他們的分數繪制為下圖。
- 圖中藍色曲線代表中考成績(z),綠色曲線代表高考成績(g),并將它們分別從高到低排列。它們的分布都呈現兩頭陡峭、中間平緩的合理分布,二者的相關系數為。
- 圖中紅色曲線是模擬學生成績發生“交換”的情況。所謂交換就是學生排名次序的變化,即兩次考試之間學生A與學生B的成績發生了交換。
紅色曲線代表“箱內交換假設”,即處于不同成績段(箱)的學生之間不發生躍變,好學生永遠是好學生,差學生也永遠是差學生,他們的名次僅在自己所處的箱內變化。紅色曲線是箱內交換的“最差結果”,即導致相關系數降低最大的結果。此時相關系數降低到。
可見,即使在最差情形下,箱內交換也不會導致相關系數降低過大,這與實際觀測到的事實不符。所以,有理由認為中考成績難以預測高考成績。接下來分析它們的量化關系。
箱間交換的情況
為了找尋怎樣的名次變換才會導致的結果,繼續考慮箱間交換的情況。如下圖中紫色曲線所示,我并沒有改變成績分布,只是將它們進行跨箱交換,交換的尺度()。所謂尺度是指交換名學生數量的成績,圖中是隨機交換學生的成績。可以看到,這種箱間交換對相關系數的影響非常大,使其降低到。
順著這個思路,我進行了大量模擬,模擬中調整值和箱子數量,得到值的分布如下圖所示。
- 首先,總體的規律是箱子劃分越細(越大)則值的動態范圍越大,且時基本收斂。
- 其次,可以看到當交換尺度時,才會觀測到的結果。也就是說,當至少一半學生的成績離開原本分段的情況下才會呈現出實際觀測結果。
也就是說,從隨機模擬的角度來看,目前高中階段至少有一半學生的成績會發生較大變化。我不知道實際情形如何,但若果真如此,在高考決定論的導向下,這無疑會導致大量的學生出現心理問題。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.