高考原始計分與標(biāo)準(zhǔn)計分的邏輯比較
2017-01-20 11:22:12中國教育報文章作者:張磊 姜孟瑞
《國務(wù)院關(guān)于深化考試招生制度改革的實施意見》指出,2014年啟動考試招生制度改革試點,2017年全面推進。2017年已至,對于新一輪高考改革,萬眾囑目。高考的重要性無論怎么說都不過分,所以國家、社會、學(xué)校、家庭和個人始終高度重視高考,對高考中的一些重要問題也倍加關(guān)注。比如,高考中通常把各學(xué)科原始分數(shù)簡單相加作為高考成績,如果在選考科目中采用標(biāo)準(zhǔn)分數(shù)制度,是否有助于實現(xiàn)擇優(yōu)錄取的目的?筆者對此提出自己的看法,供大家討論。
高考原始計分的邏輯基礎(chǔ)
高考原始計分是將各學(xué)科原始分數(shù)直接相加所得結(jié)果,即通常意義上的高考成績,是我國現(xiàn)行高考制度最主要的一種計分方式。一般是各學(xué)科分別依據(jù)評分標(biāo)準(zhǔn),判定每份試卷的原始分數(shù)。然后將每位考生各門學(xué)科的原始分數(shù)直接相加作為高考成績,是高校從高分到低分依次錄取學(xué)生的依據(jù)。
或許很少有人懷疑,把上述所得高考成績作為高校錄取依據(jù)的科學(xué)性、公正性與合理性。其實原始分數(shù)不僅意義不明確,比如,無法判斷96分是“好”還是“差”,它可能是考生團體的第一名,也可能是倒數(shù)第一,所以無法判斷它在團體中所處的位置是高還是低。而且,由于不同學(xué)科試題難度存在差異,會造成不同學(xué)科的單位分值不相等,甚至同一學(xué)科的每一分值一般也不相等。因而,將各學(xué)科原始分數(shù)簡單相加作為高考成績,如同把3個蘋果與4只梨相加,問等于多少?難以解釋。以這樣獲得的高考原始計分作為高校錄取依據(jù)的科學(xué)性令人質(zhì)疑,擇優(yōu)錄取的可能性也值得推敲。故有必要理清怎樣才算“優(yōu)”,怎樣才能把真正的好學(xué)生選拔出來。
高考作為選拔性考試,具有鑒別功能。簡單說來,原始分數(shù)是把每位考生的答題情況與評分標(biāo)準(zhǔn)進行比較的結(jié)果,兩者越符合得分越高,否則越低。這樣各學(xué)科原始分數(shù)只代表每位考生答題情況與評分標(biāo)準(zhǔn)的符合程度。而高考作為選拔性考試,其擇優(yōu)錄取的依據(jù)是建立在考生之間差異比較的基礎(chǔ)上的,所謂“優(yōu)”實質(zhì)上是指考生群體中排名靠前的那些學(xué)生。因而高考作為選拔性考試,特別強調(diào)考生之間差異的判別,這與新課程強調(diào)過程性評價、倡導(dǎo)發(fā)展性評價的理念并不矛盾。高考鑒別不同能力傾向、區(qū)別不同程度學(xué)生的功能,不僅依然存在,或許有必要進一步加強,以便最大限度地為每一個人提供最適合發(fā)展的機會,真正體現(xiàn)教育的公平與公正性。
高考標(biāo)準(zhǔn)計分的邏輯基礎(chǔ)
為滿足選拔性考試對考生比較的目的,在關(guān)注個別考生成績的同時,有必要進一步考查每門學(xué)科考生成績的排序或分布情況。不過由于原始分數(shù)不等值,直接把各門原始分數(shù)相加后,按總原始分數(shù)從高到低進行排序(如通常所做的那樣),也顯然不具備科學(xué)基礎(chǔ)。
高考成績的正態(tài)分布性質(zhì) 研究表明,人的能力包括記憶能力、推理能力、語言表達能力等,常常遵從正態(tài)分布。就是說,能力超強和極低的人都很少,能力中等的人最多。一般而言,當(dāng)某個變量受許多個微小、相互獨立的因素影響時,往往表現(xiàn)為正態(tài)分布。比如,學(xué)生的品德或?qū)W習(xí)能力就受許多因素影響,如學(xué)生的智力水平、家庭狀況、個人努力程度、社會環(huán)境、班級風(fēng)氣、校園文化風(fēng)格、教師教學(xué)水平、教學(xué)方式方法等,都會影響學(xué)生的品德或?qū)W習(xí)能力。然而在這諸多因素中,沒有哪一個因素能對學(xué)生品德或?qū)W習(xí)能力起決定性作用,甚至每一個因素的影響可能都微不足道,但又不可缺少。這時學(xué)生的品德或?qū)W習(xí)能力就一般服從正態(tài)分布規(guī)律。自然,當(dāng)試題能真實反映學(xué)生的實際狀況時,考試成績的分布也呈正態(tài)分布。這時分數(shù)極高和極低的都很少,中間的占據(jù)絕大多數(shù)。
高考分數(shù)呈正態(tài)或接近正態(tài)分布,對錄取工作的科學(xué)化、公平性至關(guān)重要。比如若題目太難,各種程度的考生都不會做,成績集中在低分端;或題目太簡單,考試成績集中在高分端。分布偏離正態(tài)、成績扎堆,使考生的實際水平難以被區(qū)分開來,錄取的公正性難以保證。
為了滿足高考這類選拔性考試對考生進行區(qū)分的要求,參閱《教育統(tǒng)計分析方法》,人們依據(jù)考生成績呈正態(tài)或接近正態(tài)分布的特點,將原始分數(shù)(用X表示)轉(zhuǎn)換為標(biāo)準(zhǔn)分(記為Z),兩者之間的關(guān)系為:Z=(X-μ)/σ。其中μ是某一學(xué)科的平均分,即通常意義上所說的平均成績;σ是標(biāo)準(zhǔn)差,代表該學(xué)科成績分布范圍的大小,越大成績分布范圍越廣,越小成績分布范圍越窄。根據(jù)《教育統(tǒng)計分析方法》所附的正態(tài)分布表,每一個標(biāo)準(zhǔn)Z分數(shù)與它在團體中所占的位置或比率具有一一對應(yīng)關(guān)系。當(dāng)成績分布呈正態(tài)時,在Z=-3(比平均分低3個標(biāo)準(zhǔn)差)到Z=3(比平均分高3個標(biāo)準(zhǔn)差)之間就包含了全部考生的99.73%。這意味著,成績正態(tài)分布時,無論是比平均分低3個標(biāo)準(zhǔn)差還是高3個標(biāo)準(zhǔn)差,都很少見。
考慮到標(biāo)準(zhǔn)分Z不僅有正有負,而且不符合人們計分習(xí)慣,于是在標(biāo)準(zhǔn)分數(shù)Z的基礎(chǔ)上,利用Z'=αZ+β(α、β均為常數(shù))的線性變換,演化出多種形式的標(biāo)準(zhǔn)分數(shù)。最早使用較多的標(biāo)準(zhǔn)T分數(shù),定義為:T=10Z+50。這樣不僅能避免負分數(shù)情況,也能大致符合人們百分制的計分習(xí)慣。我國現(xiàn)行標(biāo)準(zhǔn)分制度規(guī)定:T=100Z+500,T的取值范圍為100—900,超出者分別以100和900計。分析標(biāo)準(zhǔn)分的特點,當(dāng)Z=1時,代表成績高于平均分1個標(biāo)準(zhǔn)差;Z=2,則代表成績高于平均分2個標(biāo)準(zhǔn)差……說明標(biāo)準(zhǔn)分具有等距性質(zhì),而且各門學(xué)科都有相等的含義,能直接相加(或者依照不同學(xué)科在高考中的權(quán)重做加權(quán)平均)作為高考總成績,從而在根本上解決了原始分數(shù)不能直接相加減的問題。同時標(biāo)準(zhǔn)分還能準(zhǔn)確刻畫成績在團體中的位次,比如Z=2,表明比該考生成績高的人數(shù)不足全體考生的2.3%,這顯然是一個排名很靠前、很好的成績?梢,基于各門學(xué)科考生成績的排序或分布狀況,將原始分轉(zhuǎn)化為標(biāo)準(zhǔn)分,消除了原有各個學(xué)科的量綱,體現(xiàn)了學(xué)生在群體中的相對位置,標(biāo)準(zhǔn)分數(shù)均以標(biāo)準(zhǔn)差為單位,將不同學(xué)科的分數(shù)統(tǒng)一到一個單位上來,從而實現(xiàn)可以直接相加的功能,而且每一個考生的標(biāo)準(zhǔn)分都能準(zhǔn)確表征該考生成績在團體中的位次,即能準(zhǔn)確反映成績的好與差,從而為擇優(yōu)錄取提供了科學(xué)、公正的依據(jù)。
高考原始分數(shù)與標(biāo)準(zhǔn)分數(shù)的比較
綜上所述,按照標(biāo)準(zhǔn)分錄取時,能真正達到擇優(yōu)錄取、分類錄取的目的,充分實現(xiàn)高考錄取工作科學(xué)、公平、公正的要求。實踐表明,按照原始分和標(biāo)準(zhǔn)分兩種方式進行錄取,確實會產(chǎn)生不同結(jié)果。
例如,甲、乙兩名考生在某選拔性考試中,各學(xué)科成績?nèi)鐖D表所示。若以原始分數(shù)作為錄取依據(jù),當(dāng)錄取分數(shù)線是300分或者兩名考生中只能有一人被錄取時,應(yīng)錄取甲生(306分),而乙生(297分)落選。但將甲乙兩名考生各科考試的原始分數(shù)轉(zhuǎn)化成標(biāo)準(zhǔn)分以后,則錄取結(jié)果恰好相反。
這其實不難理解。第一,原始分數(shù)的每一單位,不僅不同學(xué)科不相等,甚至同一學(xué)科的每一分值也并不相等。因此,直接將原始分數(shù)相加缺乏科學(xué)的依據(jù)。第二,原始分數(shù)不能體現(xiàn)它在考分總體中的位次,但標(biāo)準(zhǔn)分恰好能反映這一點。如,甲生英語成績的標(biāo)準(zhǔn)分為0.40,意味著比甲生的英語成績高的考生占34.46%;而乙生英語成績的標(biāo)準(zhǔn)分為2.20,說明比這一分數(shù)高的考生僅占1.39%?梢,標(biāo)準(zhǔn)分正是通過每個考分在全體考分中的位次來表征優(yōu)劣,故又稱為相對分數(shù)。
早在1994年,國家教委辦公廳針對各科命題難度不同,導(dǎo)致各科原始分數(shù)之間不能直接比較,造成分數(shù)解釋上的困難等問題,發(fā)布了《普通高等學(xué)校招生全國統(tǒng)一考試建立標(biāo)準(zhǔn)分數(shù)制度實施方案》,到1997年陸續(xù)推廣到海南、河南、陜西、廣東、山東、福建等省。2001年只有海南和廣東兩省堅持使用標(biāo)準(zhǔn)分。2002年教育部不再支持標(biāo)準(zhǔn)分試點。使用標(biāo)準(zhǔn)分,一方面對命題提出嚴峻挑戰(zhàn),不僅題目偏難或偏易,都會出現(xiàn)偏離正態(tài)分布的情況,甚至標(biāo)準(zhǔn)差過大(成績分布范圍過大)或過小(成績分布范圍過。,也都可能使成績的分布偏離正態(tài)特性,使原始分數(shù)轉(zhuǎn)換為標(biāo)準(zhǔn)分數(shù)難以實現(xiàn)。另一方面,當(dāng)人們不能準(zhǔn)確理解標(biāo)準(zhǔn)分的含義時,也會對標(biāo)準(zhǔn)分的實施產(chǎn)生抵觸情緒。
我們在近期一項調(diào)查中發(fā)現(xiàn),接受以往高中會考“要符合正態(tài)分布”的教師占到33.3%;認為標(biāo)準(zhǔn)分數(shù)與原始分數(shù)相比“沒有本質(zhì)差別”的教師也有16.7%。這意味著,使人們深刻理解并廣泛接受標(biāo)準(zhǔn)分,可能還要經(jīng)歷一個較長時期。