封面题字: 杨 辛
主办单位:北京大学
顾 问:王义遒 林钧敬 张 彦
编委会主任:陈宝剑
副主任:陈占安 徐善东 王逸鸣
户国栋
委 员(以姓氏笔画为序):
王天兵 王艳超 冯支越 匡国鑫
孙 华 关海庭 陈建龙 刘 卉
刘海骅 宇文利 吴艳红 李 杨
陈征微 金顶兵 查 晶 祖嘉合
夏学銮 蒋广学 霍晓丹 魏中鹏
刘书林(《思想理论教育导刊》常务副主编)
杨守建(《中国青年研究》副主编)
彭庆红(《思想教育研究》常务副主编)
谢成宇(《学校党建与思想教育》社长)
屈晓婷(《北京教育(德育)》副主编)
夏晓虹(《高校辅导员》常务副主编)
周文辉(《学位与研究生教育》社长)
李艺英(《北京教育(高教)》社长)
郑 端(《思想理论教育导刊》编辑部主任)
陈九如(《高校辅导员学刊》副主编)
毛殊凡(《中国高校社会科学》总编室主任)
主 编:王艳超
编 辑:许 凝 马丽晨 朱俊炜
王 剑 吕 媛 李婷婷
李 涛 侯欣迪 杨晓征
宋 鑫 张会峰 陈秋媛
马 博 陈珺茗 陈 卓
审 校:青年理论办公室
摘要:文章通过4个成绩分布模型对大学的7种GPA算法进行检验,发现北京大学与上海交通大学同样是在追求卓越的人才培养目标下,却因为不同的GPA算法客观上产生了不同的激励导向。北京大学更注重鼓励加强基础、淡化成绩,上海交通大学更倾向奖励优秀,并通过拉高低分段的GPA允许学生适度失误。
关键词:GPA算法;平均学分绩点;学生评价;激励导向
一、问题的引入
当前国内外大学普遍采用GPA制度来标识学生课程学习的结果。GPA英语全称是Grade Point Average,国内一般称为绩点或学分绩点。GPA是用以显示学生每门学科学习成绩的质量,以及学业综合成绩质量的一种计算方法。①在美国,GPA以4分制居多,即满分为4.0,60分及格为1,60分以下不及格为0,60到100之间按照一定标准递增。学生某门课的成绩一般是用A、B、C、D以及F(Fail,有的标记为E)等字母来标记为不同的等级。任课老师给出的百分制成绩,都可以通过固定的算法来换算成相应的等级,不同的等级对应不同的GPA。美国高校通用的算法如表1②。
表1:美国大学课程分数、等级与GPA换算表
分数 | 等级 | GPA | 表现 |
91—100 | A | 4.0 | 极佳 |
81—90 | B | 3.0 | 佳 |
71—80 | C | 2.0 | 平均 |
61—70 | D | 1.0 | 差 |
0—60 | E | 0 | 不及格 |
美国的GPA制度在东亚地区也较为广泛地使用。由于历史的原因,中国高校绝大部分都保留了百分制的评分系统,同时又引入了GPA制度,并建立起百分制与GPA的换算规则。不同高校之间的换算规则有一定差异。
目前最流行的换算方式是分段阶梯式,即60到100之间分若干个等级区间,一个区间内的百分制成绩都对应同一个GPA,不同区间呈现阶梯式分布。迥异于国内外绝大多数高校的换算方法,北京大学对2007级及以后入学的本科生的GPA采用一个公式来计算③,GPA=4-3(100-X)2/1600 (X为百分制成绩,60≤X≤100)。北大采用的算法(2007年后)是一个精确式算法,公式的函数图是一条连续平滑曲线,每个成绩都能在曲线上找到对应的值。根据该算法函数,我们可以计算出北大(2007年后)成绩与GPA对应关系如表2。
表2:北京大学百分制与GPA对应关系表
GPA | 成绩 | GPA | 成绩 | GPA | 成绩 | GPA | 成绩 | GPA | 成绩 | GPA | |
60 | 1 | 61 | 1.15 | 62 | 1.29 | 63 | 1.43 | 64 | 1.57 | 65 | 1.7 |
66 | 1.83 | 67 | 1.96 | 68 | 2.08 | 69 | 2.2 | 70 | 2.31 | 71 | 2.42 |
72 | 2.53 | 73 | 2.63 | 74 | 2.73 | 75 | 2.83 | 76 | 2.92 | 77 | 3.01 |
78 | 3.09 | 79 | 3.17 | 80 | 3.25 | 81 | 3.32 | 82 | 3.39 | 83 | 3.46 |
84 | 3.52 | 85 | 3.58 | 86 | 3.63 | 87 | 3.68 | 88 | 3.73 | 89 | 3.77 |
90 | 3.81 | 91 | 3.85 | 92 | 3.88 | 93 | 3.91 | 94 | 3.93 | 95 | 3.95 |
96 | 3.97 | 97 | 3.98 | 98 | 3.99 | 99 | 4 | 100 | 4 |
一般情况下,先根据学生课程考核成绩确定每门课程的学分绩点,然后按各门课程的学分加权计算学生全部课程的平均学分绩点,以此来衡量学生的课程学业表现。北大的GPA算法中,不同的成绩分布会产生不同的平均学分绩点。下面我们将以4个成绩分布的模型为例,探讨这一GPA算法下呈现的不同平均学分绩点结果,及该算法对学生学业表现的评价导向。
前提1:每个学生都希望取得最好的成绩,最理想的是任一学期的课程平均学分绩点为4.0。
前提2:绝大多数学生不可能达到上述理想状态,成绩会呈现高低分布。
前提3:在一个学期内,学生学习能力相对恒定,不发生剧烈变化。
前提4:在一个学期内,学生的总学习时间有限。
假设1:学生在某门课程上投入的学习时间越多,取得的成绩更好。
假设2:学生使某门课的成绩从84分(良好)提升到95分(优秀)的难度要大于从75分(一般)提升到84分。
问题:在一个学期,如何在不同课程间分配时间,来获得最好的平均学分绩点?
模型1:同学A选了10门学分量为1的课程,得到的成绩都是84分,其平均学分绩点为3.52。
模型2:同学B选了10门学分量为1的课程,其中5科95分、5科75分,其平均学分绩点为3.39。
模型3:同学C选了10门学分量为1的课程,其中7科95分、3科70分,其平均学分绩点为3.46。
模型4:同学D选了10门学分量为1的课程,其中7科95分、3科64分,其平均学分绩点为3.24。
制度带来激励,激励引导学习策略。很显然,在该GPA算法下,如果对于某些科目高分但可能会导致在另外一些科目投入的时间不足而拿低分,这种策略不是最优的。最优策略是所有科目平均到“差不多够好”的程度。在确保能达到这一程度的情况下,再考虑更多课程向更高分努力。更何况,根据假设2,把成绩从良好提升到优秀的难度要大于从一般提升到良好。因此,在该算法下,为了取得更高平均学分绩点,模型1是学生最优的策略。
二、一组比较研究
那么,其他大学的GPA算法又会出现何种情形?我们选取加拿大约克大学、美国德州农工大学、台湾大学、清华大学(北京)、上海交通大学和北京大学(2007年前)的6种GPA算法④和北京大学(2007年后)的进行比较。根据公开资料,我们整理出4个模型需要的95、84、75、70、64这5个百分制分数对应的GPA,见表3。
表3:7种百分制与GPA对应关系⑤
约克 | 德州农工 | 台大 | 清华 | 上海交大 | 北大(2007年前) | 北大(2007年后) | |
95分 | 9 | 4 | 4.3 | 4.0 | 4.3 | 4.0 | 3.95 |
84分 | 8 | 3 | 3.7 | 3.0 | 3.3 | 3.3 | 3.52 |
75分 | 7 | 2 | 3.0 | 2.3 | 3.0 | 2.7 | 2.83 |
70分 | 6 | 2 | 2.7 | 2.0 | 2.7 | 2.0 | 2.31 |
64分 | 4 | 1 | 2 | 1.3 | 1.7 | 1.5 | 1.57 |
根据上表,我们可以计算出6所大学4个模型的平均学分绩点,见表4。
表4:7种GPA算法下4个模型的平均学分绩点
约克 | 德州农工 | 台大 | 清华 | 上海交大 | 北大(2007年前) | 北大(2007年后) | |
模型1 | 8 | 3 | 3.7 | 3 | 3.3 | 3.3 | 3.52 |
模型2 | 8 | 3.0 | 3.65 | 3.15 | 3.65 | 3.35 | 3.39 |
模型3 | 8.1 | 3.4 | 3.82 | 3.4 | 3.82 | 3.4 | 3.46 |
模型4 | 7.5 | 3.3 | 3.61 | 3.19 | 3.52 | 3.25 | 3.24 |
我们把4个模型简单分为两类:模型1为“中庸型”模型,模型2、3和4为“偏好分离型”模型,即学生对不同课程之间存在较明显的偏好差异。根据差异的程度,我们可以把2、3、4分别称之为“一般偏好分离型”、“中等偏好分离型”和“高度偏好分离型”。我们通过对这4个模型的平均学分绩点进行比较,可以看出学校的激励导向。“偏好分离型”模型的平均学分绩点高于“中庸型”的,可以视为激励“偏好分离型”,反之视为惩罚,相同或相差甚微视为无差别。激励或惩罚又根据程度分为高度和一般两个档。需要注意的是,这两个档并不是数据上的严格区分,只是根据测算结果主观划定的。
表5:对“偏好分离型”激励机制分类表
高度偏好分离型 | 中等偏好分离型 | 一般偏好分离型 | |
高度激励 | 德州农工、上海交大 | 上海交大、德州农工 | 上海交大 |
一般激励 | 清华 | 约克、台大、清华、北大(2007年前) | 清华、北大(2007年前) |
高度惩罚 | 北大(2007年后) | 无 | 无 |
一般惩罚 | 约克⑥、台大、北大(2007年前) | 北大(2007年后) | 台大、北大(2007年后) |
无差别 | 无 | 无 | 约克、德州农工 |
从表5可以看出,上海交通大学和清华大学对所有偏好分离型都予以激励,德州农工也基本持激励态度,其中上海交大无区别地予以高度激励。约克、北大(2007年前)对中等偏好分离型和一般偏好分离型予以激励,只对高度偏好分离型予以一般惩罚。台大对三个模型有奖有惩。只有北大(2007年后)对所有偏好分离型予以惩罚,其中对高度分离偏好型予以高度惩罚。在激励和惩罚的维度,北大(2007年后)与上海交大的算法基本处在对立面。
三、不同算法背后的激励导向
通过对4个模型的分析,我们以北京大学(2007年后)和上海交通大学这两个处在对立维度的算法进行比较,可以看出这两个算法的不同激励导向。
北京大学(2007年后)的算法鼓励各科相对均衡。这又分为两个层面。第一个层面,得到低分对平均学分绩点的影响很大,因此要付出更大的努力才能弥补。该GPA算法下,63分到76分之间,每差1分,GPA差距较大,大约在0.1。假设某学生修了两门学分量相等的课。其中一门得100分,另一门课得65分,平均学分绩点为2.5。另一位同学两门课都得85分,平均学分绩点3.58。两者相差1.08,这是非常大的差距。因此,该算法鼓励学生不满足于及格的成绩,而是至少努力把成绩提升到相对不错的程度。另一个层面,该算法在进入优秀档后GPA曲线走势平稳,显示对优秀档的激励比较温和,见表6。
表6:北京大学(2007年后)GPA函数图
上海交通大学算法是分段阶梯式算法(见表7),其明显特征是GPA在低分段上涨较快,中间段较为平稳,高分段快速上涨。其中比较明显的是62达到1.7,95达到4.3,而84只有3.3。因此其鼓励偏好分离的倾向非常显著。这种算法下,一方面,学生适度失误是被允许的,后期可以通过持续的高分激励来予以弥补。另一方面,学生满足于“差不多好”是不被鼓励的,政策上激励的是学生努力往高分段冲击,以获取更高的回报。
表7:上海交通大学GPA算法
百分制成绩 | 等级 | GPA |
95-100 | A+ | 4.3 |
90-94 | A | 4.0 |
85-89 | A- | 3.7 |
80-84 | B+ | 3.3 |
75-79 | B | 3.0 |
70-74 | B- | 2.7 |
67-69 | C+ | 2.3 |
65-67 | C | 2.0 |
62-64 | C- | 1.7 |
60-61 | D | 1.0 |
60以下 | F | 0 |
对不同学习策略的激励机制要根据学校人才培养理念来制定。北京大学要培养以天下为己任,具有健康体魄与健全人格、独立思考与创新精神、实践能力与全球视野的卓越人才,上海交通大学要培养具有宽厚、复合、开放、创新特征的高水平、高素质、国际化人才。毋庸置疑,追求卓越是两所学校培养人才的共同目标,而卓越自然也应该是一种学生评价方式。那么,有着同样的评价目标,又何以出现不同的成绩评价导向呢?
学生评价是大学人才培养目标和教育教学理念的直接体现。国内外大学对于学生评价的方式,基本是由学业成绩评价体系和非学业评价体系构成,可以简单统称为综合评价体系。前者容易量化,国内外高校无非通过成绩、等级或GPA制度来标识学生的学业成绩。后者相对不易量化,因很少有大学能设计出一套非常科学的评价制度,而被公认为大学的世界性难题。北京大学官方已正式提出要探索建立学生综合评价体系。在2015年北京大学教学工作会上,时任副校长高松提出要改进学生评价体系,建立多元化、过程化评价和反馈方式。⑦时任教务部部长董志勇提出,要改变课堂考试评价方式,通过增加形式多样的作业和考评,注重过程评价和对学生思维能力的考核。建立立体化的学生学业综合评价体系,改变原有单向度的GPA加权平均体系,对课程难度、研究型学习的深度、思维能力和创造力的训练等予以综合考量。⑧因此,淡化成绩在学生评价中的决定性作用,是学校建立综合评价体系的重要组成部分。在某种程度上,不对高分学生做强化激励,某种程度上起到的恰恰是这种作用。
另一方面,北京大学无论是自1988年提出“加强基础、淡化专业、因材施教、分流培养”的十六字方针,还是2013年提出的“加强基础、促进交叉、尊重选择、卓越教学”的新十六字方针,都把加强基础放到了首要位置。这体现在GPA激励上,就是要求学生在课程学习上不可以仅仅停留在及格的程度,而是把达到一般乃至良好放到了基本要求的高度。
而上海交通大学算法的激励体现了不一样的视角。其特征是更加直截了当。追求卓越就激励卓越,该算法鼓励学生敢于对一些课程投入时间,争取高分,无论这是出于学生自身兴趣还是出于对课程本身重要程度或质量的考虑。对于取得高分的学生,进行更高荣誉的奖励。在追求部分课程高GPA奖励的同时,允许学生适量在少部分课程上失误。适当提高低分的GPA,激发学生的积极性,保持其持续进步的动力和渴望。
四、总结
对学生进行成绩评价的一般原则是,成绩差要惩罚,成绩好要奖励。世界上任何一所大学都遵从这一原则。但如何惩罚,如何奖励,各自做到什么程度,却很有学问,关系到如何引导学生形成不同的学习策略,进而关系到与学校人才培养目标是否契合。制度都有其土壤。GPA制度是美国高校在等级制之外的配套制度,由于等级制在学生评价上过于宽泛,进而引入了把等级转化为GPA的机制来对学生进行更精细的评价。而国内高校普遍采用百分制,这一制度下,评价学生成绩最准确的方式其实就是平均分,即不同科目的学分加权平均分。引入GPA制度是为了国际接轨并进行评价方式标准化。但把百分制转化为GPA的机制却是人为制定的,它不可避免地会涉及到对不同分数段的激励大小问题。即使是为了同一个目标,却意外地衍生出了不同的激励导向。至于哪种激励导向更有利于实现目标,则需要更深入的研究。
① 参见秦海霞:“学分制下高校学生学业综合成绩评价研究”[J],《商情》,2013年第6期,第15页。
② 参见美国国际经济文化交流中心:“美国大学成绩单与GPA的算法”[J],《出国与就业》,2000年第3期,第17页。
③ 《北京大学大学生学籍管理细则》(2007年版),第13条。
④ 笔者从事北京大学本科生海外交流学分转换工作,得以拿到世界各校官方成绩单原件。约克大学和德州农工大学的GPA算法来自两校官方学生成绩单。台大算法见《台湾大学学生成绩评量办法》附表2,清华大学算法见《没有百分制,弱化GPA,我们怎样做学生?》,载于《清华大学清新时报》2015年5月15日,上海交通大学算法见《上海交通大学学分制课程修读管理规定》第二条第一款,北京大学(2007年前)算法见《北京大学大学生学籍管理细则》(2005年版),第13条。
⑤ 数据来源:各校官方成绩单或学生手册。
⑥ 约克因为GPA为9分制,因此7.5与8之间的差异可以视为轻微惩罚。
⑦ 引自2015年12月10日高松在北京大学本科教学工作会上的报告“北大本科教育改革措施”。
⑧ 引自2015年12月10日董志勇在北京大学本科教学工作会上的报告“北京大学本科教育改革总结”。