封面题字: 杨 辛
主办单位:北京大学
顾 问:王义遒 林钧敬 张 彦
编委会主任:陈宝剑
副主任:陈占安 徐善东 王逸鸣
户国栋
委 员(以姓氏笔画为序):
王天兵 王艳超 冯支越 匡国鑫
孙 华 关海庭 陈建龙 刘 卉
刘海骅 宇文利 吴艳红 李 杨
陈征微 金顶兵 查 晶 祖嘉合
夏学銮 蒋广学 霍晓丹 魏中鹏
刘书林(《思想理论教育导刊》常务副主编)
杨守建(《中国青年研究》副主编)
彭庆红(《思想教育研究》常务副主编)
谢成宇(《学校党建与思想教育》社长)
屈晓婷(《北京教育(德育)》副主编)
夏晓虹(《高校辅导员》常务副主编)
周文辉(《学位与研究生教育》社长)
李艺英(《北京教育(高教)》社长)
郑 端(《思想理论教育导刊》编辑部主任)
陈九如(《高校辅导员学刊》副主编)
毛殊凡(《中国高校社会科学》总编室主任)
主 编:王艳超
编 辑:许 凝 马丽晨 朱俊炜
王 剑 吕 媛 李婷婷
李 涛 侯欣迪 杨晓征
宋 鑫 张会峰 陈秋媛
马 博 陈珺茗 陈 卓
审 校:青年理论办公室
摘要:新时代青年的特质使高校大学生管理面临着来自校内外多方面挑战。一方面,高校作为思想引领与技术创新的前线,更需要将先进理念和科技前沿技术为我所用,力争精准有效培养学生、引领学生;另一方面,新时代大学生价值观趋于多元化,所涉及的问题也越来越复杂,要做好大学生思想政治工作,迫切需要汲取多学科营养,构建更深层的、更紧密合作的多学科协同育人模式,来处理多学科互相杂糅的大学生综合性问题。文章提出了多学科协同育人平台(Interdisciplinary collaborative education platform,简称“i-CEP”)的概念、体系架构和构建方法,说明了构建“i-CEP”是新时代大学生思想政治工作的必然要求和有效途径,建议高校构建“i-CEP”育人体系,不仅有利于在对学生精准画像的基础上利用多学科知识精准施策,将传统思政工作松散型合作变为以数据驱动特征发现为基础的、紧密协作的多学科育人体系,而且能开辟出全新的育人模式:提早发现、精准分析、靠前指挥,以数据和逻辑讲道理、讲故事,引导大学生通过自我的理性思考,自觉接受社会主义核心价值观。
关键词:中华优秀传统文化;医学教育;医学生;文化育人
思想政治工作是“思想影响思想”的特殊工作,要做好大学生思想政治工作,不仅需要辅导员具备很高的政治站位和很强的沟通技巧,更需要交流内容本身的逻辑通达,辅导员要避免自身都没有想明白,就强加给学生一个理念。这就要求辅导员进一步开放思维、勇于探索,有效利用最新科技,融入多学科知识,对问题精准把脉、对学生精准画像、利用多学科知识和大数据平台精准施策,做好有效沟通。在这个大数据与移动互联不断加快数据信息迭代的时代,大学生群体既创造了数据,又深受数据的影响,人生观、价值观趋于多元化,所关注的问题越来越复杂,一些“灰犀牛”和“黑天鹅”事件往往都不是只有单一原因或是可以归于某一特定学科研究范畴,高校要有效管理学生、引领学生也很难归约到单一学科的研究范围内。因此,要加大对学生的认知规律和接受特点的研究[1],做好大学生思想政治工作,需要汲取多学科营养,以处理多学科互相杂糅的大学生综合性问题。教育、组织等研究领域中的跨学科性发挥着极其重要的作用[2]。这一背景下,高校思政工作在不断细化研究领域的同时,一定也呼唤着更多跨学科复合型辅导员的出现,同时迫切需要构建一个统一处理多源异构学生信息的通用数据挖掘平台,在确保学生敏感信息不被泄露的前提下接入海量潜在影响学生决定的公共信息,在一个多学科专家构成的思政导师群体指导下,深度分析并准确预测学生的个人与群体行为,为大学生思想政治工作者提供可定制的数据分析与数据展示,做到真正面向精准引领的学生管理。
本文提出构建多学科协同育人平台(Interdisciplinary collaborative education platform,简称“i-CEP”),在高校建立更加紧密合作的多学科育人模式,为大学生思政工作提供决策支持平台。“i-CEP”是由以下三个要素构成的一个紧密合作的大学生思想政治育人模式:(1)一个多学科专家构成的思政导师群体;(2)一个计算社会科学协同实验平台;(3)一个以多源异构数据驱动特征发现为基础的思想引领育人目标。简而言之,“i-CEP”不是传统松散型的多学科交叉育人,而是一个由多学科专家构成的思政导师群体,在一个计算社会科学协同实验平台下,以一个多源异构数据驱动特征发现为基础的思想引领育人目标,这样一种新型紧密合作的多学科育人模式。
一、构建“i-CEP”是新时代大学生思政工作的必然要求和有效途径
新时代数据的爆炸式增长、广泛应用和巨大数量使得我们的时代成为真正的数据时代。急需功能强大和通用的工具,以便从这些海量数据中发现有价值的信息[3]。当下,青年具有以下两项新的特质:其一,他们是处于人类命运共同体构建中的“地球村”村民,具有更广阔的国际视野、更坚定的国家自信和更扎实的知识技能,是推动中国更加有效参与全球治理的新生力量[4];其二,他们是互联网高速发展和深度渗透进程中的互联网“原住民”,深受开放、平等、协作、快速、分享等“互联网思维”的影响[5]。新时代青年的特质使高校大学生管理面临着来自校内外的各方面挑战,而高校作为技术创新与思想引领的最前线,更需要将先进技术为我所用,力争精准有效地因人施策。
大学生在校数据量充足、类型丰富但冗余少、有明显的时间节点、价值密度较高,且在校期间产生的大量包含其政治观点、心理状态、就业规划、价值取向等特征的信息隐藏在课程选择、时间分配和社交言论中,因此,我们组织多学科专家构成的思政导师群体在一个计算社会科学协同实验平台下,处理多源异构的学生大数据——通过构建这样的“i-CEP”体系,在对学生精准画像的基础上利用多学科知识精准施策,进而实现精准引领。当前,高校学生管理往往依赖学工、教务老师的脑力劳动与表格分析,依托大数据技术的学生管理实践还很少,大部分大数据研究仅停留在思维与意识层面,研究对象多数只针对特殊学生群体如心理疾病、家庭困难等,缺少完整的通用技术体系与成熟的解决方案,更不可能从多元异构大数据精准画像层次为学生培养方案、管理方法的优化提供决策支持。本文提出的“i-CEP”将有效推动高校学生思想政治工作水平的提升,并在大学生价值观研判、群体特征发掘、突发事件预警等多方面发挥积极作用。
“i-CEP”中的“一个以多源异构数据驱动特征发现为基础的思想引领育人目标”不仅有利于改变传统松散型合作育人,围绕数据驱动的特征发现建立更加紧密的协同合作,对症下药、精准施策,而且能开辟出全新的育人模式:以数据讲道理的方式引导大学生通过自我的理性思考,自觉接受社会主义核心价值观;通过以数据讲故事的方式,增强学生“四个自信”。此外,以多源异构数据驱动特征发现为基础的思想引领育人模式非常有助于以人工智能创新发展作为突破口带动多学科交叉互动协同育人,因为用大数据的方式去辅助大学生思政工作的研究,不仅能够让辅导员不被文本所限制而接触到实实在在的数据,更重要的是减少了辅导员自身对思政理论的依赖,减少教育工作者本身带有的逻辑预设或个性特征,减少对学生“贴标签”,直接从数据本身出发,挖掘、探寻学生数据之间可能存在的关联性以及数据中可能蕴含的潜在学生成长规律,间接减少了简单粗暴“观察渗透”①的程度,这不失为大学生思想政治工作手段的创新。
二、“i-CEP”的体系结构和构建方法
本文提出的“i-CEP”计算社会科学平台是一套多源异构数据提取、管理与分析的平台框架,实现了主动学习引导下的海量结构化与非结构化数据的精确提取、统一管理和主动挖掘。该平台基于数据模型、数据组织、负载均衡等大型数据管理系统,提供了支持文本聚类、文本分析、时需分析、关联分析、元数据分析等算法库,其平台体系架构包含六个层面:数据提取、数据管理、算法库、预测模型、专家知识库、领域知识库(如图1所示)
其中的“专家知识库”是由多学科领域专家构建的思政导师特定知识库,其中包含了大学生思想政治工作的若干纲领性、指导性原则,该知识库内容一般以规则的形式定义和表示;“领域知识库”包含多学科领域相关的一般性知识,该知识库可来源于现有通用领域知识库,一般以知识图谱的形式定义和表示;“预测模型功能”支持集成学生信息的综合查询、价值观研判、校园网络热点挖掘、群体事件和突发事件预警、目标人群特征发现、规矩挖掘、影响因素相关性分析、轨迹再现以及内容趋势分析等直接面向大学生思想政治工作的功能,这样一个平台改变了传统松散型的合作教育,使得基于“i-CEP”育人模式从多元异构大数据精准画像层次为精准引领学生提供了决策支持,构建了多学科紧密协同的育人模式,从而有效提升高校学生思想政治工作业务水平。
图1:主动学习引导下的海量非结构化数据精确提取、统一管理和主动挖掘平台
面向大学生思想政治工作研究所使用的数据具有数据量大、类型多样化、需快速处理的特点,同时包含结构化和非结构化数据,现有的传统数据查询和分析处理方式已无法有效存储和处理日益增长的新型学生数据,很难融合新媒体非结构化数据的分析处理,本文“i-CEP”平台开发了混合存储与支撑架构,可以同时支持传统结构化数据和非结构化大数据的管理需求。在“i-CEP”平台构建中常用的研究方法还有:基于联合学习的文本实体提取方法②、知识图谱、智能搜索、网络爬虫、预测模型功能等。
三、“i-CEP”助力大学生精准引领应用举例
(一)大学生价值观研判
立德树人作为高校的中心工作,关键在于教育引导青年大学生树立正确的世界观、人生观、价值观[6]。青年的价值取向决定了未来整个社会的价值取向,而青年又处在价值观形成和确立的时期,抓好这一时期的价值观养成十分重要[7]。因此,高校做好大学生价值观研判工作意义重大,是一项非常重要的工作。本文提出的“i-CEP”平台已在某高校最大教学单位成功应用,已成功发现并引导多名有厌学自杀、网络成瘾倾向的学生回归课堂,重新开启向上向阳的大学生活。
本研究“i-CEP”平台根据对现实世界实体或拓扑结构表达的观点分布来识别大学生意识形态,采用了价值观研判或者叫观点感知知识的图谱(opinion-aware knowledge graph)模型及其在Ideology Detection中的应用方法[8](见图2)。政治学中的Ideology Detection,问题本身是一个观点挖掘的分类问题,人们常常用知识图谱作为模型去辨别,但是准确率不高。研究发现,知识图谱仅能辨识概念与概念之间的联系,Ideology Detection过程中,对每个概念的不同观点都可以作为辨识的重要依据[9]。
图2:观点感知知识图谱模型的构建与应用框架[10]
该模型展示了如何通过将从文本中提取的观点和目标实体集成到现有的结构化知识库中从而构造出观点感知的知识图谱,并展示如何通过图谱上的信息传播来实现学生意识形态推理和学生价值观研判,因此“i-CEP”平台能够帮助辅导员更准确、更及时地理解文本中提到的政治话题以及学生对这些话题表达的观点。
(二)高校毕业生群体特征挖掘
本节基于“i-CEP”平台,针对2004年至2018年这15年间某高校全体毕业生数据进行全样本分析,共涉及毕业生约10万人。本文为挖掘毕业生群体特征,在利用“i-CEP”平台Apriori算法的基础上,引入可解释且直观的经典机器学习算法:使用决策树、朴素贝叶斯方法、K近邻聚类方法、逻辑回归方法、梯度回归决策树、支持向量机这几种方法对就业数据进行数据挖掘,最终发现生源地、院系、成绩、绩点是影响学生是否深造的重要特征,尤其高绩点是选择出国深造学生的重要特征。本文重点介绍出国和创业两个就业现象,特别保留了是否出国与是否创业两个特征项,并向数据离散化。
出国深造学生群体特征。从毕业生学历上看,出国深造本科、硕士、博士各占69.54%、20.81%、9.74%,出国进入企业工作的本科、硕士、博士生各占25%、45%和30%。从学部上看,理学部为出国深造人数最多的学部,占总出国深造人数的42.71%。从性别角度看,不同学部的男女毕业生出国选择差别极大(如图3),选择出国的男性毕业生,理学部和信息与工程科学部较多,共占67.84%;选择出国的女性毕业生,社会科学学部占比最高,为25.28%。相比之下选择出国的毕业生男性多于女性的学部差距由高到低排序为:信息与工程科学学部3倍、理学部2.4倍、深圳研究生院1.6倍、跨学科学部1.2倍;女性多于男性的为:人文学部2倍、社会科学学部1.9倍、经济与管理学部1.4倍。
图3:2004-2018年某高校各学部男女性毕业生选择出国的比例
对出国人群进行进一步特征挖掘,发现出国热情最高的群体(如表1、表2所示)为来自东部地区的理学部女性本科毕业生,其出国比例高达68%,其次为来自东北地区的理学部女性本科毕业生,其出国比例为51%;更进一步,来自东部的生命科学学院的女性本科毕业生(68.6%)与来自东部的物理学院女性本科毕业生(67.98%)的出国热情最高。出国热情最低的毕业生群体为,来自中部地区的社会科学学部和深圳研究生院男性硕士毕业生、来自东部地区的经济与管理学的男性硕士毕业生(见图4、图5、图6)。
表1:热情较高的群体特征表(support>0.001 confidence>0.5)
特征 |
support |
confidence |
lift |
{本科女东部生命科学学院} |
0.002595 |
0.686649 |
3.923354 |
{本科女东部物理学院} |
0.001246 |
0.679775 |
3.884082 |
{本科女东部数学科学学院} |
0.001936 |
0.671429 |
3.83639 |
{化学与分子工程学院本科女东部} |
0.002028 |
0.6633 |
3.789944 |
{本科生命科学学院} |
0.009823 |
0.549856 |
3.141752 |
{本科男东部生命科学学院} |
0.002183 |
0.535354 |
3.058889 |
{女东部生命科学学院} |
0.003192 |
0.529915 |
3.027811 |
{本科男东部数学科学学院} |
0.005148 |
0.52521 |
3.000931 |
特征 |
support |
confidence |
lift |
{男中部深圳研究生院硕士} |
0.012974 |
0.960366 |
1.164102 |
{经济与管理学男东部硕士} |
0.028739 |
0.959436 |
1.162975 |
{经济与管理学女东部硕士} |
0.019132 |
0.956253 |
1.159117 |
{男东部深圳研究生院硕士} |
0.014858 |
0.940678 |
1.140237 |
{女东部深圳研究生院硕士} |
0.012614 |
0.938697 |
1.137837 |
图4:出国热情较高与较低的群体特征贡献关系
图5:出国热情较高群体时序变化图
图6:出国热情较低群体时序变化图
本文进一步使用决策树(81.3%)、朴素贝叶斯方法(73.6%)、K紧邻聚类方法(53.1%)、逻辑回归方法(60.5%)、梯度回归决策树(89.4%)、支持向量机(65.7%)这几种方法对本科毕业生的数据进行了挖掘,发现成绩是影响本科毕业生选择去向最重要的因素:在校成绩决定本科毕业生就业去向,绩点是首要因素,其次是排名。毕业绩点小于3的本科生,鲜有(7.1%)选择国内深造的,选择出国的更少(2.4%);高绩点(>3.6)也是选择出国深造学生的重要特征。名次是另外一个影响毕业去向的成绩因素,极大的影响了毕业生选择国内深造还是国外院校,100名是重要的分界点,排名100名以内的同学主要选择出国,在100名开外但绩点大于3的同学更倾向于国内深造。学分分布能一定程度上反映学生的未来去向:学分分布指的是公共必修课小计、素质通选课、专业必修、全校公选课等的学分情况,他们一方面受到培养方案的限制,另一方面也体现了学生分配给不同方向课业的时间。结果显示计划出国的同学更倾向于选择较少的学分和课业门数,如果一名绩点低于3的毕业生总学分高于140,也很有可能会选择深造。
学生创业群体特征挖掘。大学生创业是当代社会的热点话题,2015年我国连续印发了《关于加快构建大众创业万众创新支撑平台的指导意见》《进一步做好新形势下就业创业工作重点任务分工方案》《国务院办公厅关于深化高等学校创新创业教育改革的实施意见》,足可见国家对于大学生创业的重视。高校作为创业实践的前沿,涌现了大量的创业模板,针对2004年至2018年某高校就业数据,本文提取其中选择毕业创业的学生群体,在原始数据的基础上,通过数据采集技术扩展创业数据集,尤其针对创业企业收集了企查查、百度企业等多源企业数据信息与东方财富网股票信息;在此基础上使用特征发现的方法以及Apriori算法挖掘创业毕业生特征与生源地、专业、学部等在校特征的关系,最终发现毕业生性别与生源地是影响学生创业的两个重要特征。
对创业人群进行特征挖掘,发现来自东部和中部地区生源的创业热情最高;不同性别的毕业生创业热情差别极大,男性创业者远多于女性。创业热情最高的三个群体:来自东部地区的管理学院男性硕士毕业生,来自中部地区尤其是湖北湖南的信息与工程科学学部的男性硕士毕业生以及来自东部地区的信息工程与科学学部的男性硕士毕业生(图7)。
图7:2004—2018年某高校各学部创业人数
四、高校构建“i-CEP”面临的困难
作为公民,大学生有自己的隐私权;作为高校,在管理、服务、引导学生的过程中有对大学生的知情权。大数据技术需要海量的学生数据支持,实践中,隐私权和知情权不可避免地会发生冲突,随着学生个人隐私意识的增强,如何平衡合理管理、有效引导与学生质疑,是高校构建“i-CEP”学生精准引领体系的一个难题。具体困难包括:第一,学生数据保密要求高。学生数据是异常敏感的数据,一方面涉及大量的学生家庭、个人与社会信息,另一方面,对于学校而言是宝贵的数据财富,蕴含着大量可以挖掘的信息。高门槛、高敏感度使得学校在规避信息泄露风险的过程中更容易放弃对学生数据进行挖掘,使得高校领域的大数据应用难有突破。第二,信息壁垒高,数据关联性差。数据挖掘需要依赖海量的数据与丰富的特征,然而学生管理业务较多,当前高校随之而来的是围绕各个业务构建的信息系统,由于管理部门细化,各自厂商设计、数据管理软件结构等问题,关联性较差,形成了各自独立的学生信息壁垒。当出现问题时,各业务领域依赖人力和传输介质沟通,效率低,难以将信息化优势转换为数据优势。第三,大学生隐私意识增强。随着自我意识越来越强烈,当代大学生越来越注重自己的独立人格,保护个人隐私的意识越来越强。因此,高校在利用新技术新模式的同时,也要妥善平衡和处理好以上问题。
作者简介:熊校良 北京大学信息科学技术学院党委副书记 助理研究员
注释
参考文献:
[1]习近平.习近平谈治国理政.第三卷[M].北京:外文出版社,2020.6.
[2]Moirano,R.,Sánchez,M.A.,&Štěpánek, L.,Creative interdisciplinary collaboration: A systematic literature review[J].Thinking Skills and Creativity,35,100626:11.doi:10.1016/j.tsc.2019.100626 (2020).
[3]Jiawei Han, Micheline Kamber, Jian Pei.数据挖掘:概念与技术(原书第三版)[M].范明,孟小峰.译.北京:机械工业出版社,2012.7
[4]曹培杰,余胜泉.数字原住民的提出、研究现状及未来发展[J].电化教育研究,2012(4).
[5]陈宝剑.培养有理想有本领有担当的“圆梦新一代”[J].思想教育研究,2020(5):136-141.
[6]张彦.守正创新推动高校思政工作[J].思想政治工作研究,2020(7):27-29
[7]习近平.青年要自觉践行社会主义核心价值观与祖国和人民同行努力创造精彩人生[N].人民日报,2014-05-05.
[8][9][10]王腾蛟,陈郁馨,陈薇.计算社会科学的兴起与发展[J].中国计算机学会通讯.2018,14(4):10-13.