北京2014年5月27日电 /美通社/ -- 高品质的题库建设是维护考试安全、促进考试公平、提升考试品质和考生体验的根本,是开展考试测评等工作的基础,也是对专业化考试机构和主办方的基本要求。目前,计算机化考试在科学性、公平性、权威性等方面已远远超越传统纸笔考试,而且基于计算机化考试也为采集、分析考试各个环节的数据进而开展大数据分析提供了基础。如何通过数据分析,改进试题内容和表现形式,提升题库质量和考生体验,也成为诸多考试主办方重点关注和研究的领域。近日,ATA 主办的“2014考试理论与测评技术春季研讨会”,邀请了多名考试行业权威专家与70多名来自政府部门、行业协会、高校研究机构的嘉宾,围绕着“基于数据分析的高品质题库建设”的主题,进行了热烈的讨论和分享。
什么样的题库是高品质题库?
建设一个高品质的题库,需要综合考虑试题的难度、区分度、信度、效度。目前,题库建设一般采用两种理论基础作为指导,一种是经典测量理论,它具有模型简单、成本较低的优势,但在可靠性和拓展性上较差,无法支撑大规模的题库。近年来,国际上较为先进的题库建设普遍采用了项目反应理论(Item Response Theory,IRT)作为测量理论的指导。通过对考生答对题目的概率,分析考生的能力和题目在难度、区分度、猜测度上的特征参数,从而帮助主办方更好的改进试题和题库质量。基于 IRT 理论为指导的题库建设,题目参数可以适用于各种测量情景,包括智能化组卷、计算机测试,特别适用于开发计算化自适应测验,题库具有很强的功能可扩展性。
如何提升考生体验,保证考试公平?
考生是考试的主体和根本,一个公平的考试除了为考生创造相对一致的物理考试环境以外,在试题内容和表现形式以及题库的科学性上也充分考虑每个考生个体的因素。例如,如果一份试卷的试题总体的难度是由难至易,这样就会造成考生心理紧张,影响考生的正常发挥,也会影响考生实际的结果,而通过对试题、题库的数据分析则可以发现和杜绝这类问题的出现。
除了试题数量、试题内容、试题难度和试题表现形式之外,还可以通过对考生答题样本和考试结果,以及对考生人数、成绩分布、学历结构、从业年限等数据的分析,发现不同考生对同一道试题和同一套试卷的不同结果。通过对每一道题目的数据分析,可以得出试题本身难度值、区分度、耗时、选项搭配、信度等参数的结论,以帮助主办方更好的提升试题质量;通过对考试整体结果、完成度等的数据分析,可以看出哪些试题表现形式、哪些卷面设计更符合考生使用习惯,多少题量和何种难度设置能起到最理想的筛选效果。
在“2014年考试理论与测评技术春季研讨会”上,ATA 考试测评研究院院长、中国教育测量协会会员、数据分析领域专家刘颖博士和 ATA 副总裁赵曙秋先生分别发表了“题库建设的一般方法和步骤”、“如何通过数据分析提升题库质量”以及“试题表现技术”等主题演讲,并分享了ATA在数据分析、题库建设、试题表现技术和大规模计算机化考试运营等方面的成功案例和经验,与到会嘉宾进行了热烈的互动和讨论。
ATA 大规模考试运营领域丰富的成功经验,以及在考试理论和测评技术等方面始终不断的探索、研究和创新,已逐步形成了一套基于庞大考试和考生数据为支持的理论基础和应用模式。ATA 专业的研究成果、较佳应用实践和典型考试案例,也引起了与会来宾的高度关注和热烈讨论,纷纷表示本次研讨会的内容对于他们在如何提高题库建设品质、创新考试形式等方面,均得到了启发和帮助。
为了推动考试理论与测评技术的不断创新和发展,ATA 作为国内领先的第三方计算机化考试与测评服务供应商,也将通过不定期组织专题研讨会等各种形式,为考试与测评行业的主办方、服务商和各界专家学者搭建一个学习交流、沟通分享的平台。