当前位置:求学问校网(武汉培训网) » 论文:化学教学测量和评价

按字母查成语词典A|B|C|D|E F G|H|J|K|L|M|N|O|P|Q|R|S|T|W|X|Y|Z
在线新华字典按偏旁部首查询汉字 | 按汉字拼音查询汉字 | 五笔字根查询
工商管理论文 | 工学工业论文 | 社会艺术论文 | 理学医学论文 | 语言教育论文 | 计算机论文
» 论文阅读

化学教学测量和评价

化学教学测量和评价是化学教学过程的一个基本环节,是对教学质量做出质和量的全面检测与科学估量的过程。

第一节 化学教学测量和评价的意义

为了全面地检查、评估化学教学质量,不断改进教学工作,从教与学的动态活动及相互作用的结果中获取供决策用的反馈信息,化学教学测量和评价在教学中是起核心作用的一环。

化学教师的教授活动效果如何,教学目的和目标的达成度怎样,教学决策中有哪些 成绩和缺陷;学生的学习水准和准备状态如何,学习能力养成得如何,学习的意向和志趣培养得如何,学生在学习中有哪些薄弱环节;以及师生间对教学的目的和目标、教学内容、教学方式等在认识上有哪些不和谐的问题需要调整等等。所有这些问题,都需要借助于化学教学测量和评价,从质与量、从内容、过程与结果,给出科学的检测、判断和结论。

化学教学测量在学校里常见的形式是测验。化学教学测验是指运用科学的测量方法,对学生学习的知识、能力与效果进行检查,然后进行客观比较,以判定教师的教学效果的一种活动。在教育和教学实践中,测量和评价这两个概念是相伴而生的。测量的概念率先产生,但仅仅测量、搜集数据,而不给出价值判断,这样的测量将是徒有其名,不说明任何问题的。应当说,测量①的主要任务是提供客观的数量化及非数量化的信息,这些信息本身并不能自动揭示其教育教学涵义,而评价乃是系统地搜集信息,对客体进行价值判断的过程。化学教学评价,正是从教学目标的角度,对化学教学测量和测验所提供的数量化的资料及通过观察等所获得的质的分析的资料作出解释,从而对教学工作达到预期目标的程度做出价值判断的过程。

换句话说,化学教师总是要以教学测量为手段,经过分析、综合,进行判断,以得知自己的或他人的教授活动与学生的学习行为的状态,进而与教学目标和教学要求相对照,获取准确具体的结构;学生作为积极主动的认识主体,也总是要努力以教学目标和学习要求为标尺来评判自己的学习结果与进展。由此可见,教学测量与教学评价是紧密相连的。仅有测量,不进行评价是没有意义的,而要评价,就必须进行量和质的分析,或称为量和质的描述或记述。

现代的评价,既注重提供数量结果的测量技术,又注重只提供非数量化资料的观察、陈述的技术,使两者做到结合互补。

总之,化学教学测量和评价在化学教学系统中具有编级(或分组)、反馈、诊断、升级和职业指导等多种功能。

第二节 化学测验的类型及其功能

化学测验是检查化学教学质量和教学效果与效率的基本途径。测验与系统观察相比,具有可以从量和质两方面对教学这一客体做出全面评测的优点。

我们都了解,教育教学这一复杂的特殊的社会实践活动,不同于一般的自然事物和对象,它除了具有可以直观地、直接观察和测量的方面(特征、性质),如教学流程中的时间、空间以及师生形体活动等以外,师生间的信息、情感交流,以及师生交互作用在心智里产生的增益效应等等,均难以直接测量。这就需要我们确定并把握测量教育教学这一客体的尺度。一般言之,各种教育教学事物大体上都具有共同的“度”①,即本质(要探求学生能知道些什么事实)、数目(要探求学生能知道多少事实)、组织(要探求学生如何组织这些事实)、时间(教师要时常关注学生的某种行为已历时多久)、速度或速率(学生学习行为的熟练程度的表征)、次数和错误(学生写100个字,错了多少个)。以上是就认知或动作技能领域而论的,对于情感领域的测量,尚应另立标度。

为了测量化学教学可以采用测验、评定量表、观察记录等方 法。这里重点讨论测验这种方法及其功能。

测验的类型很多,从实施的形式上划分,可以分为口头测验、书面测验及实验操作测验;从测验的编制划分,有标准化测验和教师自编测验;从评价的标准划分,有常模参照测验和标准参照测验;从试题的性质划分,有客观测验、论文式测验及实验操作测验;还可以根据测验在教学过程中的作用,划分出准备性测验、形成性测验和总结性测验。

这些测验的名目和功能各异,但均应遵循以下准则①:

(1)要准确、全面地理解化学教学的目的和要求,测验和评价应包括:学生的知识、理解和思维、技能和能力、态度和方法等方面的内容。

(2)要确定一套(按年级、单元)具体的教学目标,按学习进程,循序地实施测验和评价。

(3)要充分认识测验与评价对教学的影响和作用;要重视选择教学测验的环境,帮助学生获得应试的学习经验。

(4)要慎重选择测验的内容和形式,命题要简明严谨,难易适度,题型搭配、编组要恰当。

(5)要拟定评定计划;评定既要适合总的培养目标的要求,又要适合化学学科本身的教学目标。

(6)测验和评价均应有计划地进行;平时宜培养学生自我检查、自我评价的能力。

(7)要严格控制测验次数;要力争校内、校外测验的协调一致。

(8)测验命题宜实行集体编审制,以防止个人决断的偏颇。

以下分4个方面讨论各类测验的基本特征和功能。

一 标准化测验与教师自编测验

标准化测验是一项系统工程,是由专门的测验机构主持的科学化的测量工作。它主要用于测验能力或能力倾向、成就水平或 者用作诊断、预测和监控标准。所谓标准化,包括试题编制的标准化、施测过程的标准化、评分记分的标准化、分数合成的标准化,以及分数解释的标准化等①。推行标准化测验,可以避免测量尺度不明确和对测量结果解释的偏颇不当,从而造成测量失准低效。

标准化测验要有考试指导书,明确规定:考试(测验)的范围、内容、要求、方式、题型以及评分和计分方法;测验命题要标准化,严格遵照考试大纲或教学大纲制定命题双向细目表,规定每一个测试目标与内容在整份试卷中的比重;每一试题要经过预试或调试,选出效度高、信度高、区分度高和难度适当的好题,进行组卷;测验的实施过程要统一而有规范,施测时间、环境和进程必须统一,应试者作答的要求、阅卷步骤和评分标准必须严格规定。由于标准化测验具有试题取样范围大、题量多,覆盖面宽,又经过预测,保证了“四度”的要求,从而能较真实地测出学生的学习成绩。

概括起来,实行标准化测验有四点好处②:

(1)减少无关因素对测验目的的影响,使测量准确可靠;

(2)使不同的测验分数具有可比性;

(3)同一套测验有多个复本可以反复使用,较为经济;

(4)可用来校准其他测验。

美国化学会与美国理科教师协会编订(分年编订)的高中化学测试方案是用于能力测验的标准化测验,我国近几年来开展的高等学校入学考试中的标准化考试,以及高等学校专业基础课程试行的标准化考试,均属于测验学生潜在的学习能力和学习成就水平的测验。

教师自编测验是教师根据教学需要,随时自行设计和编制的测验。这种测验应用范围较窄,仅适用于本校,难以与校外测验相比较,也难以保证达到测验“四度”的要求,但却具有编制简捷、施

测手续简便的优点。

二 常模参照测验与标准参照测验

常模参照测验的重要特征是,以学生团体测验平均成绩作为评定学生成绩的参照标准,把学生团体的成绩划分出等级,以该生在群体中所处的等级位置来判定他的成绩优劣。常模参照测验的主要目的是测量考生的个别差异。在上面讨论过的标准化测验,通常是指常模参照测验。实行分组(能力分组)教学时也要用到这种测验。

常模参照测验的基本假设是,学生群体的学业成绩是按正态曲线分布的。

与常模参照测验相对立的标准参照测验,或称目标参照测验,是以教学目标为标准来检测学生的学业成绩。评定方法是把每个学生的成绩与教学目标作比较,而不计较学生个人之间的差异。标准参照测验的标准是根据未来的工作或学习的要求建立起来的。在检验一个学生的成绩是不是合格时,应严格地实施标准参照测验,这是学科学习期末考试和毕业考试的特征。在实践中,许多教师根据自己的教学情况,按照学生的普遍的学习水平来命题,以完成期末考试的做法,是不符合标准参照测验的主旨的,因为,这种降格以求的测验,学生的得分并不能表明他们的真正的学业成绩,自然也不能说明教师教学的效能和得失。实际上,教师又在实施一种常模参照测验。

从1993年起,全国各省、市、自治区(台湾省、西藏自治区除外)开始实行的高中各科的毕业会考,就是由各省代表国家实施的一种标准参照测验。可见,在毕业会考中,那种随意降低命题标准或评分标准的做法是不妥当的。这样,就从根本上损伤了基础教育高级阶段的合格标准,以虚假的成绩向社会各行各业输送不尽合格的人才,影响我国社会主义现代化的前进步伐。

三 准备性测验、形成性测验和总结性测验

准备性测验,或称安置测验,俗称摸底测验,是教师实施教学 前,或接手一个新年级开始教学前实施的一种测验。这种测验的目的,主要是查明学生的学习准备状态,测试学生已经具备了哪些知识和技能,以利于决定施教的基点,或作为分组教学的一种依据。准备性测验以获取学生学习准备状态的多方面的信息为目的,测验后的评分,如不实行分组教学,则无关紧要。这种测验往往在学生不进行测前准备的情况下进行,所获得的信息,不宜随意公开评述。在教学过程中,有针对性地进行分类指导或目标教学,会从准备性测验中受益良多。

随着教学过程的进行,为了及时把握学生的学习水平,多借助于形成性测验。形成性测验是为教学进程直接服务的,主要目的在于检测学生知识和技能的进步与发展,以及时取得教学的反馈信息。随堂检查性的小测验、单元测验等均属于这类测验。教师要善于从中发现问题,以巩固既有成果,针对教与学中的缺陷,采取补救教学,以达到教学目的和教学要求。

化学教学进入一个学习阶段的末尾,或者进入本学科结束阶段,就要进行总结性测验,以检测学习的效果,从而评定学生学习成绩等等。总结性测验多属于标准参照测验,以按照教学目标这一标准来评定学生的学习成绩。

四 客观测验、论文式测验与实验操作测验

客观测验系指测验试题可以客观地评分,不因评分者的不同而影响评定结果。标准化测验中选择题、是非题和匹配(配伍)题等试题,均为客观测验试题。其中,尤以多项选一型的客观试题被广为采用。这种试题的主要优点①是:

(1)能快捷地测试课程的广泛内容;

(2)可以在测试领域内广泛取样;

(3)可用于大型测试,并可以可信地给予评定;

(4)测试的内容、范围和水平是明确的,可以进行统计处理 和分析;

(5)可用于班级、课程研究或整个学校系统的比较研究。

选择题的主要缺陷①是:

(1)仅能测试重现课程内容,难以评定高层次的认知水平;

(2)不能确证学生是怎样推理得出结论的,也不能测试学生的论点是怎样符合逻辑思维而发展的;

(3)使学生完全被动地答卷,且可以猜测,可以胡乱选项。

论文式测验是借助论文试题来测试学生分析问题和解决问题的能力,以及文字表达能力。这类试题可以让学生表述自己的见解,或分析比较、申述说明,或论证评述、畅述己见。论文式测验仅需要组编少量试题,命题工作较易组织实施。正由于此,这类测验的缺点也相伴产生。一是题量小,覆盖面窄,难以对整个课程内容进行测试取样;二是试题往往容易失之于不明确或含糊不清;三是测试的内容深度和范围较难以划定界限;四是评定时难以把握标准答案,评分常因人而异,随意性较大。故而常将论文式测验列入主观测验一类,因这类测验的评定受阅卷人的偏爱、情绪、态度等主观因素的影响甚大。

实验操作测验是化学课程中特色独具的一类测验。一般侧重于测试学生的态度和实验操作技能与水平,如对实验目的、反应原理的理解,使用和组装仪器的技能,以及对实验过程和实验结果的解释等。实验操作测验对于突出和发展化学教学的特征、对于养成学生动手动脑的学习能力,具有重要的导向作用。欧洲诸多发达国家,有近1/4的国家在中学结业前实行化学实验操作测验②,我国少部分重点中学也试行实验操作考,已从多方面发挥出这类测验的教学效益。自然,实施实验操作测验,要有相应的设施条件和评定规范作为保障,尤其需要教师贯彻先进的教学质量观,自愿承受较繁重的工作负担。

第三节 编制化学测验的主要依据——化学教学目标

化学教学目标是编制化学测验的主要依据,而化学教学目标是根据化学教学目的,结合教与学的要求,而具体规定的可供检查、测量的质量指标体系。这些规定,要具体写出学生经过学习最终会完成的任务,向他们指明具体的学习要求;还要结合学生的认识规律,明确规定具有实际可测、具体可行的教与学的质量指标或检查项目。从教育测量学的角度看,教学目标——用作编制测验的主要依据必须满足如下4条标准①:

(1)目标应该叙述清楚;

(2)应该对照评价方案的实施情况检验目标,以编制一份适用的测验;

(3)目标应该反映出方案欲达到的技能掌握的水准;

(4)目标应该具有高度的优先性。

化学教学目标的划分和界定,是化学教育测量和评价专门研究的课题。从国际上看,学术界公认美国心理学家布卢姆(B.S.Bloom)等提出的教育目标分类学最有影响。布卢姆等专家将一般教育目标分为认知、情感与动作技能三大领域②,我国学者主张,化学教学目标一般要体现出知识传授、能力培养和思想教育三个方面的具体要求③。

美国化学教育界采用的按照布卢姆等专家的主张给出的认 知领域的教学目标①为:

(1)知道。包括这样一些行为和情境:强调记忆(再认或回忆)过去学过的信息。

①特定事物的知识。术语和事实。

②方法和手段的知识。处理特定事物:惯例、趋势和顺序,分类和类别、准则、方法论。

③学科领域中普遍原理和抽象概念的知识。原理和概括、理论和结构。

(2)领会。包括了解知识的意义,能够用不同的术语意译来回忆,联系其他经验,解释它的意义和用术语的意义来

扩展它的领域和顺序。

①转化。用不同术语意译某种观念的能力,给出实例、解释图表、说明符号的相互关系等。

②解释。了解主要观念和了解它们之间的关系。

③推断。扩展信息以包括其他可能的意义。

(3)应用。应用知识和能力解决新的、不熟悉的情境:用知识去推理,去说明或预测在新情境下将会发生什么。在这一水平上,科学更多地变成学术练习。

(4)分析。将一个观念分解成它的组成并表明了解各组成之间的关系。所有学科都强调分析能力,把它作为该学科功能的重要方面。

①要素分析。利用对恰当的事实和假设的了解。

②关系分析。识别和利用证明与假说之间,证明与结论之间,逻辑谬误、原因与效果之间的关系等。

③组织原理的分析。

(5)综合。将事实、原理、理论等要素组合到新的模式里。

①进行独特的交流。写出一种完全的概括、描述或评价等和(或)进行其他交流。

②制定计划或提出操作定向。选择检验假说的方法。

③推导出一套抽象关系。在现象分析的基础上形成假说。

(6)评价。考察和应用准则去估量证明,得出结论并做出关于理论、技术、研究等的判断。

①依据内在证据来判断。察觉谬误和应用逻辑推理。

②依据外部准则来判断。利用规定的或强加的标准来评价和得出结论。

我国学者在认知领域的学习水平分类已开展了较多的探索。其中,以北京市朝阳区中学化学教学目标课题研究组制定的化学学习水平,及广东省化学标准化考试研究室制定的考试目标较具有代表性。这两者均对布卢姆等人的教育目标分类作了变通调整;国外学者也有类似情况。

例如,英国学者丹尼尔斯(D.J.Daniels)等将认知领域的教学目标改并为回忆、理解、应用、分析和综合。新西兰的一个教育家小组,在制定新学校证书方案时,于每一单元中将教学目标列为3组:(1)科学家取得的重要知识;(2)科学家工作的方法;(3)科学的社会意义。英国学者弗拉泽(M.J.Frazer)教授认为:对化学教师,以下三目标分类方案可能是有感染力的。这些目标是:(1)知道和了解;(2)技能,含智力技能如解释问题和解决问题和操作技能如使用仪器;(3)态度。

我国制订的《九年义务教育全日制初级中学化学教学大纲(试行)》(1992年),对知识和实验技能的教学要求,从教学论和测量的角度作了规定,并具体列述了各知识点和技能项。现将这份教学大纲规定的教学要求录下。

对知识的教学要求分为四个层次,从低到高依次是:

常识性介绍:对所学知识有大致的印象。

了解:知道“是什么”。能够记住学习过的知识的要点,能够根据提供的材料识别是什么。

理解:懂得“为什么”。能够领会概念和原理的基本涵义,能够解释和说明一些简单的化学问题。

掌握:能够“应用”。能够分析知识的联系和区别,能够综合运 用知识解决一些简单的化学问题。

对实验技能的教学要求分为两个层次:

练习:在教师的指导下,进行实验操作。

初步学会:在教师的指导下,能够正确地进行实验操作。

应当指出,以上教学要求是从我国各省市文化教育发展水平相差较大,就当前实施义务教育而规定的必须达到的基本要求,某些省份、某些学校完全可以,也应当“超标”完成上述教学要求,而不应受这些规定的限制。

情感领域的教学目标分类,怎样才能做到既要明确规定具体的教学活动期望达到的行为状态,为教学活动指明方向,又要规定学生在教学活动之后以可测量的方式表现出来的行为标准,这是一个亟待研究的课题。克拉斯沃尔(D.R.Krathwohl)等人提出情感领域可分为:接受、反应、估价、组织、个性化五种水平。但施测不免仍有难度。

我国学者有人认为①:情感教育属于德育的范畴,它既有线性的规律,又有非线性的无序性。从而提出:情感教育目标的检测和评价,应该从可比性和模糊性两方面着手,并设计了这两方面的目标评价系列。应当承认,在这一领域的实践经验仍有待于不断开拓。

化学教学目标的理论框架确定之后,可以按照知识(或技能)内容和学习水平双向分类来设计化学教学目标,以利实施。即(1)划分出适当的教学单元;(2)确定单元内每个知识点(或技能项)的学习水平。表述形式,不拘一格,可以采用文字叙述式或双向表格表示式。

第四节 有效化学测验的条件

化学测验的内容,因评价的目的不同而异。平时的校内测验与达标测验的要求和内容不同,升级(或分班)测验与选拔测验也是如此。但是,无论是上面讨论过的哪种测验,都应当保证测试的科学性,尽量减小测量误差,做到有效、可信,具有一定的难度和区分度。可以说,达到“四度”——效度、信度、难度和区分度的要求是有效测验的必要条件,也是最基本的要求。

一 效度

效度(Validity)是指测验在多大程度上测量了预定所要测量的内容。效度是用相关系数来表明的。在施测后,将测验分数与已举行过的受试者接受的其他测验(如标准化测验)的结果作比较,从而计算出相关系数。

求出的相关系数(γ)值越高,表明所编制的测验准确性越大。一般标准化测验的效度系数在0.4—0.7之间。效度系数最大等于1,表明测试完全反映了所要测验的内容;最小等于-1,表示测验结果与受试者的实际水平完全相反。实际上,这种完全相关(或正、或负)的极端情况是很少发生的。当效度系数等于零的时候,表示测验结果与所要测量的内容无关。

上面讨论的是经常采用的测验的内容效度,即指测验题目对有关课程内容或行为范围取样的适当性。测验是根据教学目标编制的,试题内容涵盖了教师讲授(学生学习)的课程内容,这样,这个测验就具有一定程度的课程内容效度。

一般采取以下办法,以提高测验的效度。

(1)测验的内容和范围,要包含教与学的主要内容;

(2)测验试题中要尽量把跟测验目的无关的成分去掉;

(3)测验试题的难度要适当;

(4)评定和记分的标准要客观、统一。

二 信度

信度(reliability)是指测验结果的一致性或稳定性。信度指标通常用相关系数表示。信度是测验的一致性的估计,效度是对测验的准确性程度的估计。应当说,测验的效度是最重要的,而测验的信度对于效度来说是必不可少的,效度的高低受信度的制约。所编制的测验若信度越小,则其效度也就越低。

常用的估量信度的方法有3种,可相应地求得3种信度:再测信度、复本信度和分半信度。

信度系数最大等于1,表示测验完全反映了受试者的稳定水平;最小等于零,表示受试者的得分完全是随机性的,与他们的知识水平无关。一般学业成绩测验要求信度系数在0.9左右,常会达到0.95。

提高测验信度的主要办法是:

(1)测验试题的覆盖面要宽



(2)测验的方法和时间必须严格统一,测验的评定和记分的标准必须客观、统一;

(3)测验试题的难度要适当,指导语要明确、清晰;

(4)消除受试者的紧张心理,增强他们对测试环境的适应性,使他们发挥应有水平。

三 难度

难度(difficulty)指测试项目的难易程度,是测试工具对受试者知识与能力水平适合程度的指标。

在能力或非能力测验里,难度的指标是答对或通过每个项目的人数百分率(P值),即:

P代表项目的难度;

R为答对或通过某一项目的人数;

N为全体受试者人数;

P值越大,测验项目的难度越低;P值越小,难度越高。

测验试题的难度必须适当,一般以难度为0.3—0.8为宜。只有难度适当,方能保证测验试题具有较高的区分度。若难度过大,全体受试者都不能回答。难度过小,又形成全体受试者都能回答,两者都会降低测验的区分度,从而影响测验的效度和信度。

四 区分度

区分度(discrimination)是表示测验项目对受试者水平的鉴别能力的指标,故也称为鉴别力。区分度常从3种测验中体现出来:一是难度测验,这是最常用的一种测验;二是速度测验;三是广度测验。通常学业成绩测验,多含有这三种测验的性质。测验项目的区分度高,对受试者有较好的鉴别力,使程度高的学生得高分,程度低的学生得低分;区分度低的测验则不能有效地将程度不等的受试者区别开来。

区分度可以用相关系数计算,或采用简单的计算方法①。区分度值最高为1,表示测验项目对受试者的能力水平有完全的鉴别力;最低值为零,表示测验项目与受试者的能力水平无关。测试后,应淘汰区分度低的测验试题。标准化测验优秀试题的区分度常在0.40以上,区分度在0.29以下的试题则予淘汰,或经过改进后,再进行测试。

总之,良好的测验除应具备测量的正确性和测量的可靠性这些基本特征外,还应当具有:客观性、易于管理、易于记分和易于理解、实施,测验分数易于解释等特点。

第五节 化学测验试题的类型和试卷的编制

一 化学测验试题的类型

测验试题的类型是为测验目标服务,并受所测验的内容制约的。

英国专家曾把测验试题划分为七种类型①:

(1)正误型。让学生判断正确与错误,并用划(+)、(-)号作答。

(2)重现型。让学生借回忆解答某些关于事实和化学原理的问题。

(3)填充型。让学生根据题意填写空白。

(4)匹配型。让学生在给定的两列物质的名称、定义、类别或性质项中,划出配伍的连线。

(5)选优型。让学生从给出的多项答案选项中,选出正确答案项;试题选项设计成序列答案的形式,让学生判断写出或划出正确答案项的序号。

(6)思辨型。让学生从几种“答案”中,选出最佳答案,勾销错误答案。

(7)变动型。让学生运用已学过的知识和技能,解释图表或图示,综合概括有关数据得出结论。

我国高等学校入学考试,经过多年实践,逐渐形成了具有特色的多种化学测验试题,主要类型是:

(1)是非题。让考生判断答案的正误,在规定的空格内划出正、误记号。

(2)填空题。将题干中的关键字词以空格的形式出现,让考 生填充。

(3)选择题。试题的题干由直接问号或不完全陈述句构成,选项包括1个(或2个)正确答案以及3个(或4个)错误答案,随机排列各选项的顺序,让考生选出正确答案。

(4)改错题。让考生指出题目中的错误,并写出正确答案。

(5)问答题。让考生按题目要求答问,是填空题的变动型。

(6)鉴别(或鉴定)题。结合给定的实验事实或反应现象,让考生区分或确认某些物质。

(7)计算题。结合化学概念或原理,让考生解化学计算题。

(8)论证题。让考生运用化学原理推论、证实指定的问题。

(9)实验辨别题。让考生通过给出的化学实验现象或实验的结论,来回答有关实验装置、操作及异常现象方面的问题。

(10)信息给予题。让考生临场阅读给出的信息,综合、判断作出答案。

化学测验试题,还可以从不同的角度进行划分。例如,英国学者西姆逊(O.J.Simpson)将多种选择题区分为:(1)选择题;(2)分类题;(3)多种组合题;(4)诊断和推理题;(5)实验题①。我国学者将化学选择题划分为14种②,计有:(1)评价选择题;(2)配伍选择题;(3)比较选择题;(4)多解选择题;(5)组合选择题;(6)因果选择题;(7)填空选择题;(8)类推选择题;(9)分类选择题;(10)改错选择题;(11)排列选择题;(12)阅读选择题;(13)识图选择题;(14)相关选择题。这是因为,选择题(多项选一或多项选二)已成为各种客观性测验中被广泛采用的一种题型,对这类测验试题从多维度进行研究,自然是很必要的。《美国百科全书》中“教育”条目曾将多种选择答案的测验题概括为6种③:(1)多答案测验题;(2)选择错误答案的测验题;(3)合并或否定前面给出的答案的测验题;(4)评价测验题;(5)答案配对测验题;(6)分类测验题。 

二 化学测验试卷的编制

试卷的编制是一项繁难、细致的工作。应当说,这项工作融会了编制专家的大量心血,是全面地体现教育思想、教学目的、教学要求和科学测量与评价原理的一项系统工程的成果。

为了保证测试的内容和范围符合测验标准,充分反映测试取样的代表性,同时又明确限定测验试题的数量和占分比例,在施测或试验试行的基础上,制定测验试题组合的双向细目表(简称双向细目表)是必需的。

我国广东省化学高考标准化命题双向细目表(见表9-1),可作为一个典型实例。

又如美国化学会考试委员会使用的由阿史福德(T.A.Ash-ford)描述的成绩水平发展而成的组合(Thegrid)表,也是一个据以设计测验试题双向细目表的好例。

行为目标Ⅰ 回忆重要事实的能力

知道重要事实,

知道重要术语的定义,

获得重要概念,

理解理论和原理的字词含义,

较重要的元素及其化合物的性质的一般知识。

行为目标Ⅱ 应用原理进行简单预测的能力

对化学原理和理论及其解释的基本了解,

定义的应用,

应用原理于类似的典型课程遇到过的那些情境,

应用原理于日常生活里的新情境,

解释一组数据并从中得出结论。

行为目标Ⅲ 应用原理进行定量计算的能力

化学符号的量的含义,

配平化学方程式。

行为目标Ⅳ 运用科学方法的能力

区分观察到的现象与对这些现象的理论解释,

用理论术

语说明现象, 对理论给出实验证明,

控制一个实验中的因数,

完全靠定义说明这个是真实的。

领域1 化学变化,元素、化合物;化合反应定律,分子运动论,化学计算。

领域2 溶液,电离,酸碱盐,中和反应,水解,金属活动性顺序,电化学。

领域3 氧化还原反应,反应热,反应速率,化学平衡。

领域4 原子结构与化学性质,元素周期系。

领域5 普通元素及其化合物的化学。氢、氧、卤素、硫族、氮

族的物理性质和化学性质,典型金属。

有了上述双向细目表,命题专家组就可以编制出有一定难度和区分度的试题,且试题(卷)的效度和信度比较高。同时,测验试题涵盖的知识和能力的比重也比较稳定。当然,如果已建立了测验试题库,那就从根本上保证了试卷编制和测试等过程的科学化、标准化。 

三 试卷的分析与评价

测验试卷施测以后,经过评阅、记分,需要进行试卷分析和统计,以从中获取诸多的有益的信息,进而做出评价。

试卷分析的方法服务于不同的目的。为了分析教学效果,了解学生的学习情况而进行的试卷分析,意在于查明测验分数高低的原因。学生得分普遍较高,要分析判定是由于测验试题太容易,还是表明教授得法、教学效果好、学习水平高;学生得分低,是因为试题太难,还是由于教学效果差所致。

以调查研究教与学的情况为目的进行的试卷分析,教师可以采用列表记录每道题的学生的答案,统计有多少人答错;或者将批阅后的试卷(或答案纸)发还给学生,要求学生将答错的题标出来。这样就可以使教师迅速查明学生对哪些知识要点、哪部分内容掌握得不好,以作为随后的补救教学(补课、辅导)的依据。

为了评价测验本身的优劣而进行的试卷分析,应当根据教学 测量“四度”的要求,来进行试卷分析。这种试卷分析与对测验进行的评价,可以有效地帮助教师和有关专家判断测验方案的效果,以决定取舍或修订、调整。

评估测验优劣的方法是教育测量和评价专门研究的课题。这里仅作简略介绍。

1.相对评价的数量表示和解释

相对评价,也称为常模参照评价,是以个体的成绩与同一团体的平均成绩(或常模)相互比较,从而确定该个体成绩的适当等级的表示方法。教师据此可以比较某生与班级(或全体受试者)内其他学生成绩的高低。

为此,必须将学生的得分(试卷上记载的分数)或称原始分数,经过一定的处理,方可用来说明问题。

(1)标准分数。标准分数也叫Z分数。系指原始分数与其平均数的差数,以标准差为单位表示的数值。计算公式为:

当Z值为零时,正好在平均数的位置,表明学生的学业成绩一般;Z为正值,则表明学业成绩高于一般;Z为负值,则学业成绩低于一般。

把原始分数转换为标准分数之后,每个考生的学业成绩在同一团体中的位置一目了然。但由于Z分数有正、有负,不便于使用,经过变换,遂采用T分数。

T=10Z+50

T分数以50为一般,50以上越大越优,50以下越小越劣。采用T分数,不仅可以说明某生的测验分数在同一团体中所处的位置,可以在各考生之间进行比较,而且可以比较同一考生在不同学科成绩上的优劣,见表9-3。

(2)百分等级。一个特定分数在一百个等级中所处的等级位置称为百分等级。常用PR(PercentileRanks)表示。某考生的测验分数的百分等级就是低于这个分数的考生个数占团体总考生数的百分比。例如,某考生化学考试得分为65分,班上40名学生中有28名的分数低于65分,因此,该考生在班上化学考试中所处的百分等级是:

这就表明:在班上有70%的学生测验分数低于65分,即该生的成绩优于全班70%的学生。

2.绝对评价

绝对评价是以受试者本人的现状与既定的教学目标作比较。教学目标就是评定目标。

考生能够完成多少体现教学目标的测试题才算达标,这是需要结合学习的性质和要求来确定的问题。一般言之,短期的教学目标和要求学生必须掌握的基本内容,达标值可定得高一些,如90%或100%;而对于较长期的教学目标与只需要让学生一般了解的内容,达标要求可以低一点,如80%或85%,但至少要在70%以上。

绝对评价的评分,一般采用合格或不合格,也可以采用三级或五级评分。

三级标准的答对率如下:

好——答对率在85%以上;

中——答对率在70%—84%;

差——答对率在69%以下。

应当指出,上表中的等级和数字标记为美国实行的五级分制;答对率为我国实行的五级分制的量化指标。前者为相对评分,后者的答对率(记为相应的得分)为绝对评分。两者不宜折合计算,并列在一起仅供参考。

绝对评价适用于形成性测验和诊断性测验。获得的反馈信息,便于及时了解学生掌握知识与能力水平的具体情况,以利及时调整、改进教学。

第六节 化学教学评价

教学评价是教育评价的一个子系统。教学评价是指收集教学 系统各方面的信息,并依据一定的客观标准对教学及其效果作出衡量和科学判定的过程。

化学教学评价是教学评价理论在化学教学中的运用和发展。从方法论原则上讲,化学教学评价的基本目的,也应当遵循以下结论①:(1)客观认定教师的教学效果;(2)诊断教学疑难,改进教学;(3)提供反馈信息,促进学生学习。为了实现这些目的,需要从几个方面来进行研究,方可取得良好效果。这些方面②是:

(1)学习目的。通过了解评价结果,来激发学生的学习积极性,引导他们调整学习方法,促使他们进行自我评价。

(2)指导目的。意义在于改进和提高教师对教学的指导作用。

(3)管理目的。在于给学生选择适当的环境,提供相应的教育处置。

(4)研究目的。教学、教育研究工作者用于科学研究的评价。

化学教学评价主要包括化学教学过程评价、化学学习活动评价和化学教学效果评价。其中,前两者是侧重从教与学的角度概括地评估教学过程与学习活动的成就的,可归属于过程评价,而化学教学效果评价则属于结果评价。过程评价与结果评价即是已被广泛采用的形成性评价与总结性评价。

在不同的教学阶段,基于不同的目的而进行的教学评价,与形成性评价和总结性评价并列的还有诊断性评价。这是化学教学评价的主要的三种类型。

实施化学教学评价的一般程序①是:

(1)准备阶段。包括确定评价目的、编制评价指标体系、选择评价方法等。

(2)搜集评价信息阶段。要采用一切有效的、可行的方法搜集评价所需的充分的信息。

(3)分析、判断阶段。对所搜集的原始资料、数据进行加工处理,形成综合判断,获得评价结论。

(4)评价结果的利用阶段。将评价结论反馈于化学教学过程,以改进教学工作,还可以为更大范围的教育评价提供资料。

化学教学评价常采用测量的和非测量的方法以获取所需的信息,即采用测验法、观察法、谈话法、问卷调查法及个案研究法来得到评价所需的量的描述和质的描述两方面的信息。关于测验法,在本章第二节讨论过的准备性测验、形成性测验和总结性测验恰为与诊断性评价、形成性评价和总结性评价相匹配而实施。其他的评价测量方法,可参看教育科学研究方法与教育测量等专著。②

在化学教学评价中,为了提高评价的质量,应当注意把握以下方法论原则:

(1)重视相对评价与绝对评价相结合,注重绝对评价;

(2)讲究定性评价与定量评价相结合,注重定量评价;

(3)做到形成性评价与总结性评价相结合,注重形成性评价。


本文摘录自互联网络,在此刊登仅为传递更多信息,版权归作者所有.

» 培训展台

» 学校展示