摘要:計算機自動評分優(yōu)勢諸多,發(fā)展勢頭迅疾,將這一技術引入到實評之中,須對其效度進行論證。本研究依據(jù)Williamson等在2012年提出的計算機自動評分效度論證框架,對2016年11月我國新疆地區(qū)中國少數(shù)民族漢語水平等級考試(MHK)口語考試的實測數(shù)據(jù)進行了計算機自動評分的效度驗證,結果顯示:依據(jù)該框架對口語開放性試題計算機自動評分進行效度驗證是可行的,MHK口語開放性試題的計算機自動評分與人工評分的依據(jù)相似,與專家評分的相關系數(shù)在0.8以上,評分的一致性和穩(wěn)定性較高,多項指標明顯優(yōu)于人工評分。
注:因版權方要求,不能公開全文,如需全文,請咨詢雜志社