学校的人工智能准备:评估与实践

设想一下:明天的毕业生步入职场,人工智能工具如同电子邮件一样普遍——诊断患者症状、分析市场趋势、优化供应链或设计新的基础设施。从医疗保健到市场营销再到工程学,几乎每个领域都在发生变革。我们的学校是否为他们准备好了迎接这个新现实?我们是否有有效的方法来评估这种准备情况?
在格威内特县公立学校(GCPS),教育工作者决心确保这两个答案都是“是”。他们的使命是确保每个学生都“为人工智能做好准备”——准备好以合乎道德和负责任的方式在学校、生活和未来的工作中,使用生成式人工智能等新兴技术,无论这些职业将他们带到哪里。为了支持这一目标,GCPS牵头开发了人工智能准备框架和配套的诊断评估。
2019年,GCPS与多个合作伙伴合作,创建了一个人工智能准备框架,该框架侧重于六个核心领域:数据科学、数学推理、创造性解决问题、伦理学、应用经验和编程。该框架是在地区主题专家(包括计算机科学、数学和科学教师)和外部合作伙伴的参与下开发的。
为了帮助使该框架具有信息性和可操作性,该学区于2025年与ISTE研究团队合作开发了一种诊断评估工具,用于衡量学生在框架中概述的选定技能方面的人工智能准备情况。与总结性评估相比,诊断评估衡量学生当前的知识和技能,帮助教育工作者确定差距和发展领域,并指导教师和学校领导了解学生可能需要额外的指导、资源或支持以达到学习成果。
在掌握了项目和测试分析之后,研究团队和学区合作制作了针对高中学生的诊断评估的最终版本。
测试设计的系统方法
以下是该学区和研究团队如何将人工智能准备诊断评估变为现实:
该团队必须考虑到实际问题:谁将参加测试?将如何交付?存在哪些时间限制?
虽然人工智能准备框架涵盖了学前班至12年级,但该团队首先设计了针对9-12年级高中生的诊断评估。他们知道评估需要数字化(以最大限度地提高灵活性)并且快速,最好是10到15分钟。这些因素影响了所使用的问题的类型。为了支持自动评分,团队包括多项选择题和李克特量表问题。
首先,ISTE研究团队和GCPS合作伙伴合作,确定他们希望在六个核心领域中的每一个领域内衡量的框架结构。这确保了所有领域的持续覆盖。
一旦定义了结构,该团队就与主题专家合作——包括学区教育工作者和人工智能和教育领域的外部专家——为每个结构起草三到五个项目,这些项目与他们的专业知识相符。
在起草项目后,研究团队审查了这些项目的一致性,并确保每个项目只衡量一项技能。通过完善过程,他们将每个结构的集合缩小到26个结构总共两个项目,创建了两个版本的试点评估。然后,学区在他们的调查平台Qualtrics中构建了试点评估,以便于分发。
来自Seckinger高中的学生——总共约1,200人——参加了试点。他们按姓氏字母顺序分为两组,以评估两组“平行”项目。学区确认这两组具有相似的人口统计数据。学生们在他们的班会时间完成了试点。
- 想了解更多关于如何在您的学校或学区中周全地实施人工智能的信息?加入GenerationAI运动。
- 想探索一个学区如何引领潮流吗?了解更多关于GCPS的人工智能和计算机科学计划,包括他们的人工智能准备框架。
虽然专家意见确保了强大的结构效度,但仍然需要评估项目和整个测试的可靠性。研究团队进行了一系列心理测量分析,包括测试可靠性、经验项目分析和项目反应分析。这些分析帮助确定了哪些项目表现良好,哪些项目需要改进或删除。
在分析之前,研究团队清理了数据,以消除有问题的反应模式,例如完成评估异常迅速且可能没有仔细阅读项目的学生。
这项工作的走向
在掌握了项目和测试分析之后,研究团队和学区合作制作了针对高中学生的诊断评估的最终版本。他们现在正在探索如何调整该工具以适应其他年级,并纳入更复杂的项目,例如基于绩效的任务,让学生能够在现实世界中展示他们的技能。
展望未来,该学区希望这次诊断的结果将有助于更全面地了解学生的AI准备情况,以及教师评估、计算机科学课程和顶点项目等其他数据点。这些综合学习将为整个学区的课程开发和学生支持策略提供信息。
反思
人工智能准备情况的诊断措施可以为各学区提供用于战略规划和资源分配的关键数据,确保学生为充满人工智能的世界做好准备。学区领导和研究团队之间的合作表明了周全的设计和严格的评估实践的重要性。GCPS和ISTE+ASCD希望他们的工作可以作为其他学区为学生准备生成式人工智能未来的一个模式。