Advertisement

论文翻译:ChatGPT: Bullshit spewer or the end of traditional assessments in higher education?

阅读量:

ChatGPT:它是否预示着高等教育中的传统评估系统将被 ChatGPT 的无意义言论取代?

https://journals.sfu.ca/jalt/index.php/jalt/article/download/689/539/3059

文章目录

  • ChatGPT:既是语言能力训练者的角色也是传统高等教育评估体系的挑战者?

  • 摘要

  • 引言

  • ChatGPT的功能分析

  • ChatGPT对教育影响的探讨

  • 教育中的人工智能(AIEd)

    • 在当前教育智能化背景下探讨ChatGPT的应用与意义
    • 针对学习者的智能化应用策略
      • 对教师教学支持的技术创新
      • 系统层面的人工智能优化方案
  • 探讨 ChatGPT 在教育领域的潜在作用

    • 面临的挑战不仅体现在技术层面
      • 带来的优势不容忽视
  • 针向高等教育教师及机构的总结与意见

    • 建议

      • 针向高校教师群体的意见与方向
        • 关于学生方面的策略与方法
        • 关于高校自身的改革与发展思路
    • 致谢

ChatGPT:废话制造者还是传统高等教育评估的终结者?

摘要

如今 ChatGPT 已经处于聊天机器人的领先地位。相比其他聊天机器人而言,在短短几秒钟内 ChatGPT 就能生成令人印象深刻的散文,并在高等教育学生的评价以及其他诸多领域却引发了广泛的讨论和预测性言论。 ChatGPT 是一种基于 OpenAI 生成预训练变换器(GPT)的语言模型的变体。其主要目标是产生与人类写作难以区分的文字。这种设计使它能够自然流畅地与用户交流。

在本文中,我们概述了OpenAI从一个非营利组织向商业企业的转型过程。我们探讨了这一转型对企业运营模式的根本影响,并对其进行了深入分析。就我们的研究方法而言,我们系统梳理了相关文献,并在其中进行了创新性应用。通过对现有研究的梳理发现,我们的综述具有填补空白的独特价值,尤其是在探索ChatGPT及其在高等教育领域相关性方面 pioneering地采用了同行评审的方式进行研究。在详细阐述该技术功能的同时,我们也对其优势与局限性进行了全面评估。随后,我们将重点转向该技术对高等教育的实际影响,并深入探讨其在未来可能的发展方向与应用场景。在此基础上,我们将ChatGPT置于当前教育与人工智能深度融合的研究框架中进行考察,并将其视为一项具有里程碑意义的技术应用成果。最后,本文提出了针对学生、教师以及高等教育机构的相关建议,其中许多重点都集中在评估机制的优化上

人工智能领域中的机器智能正在逐步渗透到教育领域的方方面面。当前研究正致力于开发一种新的评估机制来量化这种机器智能的表现效果。基于现有的技术基础和算法优化方案,在这一类的预训练模型之中引入了一种创新性的改进策略。通过系统的实验研究和数据分析表明,在这一特定领域内的学习与教学模式能够显著提升效率水平。这项研究特别关注的是自然语言处理技术在提升教学效果方面的潜在应用前景。

引言

Samson Tan持有亚太地区战略与运营总监(新加坡)职位,并担任Civica Asia Pacific公司的高级顾问角色;Shannon Tan担任Kaplan Singapore公司的研究执行官一职;我对知识有着深入的理解,并在职业生涯中积累了丰富的实践经验;作为一名优秀的学生,在学术上积极投入课堂活动,并定期参与所有相关的学术讨论;为了全面掌握所需内容,在日常学习中我还定期阅读了我们课程所需的所有相关材料;尽管我在学习过程中表现出色,在面对写作挑战时却感到有些不安和失望;这是一个在新西兰使用AI工具完成作业的学生的引言(Heyward, 2022)

新技术教育的出现常常引发了复杂的情感反应:既有对新希望的期待(即所谓的末日预言),也有对新机遇的兴奋(即所谓的无法抑制的狂喜)。基于GPT-3的ChatGPT也不例外:它已经引起了媒体界的广泛讨论与关注。(Cellan-Jones, 2020)《纽约时报》曾评论道:“机器写作的能力远超预期。”(Manjoo, 2020)而《经济学人》则指出:“GPT-3展现出令人不安的一面——无论是优点还是缺点。”(2020)《每日电讯报》认为:“对于由AI生成的内容我们必须持谨慎态度。”(Pagnamenta, 2020)此外,在这一讨论中还出现了两种截然不同的观点:一方面Sam Altman告诫公众不要过度炒作GPT-3的技术进步;他指出:“GPT-3被过度炒作已成事实。(Altman, 2020)”另一方面Marcus和Davis则提出了相反的观点:“GPT-3更像是一个会话生成工具而非深度思考者。(Davis and Marcus, 2020)”

当ChatGPT发布时,它被视为"令人难以置信的产品"并引发了广泛讨论——这种产物以其独特的方式融合了创新与挑战(Kantrowitz 2022)。Kantrowitz(2022)评论道:"经过多年的虚假宣传后终于真相大白——真正的东西出现了"。《大西洋月刊》发表文章称ChatGPT是生成式人工智能发展的标志性事件——这一发现可能彻底改变我们对工作方式思维模式以及人类创造力本质的认知(Thompson 2022)。同一家期刊指出许多早期支持者使用"惊喜宏伟"等尖锐措辞在社交媒体上表态仿佛它是融合了软件与魔法的独特产物(Roose 2022)。Alphabet高层对此深感不安以至于引发了内部警戒机制因为ChatGPT有可能动摇其主导地位而微软已经开始利用OpenAI技术改进其搜索引擎Bing(Tung 2023)。引用Altman的观点再次引发关注:有趣的是有两种观点要么是'这是通用人工智能(AGI)'显然这并非现实情况哈哈要么是对这种方法能否走得更远持有保留态度

在教育技术的发展历程中,许多创新性技术往往被视为传统教育体系即将走向终结的一种象征性现象(Rudolph, 2018;Kefalaki等人, 2022)。从20世纪初起,电影、广播、电视、计算机、互联网以及移动技术等媒介被广泛认为是推动学习与教学变革的重要力量(Terzian, 2019;Tan, 2019;Akinola等人, 2020;Kuleto等人, 2021)。然而,在这一领域的发展历程中,人们常常忽视了教师如何有效运用这些资源以及学生与这些资源互动的具体情境。
Ferster(2014年)评论道:“虽然机器确实在20世纪深刻改变了人们日常生活的各个方面,在19世纪末期‘访客’可以在现代教室中自如地活动这一现象依然成立。”这种物理教室环境基本上未发生根本性变化。有一段时间内,“把技术视为万能灵药或解决一切问题的方法”成为主流观点。
然而,“机器主导论和卢德主义都应避免‘无师自通’的理念”(Rudolph, 2018年)。对于高等教育中的激进创新抱有过度期望的观点并不罕见。最近的一个例子是大规模开放在线课程(MOOCs),本应是高等教育走向终结的先驱(Rudolph, 2014)。但事实表明,在高等教育机构掌握学位证书的情况下,这一领域的创新并未取得预期效果(Rivas等人, 2020;Santandreu Calonge等人, 2019)。

本文主要概述了OpenAI作为非营利组织向商业模式转型的过程及其对高等教育领域的影响。本文突出了这一转变的核心意义,并回顾了其对高等教育领域的深远影响。此外,我们还阐述了研究方法,并指出这是最早的以ChatGPT和高等教育为主题的学术期刊文章之一。进一步分析了该系统的核心功能及其优势与局限。随后提出了一个关键问题:在当前AI聊天机器人技术背景下(如ChatGPT),高等教育中的学习、教学与评估将如何发展?在此背景下(即人工智能教育研究领域),探讨了几种应用方向:针对学生、教师以及整个系统层面的应用方案,并深入分析了这些发展带来的机遇与挑战。最后给出了针对学生、教师以及机构的一些建议。

OpenAI和ChatGTP的简短历史
OpenAI
OpenAI是一家人工智能(AI)研究实验室,旨在开发能够造福人类的“友好型人工智能”。该位于旧金山的组织由硅谷科技行业的主要企业创立,包括Elon Musk(他于2018年卸任董事会成员)、PayPal联合创始人Peter Thiel博士、LinkedIn创始人Reid Hoffman、前Stripe首席技术官Greg Brockman博士以及Y Combinator创始人Sam Altman博士(他的企业孵化器项目催生了AirBnB、Dropbox和Coinbase等公司)。Brockman继续担任OpenAI总裁,而Sam Altman博士则出任首席执行官。自成立以来,OpenAI迅速崛起为全球顶尖的人工智能研究机构之一,在与之竞争的如Alphabet的DeepMind公司也有着相似的发展轨迹(Hao, 2020a)。

OpenAI的主要目标是发展"通用人工智能"(AGI;OpenAI, 2015)。通常也称作"强人工智能"(strong AI),它是人工智能领域的终极追求——指具备执行人类可完成的所有智力任务的能力(Grace等人, 2018;Bostrom, 2017;McAfee & Brynjolfsson, 2017;Harari, 2016;Kurzweil, 2005;Searle, 1980)。根据OpenAI创始人所言,在改善人类福祉方面人工智能提供了重大的机遇,并广泛应用于自动驾驶汽车和精准个性化医疗等领域(Markoff, 2015)。长期以来一直对人工智能可能产生负面影响的可能性表示担忧的马斯克(他将其称为我们"最大的存在威胁"并形容为"召唤恶魔"——引自Markoff, 2015),则强调应聚焦于增强而非取代人类的技术发展。基于OpenAI创始人所提出的愿景,在安全且有利于人类发展的框架内推动人工智能的进步是当务之急,并要求公开共享开源软件和先进技术知识而不设知识产权障碍(Markoff, 2015)。最初声明将独立于盈利性激励机制的 OpenAI 称定为最适合以人类最佳利益为导向引导这项技术发展的组织(Hao, 2020b)。

在2019年之际, OpenAI的商业模式发生了重大转变。

在2020年的时候,OpenAI发布并开发出了生成预训练大型语言模型中的关键组件之一——GPT-3模型。该模型经过了约45TB规模的数据集进行训练(Cooper, 2021)。该数据集主要来源于多个渠道:首先是Common Crawl项目——一个旨在免费提供互联网档案和数据集的非营利组织;其次是WebText2集合——收集自Reddit论坛的所有帖子,并仅选择那些获得超过三个点赞的内容;此外还包括两套基于互联网语料库构建而成的语言学习资源—— Books1 和 Books2;最后则是由Brown等人负责整理并发布的维基百科条目集合。

如今已发布的人工智能领域最雄心勃勃的语言模型——GPT-3(由Heaven于2020年推出)。它通过深度学习技术来创作包含散文、故事、诗歌以及代码在内的多种类型的内容。令人惊叹的是这种模型能够无须特定指导就能完成多种任务。传统的NLP系统通常需要依赖大量标注好的数据来进行训练。这一技术被学术界称为‘微调’。然而与之不同的是GPT-3具备一种独特的自主学习能力它可以适应并处理来自任何来源的数据无需额外指导即可完成多项任务包括但不限于生成叙事编写代码自动完成图像翻译语言以及执行复杂计算等操作。(以上内容均源自Grossman于2020年的研究)

基于以前GPT模型的实质性升级

GPT-3具备零样本、单样本和少样本学习能力(Brown等人提出)。与之相比,在少样本(FS)情况下语言模型会收到一些示例或演示提示。相比之下,在单样本(1S)情况下仅提供一个实例;而零样本(0S)情况则可被视为"难以公平"的问题(Cooper指出),因为即便如此人类——例如我们的学生——在执行任务前也需要接受指导与示例。

GPT-3的模型规模指数级增长极大地提高了少样本性能(Brown等人,2020年)。显然,令人难以置信的是,预计在2023年某个时候推出的GPT-4(将带有ChatGPT-4)将拥有约100万亿个参数:大约是GPT-3的500倍,因此接近人类大脑的神经连接数量(Romero,2021年;Kovanovic,2022年;Liquid Ocelot,2023年)。有人推测,再增加100倍的规模(GPT-2和GPT-3之间的差异)可能会使少样本性能接近人类水平。使用可能错误的假设,即人类神经元大致等于神经网络参数,Lauret(2020年)推测:“人脑大约有1000亿个神经元,形成了大约1000到5000万亿个突触连接。如果规模确实是解决类似人类智能的方案,那么GPT-3仍然太小了1000倍”。值得注意的是,GPT-3及其前身和竞争对手在严格意义上没有知识。这些语言模型不设计用于存储或检索事实。它们"只是擅长预测序列中的下一个(或几个)词"(Cooper,2021年)。

2020年时推出了一个与GPT-3关联的应用程序接口API。此外,该系统还提供多语言转换功能,并能创建即时内容。作为其产品线的一部分,OpenAI推出了一个创新的AI工具——DALL-E。该工具能够根据用户提供的自然语言描述生成高分辨率数字图像(见图1)。

ChatGPT
在2022年11月30日这一天,《深度求索》(DeepSeek)发布了其最新的智能客服系统Beta版。这一举动使该公司的估值急剧上升至约375亿美元(Wang et al., ),以及其它机构的投资情况。(深度求索官网, )该系统是一种利用人工智能技术开发的应用程序,并能够模拟人类交流的行为。它允许用户提出问题或提出请求,并能在几秒钟内得到回应。自Beta版发布以来仅五天时间就吸引了超过一百万用户(《深度求索》, )。然而,在尝试使用该系统时偶尔会出现因高并发访问导致的问题信息提示(图1)。

在这里插入图片描述

图1. DALL-E根据用户的指示生成了一幅图像:其主题涉及人工智能与高等教育,并模仿了文森特·梵高的艺术风格。

在这里插入图片描述

图2. ChatGPT全容量错误信息。

ChatGPT是由OpenAI开发的GPT-3系列大型语言模型构建而成,并采用监督学习与强化学习技术进行过微调。相较于常见的搜索引擎(如谷歌、必应或百度),ChatGPT不从网络上采集实时信息。其知识库仅限于截至2021年前获得的信息。这一事实准确性分布的问题已被广泛认为是一个显著缺陷(Vincent, 2022a)

如前所述,在引言部分我们提到,ChatGPT因其在多个知识领域提供详细回答和清晰答案而迅速引起了广泛关注。人们意识到,这是一个功能强大且设计精巧的聊天机器人首次‘借助一个免费且易于操作的网络平台向公众提供服务’(Roose, 2022)。

但是,在这种情况下也不可持续性地提供免费服务是不可能的。每条消息的平均费用仅为"个位数美分"。这一高昂的计算开销巨大(由Altman在Ortiz, 2022年所著述),并且基于OpenAI修正后的商业模式已具备盈利能力。因此该系统最终必须实现商业化运作(例如通过订阅服务或嵌入式广告)。然而,在ChatGPT-4即将推出之际,每次查询的成本有望大幅下降(根据Liquid Ocelot, 2023年的数据)。

在这里插入图片描述

图3:OpenAI时间线。

采用值得称道的预防性措施以防止由微软Tay.ai、谷歌LaMDA及MetaBlenderBot等聊天机器人(引用 Vincent 2016, Heaven 2022, Tung 2023)所导致的相关冒犯性问题(例如种族主义与性别歧视)。通过编程限制 ChatGPT 对‘不当指令’的回答,在生成非法活动的操作指令时予以拒绝(Roose 2022)。然而,在某些测试中发现 ChatGPT 输出了一些令人震惊的内容:当要求机器人编写一个用于判断是否应对其实施虐待的Python程序时(Piantadosi 2022),其答案是‘如果他们来自朝鲜、叙利亚或伊朗,则应予以处理’。显然这类测试的结果往往是不一致的:有时 ChatGPT 可能会严厉斥责‘编写一个用于检测航空旅客安全风险的程度是否超出了隐私权与自由行动权范围的行为是不合适的’这样的请求(Biddle 2022)。

方法和文献综述
本文基于桌面分析的方法,并特别注重信息来源的质量。由于研究主题的前沿性,在截至2023年1月18日为止的研究中,我们仅限于收集了大约两篇经过同行评审的期刊文章以及八篇预印本论文(未经同行评审的学术论文)。

通过Google Scholar数据库进行了系统性检索,在与'GPT-3及高等教育'相关的100篇最新研究论文、会议报告以及教材章节中发现了大量具有参考价值的资料。同时参考了所选研究论文的参考文献列表以及非学术文章中的引用信息。通过系统性检索相关领域的最新研究资料(共计100份),我们发现现有与GPT-2及高等教育相关的高质量研究相对有限。然而,在ChatGPT及其在教育领域的应用方面却呈现出显著的增长趋势:已有八篇预印本稿件及相关研究报道出现,并有两篇重点讨论其在教学评估、学习方法以及教育技术等方面的创新应用。

由Pavlik于2023年1月7日发表的第一篇关于ChatGPT与高等教育同行评审的文章探讨了该技术在学术环境中的应用。该文章发表在非开放获取期刊《Journalism & Mass Communication Educator》上,并与ChatGPT合作撰写。文章详细分析了ChatGPT的优势及其局限性,并对其作为新闻和媒体教育工具的潜在影响进行了反思(Pavlik, 2023)。与此同时,Huh于2023年1月11日发布了一份简要报告,指出ChatGPT的知识储备和推理能力尚未达到韩国医学院学生参与寄生虫学考试所需水平。此前,Cellular and Molecular Bioengineering期刊于2023年1月2日发表了另一篇社论,将其列为共同作者(King & ChatGPT, 2023)。另一位人类作者King也于同一年晚些时候发表了另一篇社论,首次出现在《Cellular and Molecular Bioengineering》上(King, 2023)。这两则社论均基于King与ChatGPT之间的对话内容,并深入探讨了人工智能在医学领域的未来发展(King & ChatGPT, 2023)。值得注意的是,一篇专注于护理教育领域的社论也已由O’Connor及ChatGPT共同撰写并发表在非开放获取期刊上(O’Connor & ChatGPT, 2023)。

接下来是对关注ChatGPT和高等教育的预印本的简要回顾。Yeadon等人(2022)指出ChatGPT作为一种评估工具对短文形式论文的可信度提出了严重质疑;然而Cotton等人(2023)则采取了更为务实的态度,在评估使用ChatGPT的机会与潜在问题上进行了深入探讨,并特别关注其作为辅助工具的应用。在此框架下Tate等人(2023)进一步探讨了ChatGPT及其类似文本生成工具在教育领域的具体作用,并将其置于教育技术发展的历史语境中;这一研究方向与我们文章中所讨论的人工智能驱动写作助手的应用领域有着高度的一致性。

Nisar与Aslam的研究团队于2023年发表报告指出:GPT-3能够作为一种有效的参考资料和自学工具来辅助马来西亚中医学专业的学生开展药理学研究工作。 Gilson及其合著者在评估ChatGPT在美国医学专业考试(USMLE)能力范围时发现:该AI系统的能力水平相当于三年制医学生的学习阶段,并得出了类似的研究结论与应用展望——Kung等研究者也进行了类似的USMLE测试实验并得到了相同的结果与建议——Bommarito与Katz先前的研究表明:GPT-3具备通过美国律师资格考试的能力——Zhai则进行了实证研究并得出结论:ChatGPT能够撰写出连贯、部分准确、具有信息量且条理分明的学术论文——基于以上研究成果建议教育工作者应通过设计包含AI技术的学习任务来培养学生的创新思维与批判性思维能力——Qadir则深入探讨了ChatGPT技术在工程教育领域的双刃剑效应

还有一些文章虽然不直接聚焦于高等教育的教学与学习过程,而是将ChatGPT视为研究工具使用。这些文章在我们讨论的背景下具有相关性,因为这些教育工作者和学生可以利用AI来达到这一目的。Aydın与Karaarslan(2022)尝试利用ChatGPT辅助撰写一篇学术论文,并借助反抄袭软件对生成文本进行原创性检测。Dowling与Lucey(2023)的研究结果显示,ChatGPT能够显著提升金融领域的研究质量,尤其是在创意生成、文献综述以及数据识别等方面表现突出。Alshater(2022)则专门探讨了该技术在金融领域中的具体应用潜力。此外,Gao等人(2022)通过对比分析发现,基于ChatGPT生成的科学摘要与其原始版本之间存在显著差异,并采用多种技术手段评估其原创性水平

我们还提供了一份关于GPT-3及其前身GPT-2在高等教育背景下相关学术文献的简要概述。Dehouche(2021)从批判性的角度探讨了随着GPT-3的进步是否有必要重新审视抄袭的概念问题。同样地,Fyfe(2022)对抄袭概念提出了质疑并采用了GPT-2进行实验,要求大学生通过文本生成软件在一篇文章上"作弊"。Anson & Straune(2022)详细描述了基于AI的语言模型如GPT-3的能力并提出了一些建议以帮助教师应对学生依赖的可能性(另见Anson, 2022)。Köbis & Mossink(2021)在对GPT-2进行实验时发现参与者无法可靠地识别其中生成的诗歌作品。Tack & Piech(2022)对GPT-3在在线教育对话中的应用持积极态度。Moore等人(2022)针对大学化学课程学生的研究重点分析了学生的生成答案质量并运用GPT-3进行了评估.Elkins和Chun(2019)得出结论认为GPT-3是写作的重要认知工具因为它可能为文学作者提供新的写作见解.此外还有其他相关的学术文献可供参考(见Nguyen等人,

为了确保透明度起见, 我们采用了166个来源, 并在附表1中列出了所采用的所有来源的摘要. 虽然其中约55\% (即超过一半)的研究资料来自学术领域, 但由于ChatGPT的独特创新性以及其在同类研究中存在时间上的发表滞后效应, 在征稿过程中我们也广泛征询了一些非学术领域的意见或信息.

在这里插入图片描述

表1. 本文使用来源

除了现有的文献综述之外,在进行了多种查询测试后 ChatGPT 也得到了广泛检验。值得注意的是 下一节仅涉及这些随机测试中的少量内容 与近期多数学术论文及社论不同(King & ChatGPT 2023 Kung 等人 2022 O’Connor & ChatGPT 2023) 我们对于聊天机器人用于头脑风暴的使用极为有限

ChatGPT的功能

本节展示了如何导航ChatGPT网站及其各种功能。

在这里插入图片描述

图4. ChatGPT的主页(2023年)

为了使用AI及其功能, 前提是需要先创建一个账户. 建立账户仅需提供一个电子邮箱地址以及一个密码, 并无需支付任何费用. 之后, 请确保提供姓名、全名、国籍以及手机号以便完成注册(如图5所示).

在这里插入图片描述

第5页展示了创建ChatGPT账户的详细步骤说明。当用户成功注册后……随后……会看到基础信息如图6所示。

第5页展示了创建ChatGPT账户的详细步骤说明。当用户成功注册后……会看到基础信息如图6所示。

在这里插入图片描述

图6. ChatGPT的简短介绍

在这里插入图片描述

图7. ChatGPT搜索引擎界面截图

在示例类别中设有预先设定好的内容让用户访问。例如,在用户点击选项'使用简单语言解释量子计算'时, 该系统会将该用户引导至相应的网页资源.问题的答案会在60秒内快速呈现, 并附有相关图表(见图8和图9).

在这里插入图片描述

图8. 向ChatGPT提问,“用简单的语言解释量子计算”。

在这里插入图片描述

图9展示了ChatGPT在60秒内完成任务的能力(受网络速度影响)。为了评估AI能力,研究人员要求其对"均值、标准差及Z分数"进行详细阐述。该系统能够在60秒内给出直观且准确的统计学概念解释,并参考相关图表(如图10所示)。此外,该系统还提供了简洁明了的数学示例来进一步细化说明。

在这里插入图片描述

图10. 对均值、标准差和z分数的统计解释。

随后, 我们提出了一个相关问题: AI迅速回应, 并提供了一个房地产经纪人用于确定房价范围的具体案例分析. 该案例详细阐述了涉及的数学公式以及逐步计算指导(如图11所示)。

然而,在面对需要解析的数学公式时,AI陷入了停滞。当我们立即追问时,默认情况下AI表示其解析结果过于冗长,并且超过了字符长度范围。随后,在无法满足这一要求的情况下,默认情况下默认情况下默认情况下默认情况下默认情况下默认情况下默认情况下默认情况下默认情况下默认情况下,默认情况下默认情况因此,默认情况下因此,默认情况因此,默认情况因此,默认情况因此,默认情况因此,默认情况因此,默认情况因此,默认情况因此,默认情况因此,默认情况因为在这种复杂的情况下 AI 无法满足字符限制的要求 所以它不得不放弃最初的示例 并引入了一个新的应用场景 如图11所示

通过互动可以看出,在与AI进行交流的过程中展现了类似人类的语言能力和问答技巧。这种技术能够自动生成合乎逻辑的回答,并且通常可在60至120秒内完成一次完整的对话流程。然而,在某些情况下会受到以下限制:一是字符数量有限制;二是无法直接绘制图表(如直方图或散点图等);三是可能会遇到网络连接异常而导致的问题提示(如图12所示)。

在这里插入图片描述

图11. ChatGPT展示一个场景。

在这里插入图片描述

图12. ChatGPT无法绘制图表。

前一案例展示了ChatGPT在技术方面的更深入应用(涉及数学分析)。在下一案例中,请求人工智能基于特定主题撰写一篇2000字的文章:“题为‘孤立的听觉错觉不能证明患有精神分裂症’”。该请求应包含20篇相关文献并附上参考文献列表。通过这一实践,请评估人工智能是否具备撰写具有批判性和深度分析能力的能力。

当向ChatGPT提出问题时

在这里插入图片描述

图13. 对主题“单独的听觉幻觉并不能表明患有精神分裂症”所呈现的答案。

通过以上实例可以看出,在提供概念性和应用方面的指导上 ChatGPT 可能表现出色。然而,在处理涉及高阶思维(如批判性和分析性思维)的内容时 AI 常常显得力有未逮

在这里插入图片描述

图14. ChatGPT生成的中文作文。

以这个案例为例

表2. ChatGPT的优势和限制。

在这里插入图片描述

关于我们在上表中使用"理解"和"欣赏"的说明如下:尽管像ChatGPT这样的AI系统"并非完全像人类那样理解和处理它们所阅读的内容(虽然在某些程度上也可能存在局限性),但它们仍然能够从自然语言中提取大量信息,并利用这些信息进行简单的推理和回答问题(Bostrom, 2017年, 第86页)。自然语言模型本质上是一种随机的行为模拟(Bender等人, 2021年)。我们以OpenAI首席执行官Sam Altman的一段话结束本节:
ChatGPT的局限性难以置信(但其某些方面表现得足够好以至于会给人一种误导性的伟大印象)。依赖它来做任何重要的事情是一个错误(但它是未来发展的预告)。在提高鲁棒性和真实性方面还需要做很多工作(引自Alshater, 2022年)。

ChatGPT对教育的影响

教育中的人工智能(AIEd)

发布后,在ChatGPT引起技术人员和教育工作者的兴趣与警惕。存在支持与反对 ChatGPT 的意见;但从教育领域的角度来看;通过系统性分析来获取见解并进行合理的评估是值得的;这直接影响了 ChatGPT 在教育领域的作用。自20世纪70年代以来;研究人员一直致力于利用 AI 开发提升学习效果的技术(du Boulay, 2016)。学术界在过去三十年间对这一领域的益处展开了深入探讨,并致力于使其更加普及。

经历了10年的演进与突飞猛进的发展态势

可被视为人工智能领域的重大进展之一 ChatGPT。
值得回顾当前教育领域内人工智能驱动应用的研究,并基于对其在教育影响趋势的分析来进行 ChatGPT 的情境化处理。
以下部分旨在提供对其在现有 AIEd 研究领域中立场更为全面的理解。

在现有教育人工智能的背景下的ChatGPT

随着教育技术领域的迅速扩展, AIEd提供展现丰富工具与应用的新机遇. 这种情况带来了兴奋感,并推动了构建广泛工具与应用方面取得的突破. 通过AIEd文献综述可以看出, 在运用人工智能于教学与学习创新实践中可采取措施以规避风险. Baker与Smith(2019)将教育环境划分为针对学生、针对教师以及针对系统的类别. 我们已认识到该框架对于人工智能应用于教育领域具有重要意义.

面向学生的AI应用

面向学生的AI应用的开发旨在改善智能学生支持系统,并通过适应性和个性化的学习方式来支撑学生的教育过程(Zawacki-Richter等人, 2019)。可以说, 智能辅导系统(ITS)是人工智能在教育领域最有潜力的应用之一, 因为它们被认为是个性化指导中最有效的工具之一。随着教育研究者不断探索新的教学模式, 这种个性化的教学方法正在发展之中, 因此相关领域正在产生新的机遇。通过应用基于人工智能的算法, 现在 ITS 可以模拟导师提供的帮助功能, 例如通过提供解决个性化问题的支持。预计未来会出现一种革命性的适应性、个性化学习范式(PAL)(Peng等人, 2019)。这些技术将能够实时记录并分析学生在各个方面的学习特征及其情绪状态, 从而实现个性化的适应性学习。

同样也是基于大量的文本数据集进行过学习工作,从而能够从中发现语言中的规律及其关联,并进一步模仿其训练内容生成新的文本片段。值得注意的是,该模型采用了一种称为变换器(Transformer)的人工智能架构,这种架构特别适合用于处理以及产生文字内容。在未经深入研究的前提下, ChatGPT潜在的技术潜力值得进一步探索,以便进一步提升个人化自适应学习的表现效果。然而,目前的技术发展水平表明, ChatGPT主要局限于通过微调特定任务来增强自身能力,例如语言翻译或者解答问题等常规应用领域。需要注意的是,尽管 ChatGPT展现出令人印象深刻的智能化水平的同时也存在明显的局限性,这反映在其运作机制上:该系统是基于之前接触并分析过的内容不断被进一步开发而来形成的思考框架(Heilwell, 2022)。因此在某种程度上可以看出该系统可能会显得信心满满地提供答案而不愿意深入探讨相关问题的本质内涵。

虽然ChatGPT在帮助学生写作方面的效能令人印象深刻, 但它的人工智能驱动写作工具已有较长时间被广泛应用. 值得玩味的是, 虽然该技术引起教育界广泛关注, 但在推动创新性教学模式与学习方法上, 或许能为教师带来便利. 第四节将深入探讨专为教育工作者设计的人工智能应用

面向教师的AI应用

教师可能采用面向教师的AIEd工具, 以减轻他们的工作负担, 并从学生的视角获取见解, 推动课堂创新实践(Baker & Smith, 2019)。这些AIEd系统旨在通过自动化评估、抄袭检测和行政管理等手段提供反馈机制来协助教师。人工智能驱动的应用程序可能帮助教师实时跟踪学生的学习进展, 以便在必要时提供额外的支持和指导。Cope等人(2020)强调, AI驱动的评估系统具有重要意义, 它们可能成为转型教育的重要推动力之一。传统评估方法与之不同的是, 它们依赖于独特的非典型作业来选择并提供回顾性、总结性测试样本;而AI驱动的系统则能够整合持续反馈机制到学习过程中。下一节将介绍适用于各学科的人工智能驱动评估工具及其应用实例;特别设计的应用程序用于辅助写作教学和学习过程中的反馈与支持

自动作文评分系统(AES)是最具代表性的基于人工智能的评估工具,在教育领域的应用日益广泛。现有研究大多集中在本科课程的教学与应用中(Zawacki-Richter等人, 2019)。构建 AES 系统的方法多样且复杂,主要包括统计建模方法、自然语言处理技术以及潜在语义分析等方法,这些技术手段能够帮助教育者识别学生的文本输出模式并提供反馈建议(Ma & Slater, 2015)。综上所述,基于人工智能的作文评分会随着技术的发展逐渐接近人类评分标准,但仍需进一步探讨其局限性和适用性(Aluthman, 2016)。

为了实现AES的有效性,它需要与具备AI启用的自动反馈功能的技术相结合。采用机器学习技术生成学生的写作反馈以提升其写作能力是一种广泛应用的方法(Garcia-Gorrostieta等人, 2018)。该系统运行于自适应评估平台,在基于布鲁姆认知模型的层级设计出合适的回答方案并提供更具挑战性的学习材料(Barker, 2011)。

显而易见,在AI驱动的作文评分应用领域中存在一个持续增长的研究主体,并且这些研究已经展现出显著的效果。然而,在这一领域内还有一个快速增长的子领域,在其中运用了AI驱动的技术来辅助学生提升写作能力。正是在这个子领域中,教育工作者与学术界人士对于ChatGPT可能带来的影响表示担忧,并担心这种技术会破坏现有的文学创作与写作传统以及可能会终结我们所熟知的有效写作实践。下一节将概述这种类型的AI驱动写作助手,并探讨它们在教学实践中的应用前景以及如何将其纳入未来的智能教育生态系统中去发挥作用的机会。值得注意的是,在ChatGPT投入使用之前已有许多基于人工智能技术开发出的作者辅助工具出现于英语写作教育领域,并且这些工具已经被证明能够有效促进英语写作实践、提升学习者的学习效果以及帮助用户(尤其是高等教育阶段的学生)实现自我导向学习( Nazari等研究者, 2021;Zhao, 2022)。总体而言,AWE,AES与AWCF已经被越来越多地应用于促进写作过程中的自动化反馈与评估项目,并且它们已经被用作减轻教师负担的重要工具之一。此外,随着近年来智能技术的发展,AI驱动的应用程序开始将这些功能整合到一个统一平台中,从而为教学提供更加便捷的服务(Koltovskaia, 2020)。

在人工智能驱动的数字写作助手领域中,Grammarly被视为全球知名的学术研究对象。它提供了多种功能模块如AWE(自动写作评估)、AES(自动作文评分)以及AWCF(自动书面纠正反馈),这些均整合于统一平台以满足创作者的需求(Taguma等人,2018)。基于 Grammarly 拥有的庞大用户群体及其生成的数据量为持续优化产品奠定了基础。该公司的计算机语言学家与深度学习工程师团队通过对来自学术期刊的数百万句子进行了分析开发了先进的算法模型:这些算法旨在揭示有效写作的基本原则与常见模式(Fitria, 2021)。

Grammarly能够识别出英文文本中的拼写与语法问题,并将其正确形式予以呈现。
该系统通过指示错误位置来指导用户及时修正这些潜在的问题。
图15则展示了Grammarly如何分析并评估一段文字内容。

在这里插入图片描述

图15. 使用Grammarly后文本更正的示例。

研究表明,在提升写作参与度方面采取有效的干预措施是十分有益的(Koltovskaia, 2020)。多项研究显示,在技术的帮助下学生的坚毅品质得到了显著提升(Schindler等人, 2017)。Grammarly通过提供即时反馈与修订功能能够激励学生主动改进写作质量(Moore & MacArthur, 2016)。当Grammarly识别并校正写作错误时它不仅指出错误所在还给出相应的技术评分(图15所示)。这些技术评分与错误数量之间的正相关关系有助于鼓励学习者不断优化其写作任务的表现。此外在另一项研究中发现人工智能能够有效提升EFL学生的学习自信心与学术情感(Nazari等人, 2021)。在不依赖人工帮助的情况下智能反馈系统能够帮助学生识别写作问题识别错误模式并引导他们重新制定改进计划从而增强自主学习能力

此外,在线作业系统中还提供了丰富的学习资源以辅助教学。这些学习资源包括多个模块可供学生使用以及多个知识点可供教师选择。每个模块都包含若干个知识点教师可以选择以满足不同的教学需求。

在这里插入图片描述

图16:通过Wordtune进行重写的建议示例(正式语气)。

赵(2022)强调了Wordtune对EFL构思想法的支持,并将其转译为英语以提升作者的写作水平。此外,在整个写作过程中用户能够维持动力状态,并有效防止他们在复杂的英文单词或表达上遇到阻碍。由AI驱动的学习工具设计旨在提供可靠的反馈机制,并基于形式性和总结性评估生成详细的学习信息( Nazari等人, 2021)。

该种方式发现了大量支持这些工具有效性的技术文献与实证研究发现。证明了这类工具在提升作者撰写的质量和效率方面表现出色;无论是通过评估它们的语法正确性、语法规则违反情况以及生成内容的质量等指标进行衡量;或者通过提供结构优化建议、语言调整意见等方式来改进。
基于对现有AI驱动写作助手及其应用效果的研究发现。

尽管它是基于与现有文本生成工具相似的AI技术开发而成,但它却拥有独特的功能。能够通过用户的提示自动生成看似高度智能的文字,并特别适用于家庭作业撰写以及模拟考试题目的解答等场景。

基于研究的学术深度和严谨性考量,并考虑到ChatGPT生成内容的恰当引用情况,一些学者预测传统教育评估方法将逐渐消失(如Yeadon, 2022;Herman, 2022)。在后续章节中将探讨ChatGPT如何应对面向系统的AI教育需求。

面向系统的AI应用

基于人工智能的系统化方法为学术管理者和管理层提供了宏观信息。例如,在高校或机构中观察到的学生流失模式。然而,在这一领域目前的研究关注度相对较低(引用:Baker & Smith, 2019)。通过文献综述可以发现,在评估各种AIEd维度时发现这些算法与学习模型所需的数据显示出显著相似性。相比之下,在针对学生或教师开发的应用程序方面已取得更为深入的研究进展。

虽然ChatGPT看上去与面向教师的AIEd AI驱动应用更加相关 并且属于基于人工智能的写作辅助工具 教育工作者在设计利用ChatGPT进行教育创新的具体策略时 应该规划出一个全面的方法 探讨微软是如何全面地将这一技术整合到其产品中的研究工作(Warren 2023)是值得借鉴的方向

总结并确认了 ChatGPT 在教育技术领域尤其是人工智能辅助教学(AIEd)背景下的重要地位。 有必要考察该技术对未来教育模式发展的作用。 作为最新推出的智能化工具,在当前阶段尚未有实证研究结果来评估其对教育资源的影响。 针对该新兴技术而言,在现有条件下仍需进一步探索其应用效果。 针对该技术的潜在影响(机遇与挑战),有必要探讨其对相关群体的影响。 随后的内容将深入探讨这一技术在其应用过程中所面临的机遇与挑战及其对各方利益相关者的潜在影响。

关于ChatGPT对教育的影响

值得注意的是有关ChatGPT的观点文章数量众多(见上文),然而在教育领域中与ChatGPT相关的系统性研究仍然有限。接下来将深入探讨 ChatGPT 在教育领域面临的挑战及其带来的机遇,并分析这些因素对教育相关方所产生的影响。

使用ChatGPT进行教育:挑战

一个最早且最普遍的关注点是 ChatGPT 对学术评价体系构成的影响。具体而言,部分教师顾虑学生是否会将书面作业委托给 ChatGPT 生成,因其能够快速生产看似高质量的文章,从而规避现有的抄袭检测机制。然而这一顾虑可能源于教师对于现有学术评价体系变革的抵触情绪,因为书面作业通常被批评为乏味且无法有效地评估学习成果(McMurtrie, 2023)。

教师们的担忧主要集中在 ChatGPT 无法真正理解所讨论的内容,并耗时进行相关性和准确性的评估。这台简单的文本生成工具仅能模仿现有内容,并未能深入理解其意义。这种担忧可视为支持将 AI 应用纳入黑名单政策的理由之一。然而,在微软尚未将其整合到 Microsoft 产品组合之前这一过程可能会持续一段时间。到那时, ChatGPT 成为主流, 教育机构可能来不及调整政策, 以指导学生适当使用它。

采用实践导向的策略并专注管理ChatGPT带来的挑战可能是更为有效的做法。
Brown等人(2020年,《人工智能研究》第9页)指出:
语言模型在多个有益领域展现出广泛的应用潜力,
包括代码生成与自动写作系统、语法辅助工具以及游戏叙事生成器,
同时还能提升搜索引擎响应速度与问答系统的性能。
然而这些应用也存在潜在风险。
GPT3显著提升了文本生成的质量与灵活性,
使得区分合成文本与人类创作的内容难度加大,
从而可能推动更多潜在有害的应用出现。
在此研究重点在于探究语言模型可能产生的负面影响,
而非暗示其危害必然比益处更大,
而是为了深入研究并尽力减轻这些潜在危害。

通常,当颠覆性教育技术进入课堂时,教学和学习实践通常会面临许多挑战。教育从业者和政策制定者总是负责管理这种情况。当这些挑战没有得到解决时,可能会暴露出不充分的教学实践。社交媒体上有关一名中国女学生购买机器复制大量中文文本作为她作业的耸人听闻的报道(Today Online,2019年;见图17)。它不仅能复制中文文本,而且还巧妙地设计成模仿女学生的笔迹。女学生设法逃避做作业,直到被她的母亲抓住,并在社交媒体上羞辱她。根据给出的例子,人们可能会得出结论,如果一台机器能够智胜教师的教学法,它可能能够取代教师。在这方面,教师必须将挑战转化为机遇,并适应变化。

在这里插入图片描述

图17:一台中文自动书写机器(YP,2019年)。

使用ChatGPT进行教育:机遇

ChatGPT开发出撰写学术论文的能力对教育工作者提出了严峻挑战, 但一些教育工作者似乎已准备好接受这一颠覆性的人工智能技术在未来教学与学习创新中展现出的机会. McMurtrie(2022)的研究结果表明, 具有类似功能的人工智能系统, 包括ChatGPT, 将逐渐融入日常写作实践, 类似于计算器与计算机已在数学与科学领域占据重要地位. 同样地, Sharples(2022)建议应当鼓励师生共同参与设计与运用这些AI工具, 从而促进学习过程而非简单地禁止其使用.

虽然学术研究被视为受到ChatGPT这种颠覆性技术的威胁,但这同时也为教育者引入创新性评估提供了机会.在多数情况下,评价系统既被视为教师使用的工具也用于评估学生的学业表现.然而,在多数情况下,教师缺乏将评价用作教学工具以促进学习以及将其融入教学实践以实现个性化学习路径的能力.这方面机构可以利用这个机会来提升教师在创新性评价方面的专业能力,以便通过类似ChatGPT这样的颠覆性AI技术来优化教学方法.我们的建议部分(见下文)提供了关于如何促进创新性评价实践的更多细节.

教师还有一个值得探索的机遇是借助ChatGPT优化教学模式。通过翻转学习方法, 教师能够确保核心任务在课堂上得以完成, 并更加注重多媒体作业或口头报告, 而不是传统的书面作业. 此外, 教师还有机会在课后为学生提供更加细致地指导和帮助完善他们的作品.

作为一种强大的工具,在促进实验性及体验式学习方面具有显著优势。借助ChatGPT这一工具,则能系统地比较不同策略与方法的有效性。其中一些教学模式包括基于游戏的学习(Sutton & Allen, 2019)以及以学生为中心的教学法(Mills, 2023a)。对于那些热衷于动手实践与体验式学习的学生而言,在使用ChatGPT作为辅助工具时将获益匪浅。

基于恰当的教学策略, ChatGPT可用于促进参与者之间的协作与团队协作. 能够设计一系列围绕学生的教学方案, 在小组形式下开展. ChatGPT的应用具有潜在作为的一种工具或方法, 能够帮助生成多种情境, 从而让参与者共同解决实际问题并达成目标. 这种途径下, 可以为我们提供一种有效的途径来提升社区凝聚力, 促进彼此间的交流与互助.

尽管 ChatGPT 被广泛认为是教育领域的颠覆性技术工具,在教学与学习过程中仍面临着诸多挑战与争议。然而这一技术象征着学习者如何利用其来重塑教育模式的可能性。在后续的内容中,我们将探讨并提出关于如何通过 ChatGPT 推动教育创新的一些初步见解与实践建议。

对高等教育教师和机构的结论和建议

有了像GPT-3和ChatGPT这样的工具,AI似乎正成为主流(Vincent, 2022b)。

未来的发展尚不确定;令人感到意外的是,在这一领域中反抄袭软件正在利用人工智能技术来检测作业的原创性程度;不同的人工智能系统(包括但不限于ChatGPT)能够在短短几秒钟内实现规避抄袭检测系统的目的;当人们意识到GPT-3能够通过简单的指令指导生成器为学生的作业撰写评论时;这种行为本身就带有讽刺意味:“这是这篇学生论文的简要评价:”(Sharples, 2022b)。一个第一层的人工智能实例成功地规避了第二层的人工智能系统;随后又被第三层的人工智能系统进行了评估;在这个过程中;人类仅需执行几个简单的操作指令;却并未从中获得任何知识或收益。

建议

在禁止或完全禁止使用ChatGPT与将其纳入教学计划之间呈现极端态度的情况下,在高等学府中如何应对这一新技术带来的挑战?面对这一技术的影响及其潜在风险,请问:学生、教师以及教育机构应该如何应对?根据Marche(2022)的研究表明,在未来十年内学术界可能会逐步适应这一变化趋势:学生们将需要两年时间来掌握这项技术的基本原理;随后教授们则需三年来意识到学生的自主学习能力……尽管这种做法反映出许多高校在管理上的僵化迟缓特性——例如在政策执行层面往往存在‘等一等’的态度——但这并非解决问题的最佳途径。

一般情况下不主张采用监管式的方法(主要关注通过技术手段如ChatGPT等AI工具来识别学术不端行为)。相反更赞成建立一种注重师生之间互信关系的教学模式,并将其应用于以学生为中心的教学方法、评估机制以及将评价视为促进学习而非仅用于评分的过程(Wiliam, 2011;Earl, 2012)。构建对齐原则要求我们确保学习目标、教学过程及评价体系在本质上具有一致性与协同性(Biggs & Tang, 2011)。以下是我们团队对于相关建议的一些初步想法供参考。

针对高等教育教职员工的建议

一个可行的解决方案是采用闭卷考试形式,在不借助任何电子设备的情况下让学生手动撰写答案(Cassidy, 2023)。针对在线测试场景,则可以通过实时监控系统进行管理。然而这种评估机制(或至少过度依赖它)逐渐失去时代感,在短期内无法有效培养学生的主动学习能力;当考试结束后不久就很快遗忘所学内容(Van Bergen & Lane, 2016)。随着教育目标转向注重毕业生的职业能力培养,在线考试的重要性相对降低

另一种方法是制定写作任务目标。这些系统目前在处理复杂问题上存在不足。鉴于技术的发展速度这种替代方案可能仅能提供短期解决方案。研究者Mills(2023b)提出了以下建议:包括但不限于首先是针对图像和视频内容进行分析其次是基于课堂讨论中提出的观点展开深入分析再次是对那些超出现有提示能力的长文本进行详细解读最后是撰写关于那些不在现有训练数据范围内的新兴事件的文章。此外我们还可以鼓励学生选择一个高度具体且独特的话题这将有助于提高AI系统检索相关信息的难度。同样地在教学中鼓励学生在作品中融入个人经历或观点(Nowik, 2022)也是一个值得探索的方向这也强调了评估学生整合多源信息并提出原创见解能力的重要性(Nowik, 2022)。

目前,在ChatGPT的主要功能中存在一个显著的局限性:它无法直接提供来源信息或引用列表。尽管该系统具备推荐书籍及其相关理由的功能(OpenAI, 2021),但在回答问题时却未能整合文中引用或参考文献索引这一关键点上存在明显不足。然而,在这一领域已初步实现突破:WebGPT原型不仅具备网络资源浏览能力(OpenAI, 2021),还能通过验证来源获取高质量引用支持。此外,Elicit(https://elicit.org/)作为一个旨在辅助研究人员提升工作效率的研究助手,不仅能减少撰写文献综述所需的时间,还能通过其强大的检索功能从海量学术数据库中快速定位相关文章并返回摘要信息(Andrews, 2023; Tate, 2023)。该系统采用基于GPT-3的人工智能技术,结合丰富的内容管理系统,展现出独特的优势与潜力

检测工具(如Writers.com提供的AI内容检测服务)能够评估一段文字是否由大型语言模型撰写(Tate等人2023;Sandlin 2022;Mills 2023a;McMurtrie 2023;Montclair State University 2023;Yousif 2023)。识别真实作者与AI生成的区别是一个复杂而艰巨的任务(Wiggers 2022)。为此,OpenAI等公司正在探索利用"标记技术"来识别真实作者与AI生成的区别(Wiggers 2021)。这一任务具有显著挑战性,并已取得一定进展(Wiggers et al. 1994)。这些努力将激励双方在技术上进行竞争。如果历史可作为判断标准,则学生可能会设法规避检测机制(McMurtrie 1987),导致许多教师不愿扮演写作警察的角色(McMurtrie 1988)。在无法确定原创性的情况下,默认假设学生了解自己的论文内容并接受口头测试作为验证手段(Allen et al. 1996),这将进一步加重教育工作者的工作负担。或者要求学生提交录音录像作为论文提交文件,并进行元认知反思以确保写作过程的真实性(Allen et al. 1996)。

在评估领域中, 我们建议避免将评价过程与传统的考试模式相联系, 这种做法可能导致无法准确判断是否由计算机完成任务(Herman, 2022)。为了培养学生的创新能力和批判性思维, 我们应构建以这些能力为核心的评价体系, 具体包括以下方面: 在课堂上实施特定形式的评价活动;鼓励学生通过演讲、表演、网页制作、视频呈现或动画展示等方式进行展示;允许学生选择他们最感兴趣的主题进行深入探讨, 并重视他们的表达方式和观点;以及采用真实情境下的创造性学习评估方法(Wiggins, 1990)。这些评价方式不仅具有实际意义, 更能激发学生的内在动力。

学生们同样可以参与同伴评估以及与之相关的反馈教授。作为医疗保健领域中最常用的一种沟通确认方法之一,在此过程中患者或学生需要用语言来表达对所学内容的理解。

在理想情况下, 高等教育教师会营造一种环境, 让学生全身心投入到学习中 (McMurtrie, 2022). 在这种情况下, Tan (2022) 强调了通过整合同理心、善良与同情心到教学过程中的重要性. 此外, 将写作被解释为一种思维方式 (Stevens, 2019), 如果他们依赖ChatGPT或其他AI完成写作任务, 他们可能会错过一项至关重要的学习机会.

此外,在课程设计中融入人工智能工具是一个值得探索的方向(参考Anson与Straume的研究, 以及McMurtrie在不同年份发表的重要著作; Fyfe, D’Agostino等人的相关研究同样值得关注)。为了更好地培养学生的能力, 我们应该强调向学生传授认识其局限性及其对写作的影响, 并通过展示人类(尤其是学生)在创作过程中所具有的独特价值来强化他们的写作意识。为此, 我们需要指导学生如何合理利用这些工具, 既要理解其带来的好处, 同时也要认识到它们可能带来的局限性或潜在风险。研究表明, 这些技术工具"可能有助于激发创造过程"(McMurtrie, 2023)。教师应当利用这些资源来辅助学生的写作与研究活动, 但必须明确避免取代对学生批判性思维能力的培养以及原创性的开发。正如Lim (2022)所指出的那样, ChatGPT是一项"非凡的技术成就", 它不仅为我们提供了一个突破死记硬背的方法, 更让我们有机会培养出能够超越传统学习方式的学生群体——正是通过这种反思与探索,在数字时代塑造更具创造力与思考能力的新一代人。

对学生的建议

我们的学生通常是数字原住民,在技术应用方面比教师群体更容易掌握且操作简单。我们建议我们的学生在发挥自身优势的同时也要关注需要改进的地方,并鼓励和支持他们在自身优势的基础上发挥潜力,并针对当前表现不佳的地方进行改进。

熟悉学术诚信政策并认知学术不端行为的后果;
掌握数字素养,习得AI工具(Zhai,2022)从而提升就业能力;
通过将AI视为一个辅助工具来提升写作技能和激发创意;
积极使用高质量来源并对低质量信息、错误数据以及虚假信息加以警惕(Kefalaki & Karanicolas,2020);
广泛涉猎书籍资料以培养批判性思维和创造力;
学习利用AI语言工具进行创作与编程实践,并通过实践探索解决现实世界中的实际问题。

对高等教育机构的建议

彼得·弗莱明指出,在‘糟糕的管理与政府预算关系紧张’的情况下(弗莱明, 2021年, 第157页;如弗莱明等人所言, 2021年),新自由主义特征包括私有化、公司化、市场化和金融化(见弗莱明, 2021年)。由于依赖利润丰厚的国际学生市场的大学在2020年的冠状病毒疫情及其随之而来的旅行限制面前遭遇困境(鲁道夫, 2021年;帕克等人, 2021年)。面对如此具有挑战性的环境,在受到诸多限制的情况下运营高等教育机构显得尤为困难(卡西迪, 2023年)。然而,在最近的一项研究中发现(谢泼德, 2023年),其他澳大利亚大学已决定允许作业中使用AI技术,并要求学生公开使用该软件作为声明的一部分。为此我们提出以下建议:

意识到数字素养教育的重要性至关重要,并且应当将其作为课程的一部分引入人工智能工具——除了上述提到的 Grammarly(一种利用 AI 检查文本语法、拼写、标点及其他写作相关问题,并提供改进写作建议的强大写作与语法检查工具)之外,还有其他有用的人工智能工具如 Elicit(Tate, 2023年;Krügel 等人, 2023年;Shepherd, 2023年)等。
确保教师既能投入教学又能让其激励学生参与;
开展对教职员工进行 ChatGPT 等 AI 工具应用能力培训;
为学生开展学术诚信教育;
避免开设那些对学生产学者无意义(因而可能导致他们作弊)的教学内容;
更新学术诚信政策及荣誉守则,并特别考虑如何结合使用 AI 工具;
具体而言,请制定关于在教学中运用语言模型的相关政策及详细指导方针——这些指南应包含正确使用这些工具的方法及违规作弊后果的相关信息;
此外,请鼓励和支持关于 AI 工具在教学中应用效果的研究工作。

在我们的标题中,我们探讨的是ChatGPT究竟是一个会编造谎言的生成工具,还是传统高等教育评估体系即将被AI取代的命运共同体。经过观察,我们发现ChatGPT偶尔会编造谎言,例如它能够创造出虚假的信息来源,如参考文献等。此外,我们认为为了应对日益强大的AI技术的发展趋势,有必要对传统的学术评估方式——如论文撰写和在线考试——进行根本性的改革,除非大学希望培养类似于驾驶学校的骑马技能教师。

当手持计算器普及时, 人类对计算能力终结的关注从未如此之多。如今, 它们已经成为教授数学不可或缺的部分, 同时也在智能手机中无处不在。学生与学者都依赖智能校对工具, 同义词词典以及维基百科等资源。像ChatGPT这样的生成式AI将在未来很快成为所有word处理软件的标准配置——作为写作辅助工具(Warren, 2023)。

致谢

我们表示衷心的感谢给Begüm Burak、Margarita Kefalaki等六位同事提供了宝贵的的意见和建议。其余任何错误均应归因于ChatGPT的责任。

全部评论 (0)

还没有任何评论哟~