Mon - Fri: 10am - 5pm
+86+86 186 7944 5240
Home- Blog- Blog Details
随着毕业季的到来,高校正面临着论文中“AI 味”过浓的新挑战。除了传统的查重、盲审和答辩,今年的毕业生在提交论文时,又增加了一个环节——AIGC(人工智能生成内容)检测。
设想一下,一名毕业生发现自己的论文AI生成率达到了62%,远超学校设定的15%上限。他尝试使用一个大型模型,输入“请将这篇论文改写得更像人类所写”,结果再次检测时,AI生成率竟飙升至94%。这种情况并非孤例,近期不少毕业生都遇到了类似的问题。
央视新闻近日详细介绍了检测论文AI生成率的原理。首都师范大学教育学院副院长蔡海龙解释说,传统的查重是通过比较论文语句与语料库中的语句是否重复,从而做出确定性的判断。而AI检测则是运用AI系统来识别人类文本,判断其在语义和语言风格上是否与AI写作存在重叠,其本质上是一种基于概率的分类,而非基于证据的确定性判断。
当前AI检测技术的核心难点在于“用AI去查AI”,这使得区分文本究竟是人类作者还是AI所写变得困难,无法给出明确的解释和说明,这也是技术上最关键的瓶颈。
此外,中文语言表达的丰富性和多样性也给AI检测带来了挑战。语义的深邃和表达方式的多变,常常导致人工智能系统在检测人类作者写作的语句时产生诸多歧义,增加了检测难度并影响了准确率,这是造成误判的重要原因之一。
鉴于AI生成率检测目前尚未达到完全精准,教育界人士建议,在论文审核过程中,应建立透明且可追溯的AI使用标注制度,而不是简单地设定AI生成率的“红线”。在判定机制上,应推行以人工评审为主、AI检测为辅的“人机共判”模式。
目前,许多高校在检查学生论文时,会设定“AI率”的检测标准,但不少学生反映,学校的检查依赖于指定的检测平台和算法模型分析。
一般来说,国内主流高校多采用知网、维普、万方等平台的AIGC检测模块。当央视记者就“AI大模型如何检测文章的AI生成比例”这一问题询问多个大模型时,它们普遍总结出通过“困惑度与突发性”等特征进行判断。AI生成的文本通常更为“平滑”,而人类文本的波动性则更大。
大模型解释道,困惑度衡量的是文本的“可预测性”,越是包含人类特有的、意料之外的、跳出常规的表达,就越像人类写作。突发性则指文本节奏的波动——人类写作的节奏如同心电图般起伏变化,而AI的输出则相对平稳,如同直线。那么,这种判断方式是否准确呢?
专家对此表示,除了困惑度、突发性等指标外,AI文本生成过程是通过预测下一个最有可能出现的词语的概率来实现的,可以理解为一种基于概率统计的方法。因此,目前检测AI生成内容的准确性无法达到100%,误判的情况也时有发生。
October, 2016
October, 2018