|
|
|
|
|
|
|
| ( 2026-04-10 ) 稿件来源:新华每日电讯 新华智见 |
|
陈楸帆
1776年夏天,托马斯·杰斐逊在费城一栋租来的砖房里写下了《独立宣言》。然而,两百多年后,一款AI内容检测工具扫描了这些文字,给出了判定:99.99%为AI生成。
这当然是一个AI闹出的笑话。但它折射出的问题远比笑话本身沉重。
近来,越来越多的学者和作家开始做同一件事:把自己多年前甚至几十年前写的文章丢进AI检测器,看看结果如何。答案令人哭笑不得——荣誉退休教授保罗·斯皮克四十五年前的一篇论文,被判定有77%的内容是AI生成的;爱丁堡大学公共卫生学院教授的早期论文被判定AI概率高达90%;还有不少被判定为100%的案例。莎士比亚的作品、朱自清的散文、王勃的骈文,乃至科研人员严谨的学术论文、作家打磨许久的作品,纷纷栽在检测工具手里。
这些作品写作之时,AI大语言模型连概念都尚未存在。
问题出在检测器的底层逻辑。目前,主流AI检测工具主要依靠文本困惑度、用词可预测性和语句流畅度等指标来做判定。通俗地说,越是用词精准、逻辑严密、句式规范、没有语病和突兀表达的文字,越容易被判为AI所写;反过来,语序混乱、用词生硬、充满语病的内容,倒更容易通过检测,被认定为人类原创。
这套逻辑,把果当成了因。流畅是结果,不是原因。人类经过深思熟虑写出的文字和AI基于概率分布输出的文字,可以呈现出类似的表面特征,但成因截然不同。
打一个比方:机器生成的文字像工业流水线上的塑料贴膜,光滑、均匀、无一丝瑕疵,但那种平滑是空洞的、缺乏深度的逻辑与情感支撑,阅读之后给人一种浮泛感。人类打磨后的文字也可以很光滑,但那是手工打磨的木器,光泽之下保留着纹理和砂痕。一个句子为什么在这里拐了弯,为什么选了这个比喻而非那个近义词,为什么写到故乡时用的是“南方的盐田”而非“北方的麦地”,这些选择的背后是一个人全部的生命经验、文化记忆和审美直觉。检测器看到的是同样的光泽,看不见的是光泽之下截然不同的精神生产过程。
这里还藏着一层时间维度上的悖论。AI大模型的训练语料里,充斥着人类文明积累下来的经典文本。这些经典在诞生之初可能是偏离当时语言常规的创新,但随着时间推移,它们被大量引用、模仿、吸收进了语言传统本身,成为后来者(包括AI)学习的样本。于是检测器反过来把塑造了语言规范的经典文本判定为AI产物。把人类文明的语言遗产倒扣给AI,恐怕才是真正的张冠李戴。
更值得警惕的是,当这种有缺陷的技术被嵌入学术评审、期刊审稿和教育评估等制度体系之后,它就从一个工具变成了一种权力。它以技术中立的面貌行使着分类和裁定的职能:什么算人类创作,什么不算,由算法说了算。它可能倒逼写作者主动降低自己的表达水准,为了不被误判为AI,你得写得更粗糙、更不流畅、更像一个没有经过训练的初学者。技术设定了规范,人类被迫削足适履。当经典被算法否定、当写得好反而成为嫌疑,我们其实是在被一种技术迷思裹挟着,走向自我矮化。
那么追问到底:区分人类写作与AI写作,意义究竟在哪里?
如果是为了学术诚信,合理的做法应该是关注写作过程的透明度,而非对终端文本做一刀切的统计扫描。一个学生是否经历了独立的思考和检索过程,一篇论文背后是否有真实的实验数据和推理路径,这些才是判定学术诚信的核心依据,靠困惑度分数永远解决不了这个问题。如果是出于对AI取代人类创作的焦虑,那么焦虑的方向也需要调整。真正值得警惕的场景,是把AI当作降低成本、替代人力的流水线工具,让创作沦为纯粹的商品制造。在这种功利逻辑下,人和机器的关系才会不可避免地滑向竞争与替代。
但还有另一条路径。大模型的输出本质上是统计学意义上的最优解,天然趋向所有已有文本的某种加权平均。它非常擅长给出一个不会出错的答案,但那种好是中间值意义上的好。而文学的价值、思想的价值,恰恰在于偏离这个中间值。苏东坡在婉约成规中劈开豪放一脉,莎士比亚让王子在独白中质疑存在之虚无,鲁迅用文言的骨头撑起白话的血肉,这些都是带着个人执念的偏离,是概率模型天然排斥的方向。
有越来越多的创作者开始发展一种新的工作方式:用AI来确认那个统计中间值在哪里,然后有意识地避开这样的创作方向,我称之为“对抗性生成”。这种方法的核心是把AI当作一面镜子,让你看清自己不想重复之处,从而更坚定地走向自己的独特性。正如有学者倡导的,AI参与创作的评价策略应当致力于彰显人机协作与互惠的过程,推动艺术形式的革新。当人机协作的目标指向共生经验的探索,技术才可能成为协同创造的伙伴。
近期,我即将担任两项人机共创写作比赛的评委,深知这类赛事在规则制定和价值导向上面临的挑战。最终还是要强调:与其执着于判定一篇文章归属于谁,不如追问创作过程中发生了什么,人与技术如何互动,什么是人贡献的,什么是机器贡献的,以及在这种互动中是否产生了新的认知和审美可能。过程伦理胜于结果归属。
回到杰斐逊的故事。文字的力量从来不在于它的句法结构和用词的可预测性。一个人在特定历史时刻,面对具体的压迫与理想,在公共空间中发起了一个崭新的开端。当下这个时代,所有的技术都在让人加速、拆解结构。但写作,真正意义上的写作,仍然是一个人必须面对自己、和自己对话的时刻。工具来了又走,不停迭代,但讲故事的能力、与他人建立连接的能力、在语言中袒露自身脆弱与执念的勇气,这些无法被迭代,也无法被替代。
人类精神之所以无法被生成,不是因为我们的语言比机器更高级、更复杂,而是因为每一次真诚的写作背后,都承载着一个具体的人在面对自身存在时的全部信念。这种信念,算法无从计算,机器也无从度量。
(作者为中国作家协会科幻文学委员会副主任)