AI创作出百万字小说,“人人皆能写长篇”不再是梦

发布时间:2024-07-08 12:43:47 来源: sp20240708

原标题:AI创作出百万字小说,“人人皆能写长篇”不再是梦

【面面观·人工智能网络文学创作】

编者按:

2024年6月22日,本版刊发一组文章,在理论层面从不同维度探讨了人工智能(AI)写作带给网络文学的影响。事实上,国内已有成功使用人工智能创作网络小说的实践:《天命使徒》长达100万字,使人工智能创作长篇文学成为现实;《机忆之地》匿名参加科幻文学大赛,在评委不知情的情况下获二等奖。本期继续围绕人工智能写作与网络文学的话题进行讨论,两篇人工智能小说的创作谈表达了未来人工智能网络文学创作的丰富前景,而青年评论家康春华则从两篇小说的文本出发,指出了人工智能小说创作所面临的难以逾越的难关和障碍。

人工智能在短篇文学尤其是诗歌创作上有所建树,但超长文本创作一直未能实现。这几年人工智能技术突飞猛进地迭代,人工智能文学创作也在不断打开新的可能。

近日,华东师范大学教授王峰团队取得一项重大突破——他们成功创作出一部百万字的人工智能小说《天命使徒》,标志着人工智能在长篇文学创作方面迈出重要一步。

《天命使徒》采用“国内人工智能大语言模型(以下简称“大模型”)+提示词工程+人工后期润色”的方式完成,整部小说超过110万字。一个勤奋的网络作家写作如此篇幅的小说大约需要一年,而人工智能机写仅用了一个半月。王峰团队的下一个目标是将这一时间缩短为两至三周。

“文学正经历着飞速的变化。我们在畅想未来的时候,很可能也正在见证某些奇迹的发生。”王峰如是表达着人工智能网络文学创作的前景。

记者:《天命使徒》讲了什么样的故事?它是怎样被创作出来的?

王峰:《天命使徒》描写了修仙者周青不断发现自我,在黑暗和光明两极间摇摆,最后牺牲自我,不再做孤独的守护者,而要做一个与所爱之人共享平凡日常的普通人的故事。人工智能小说,不是全部脱离人,而是人机协作,整体结构由人决定,细节描写由人工智能完成,这是一种新的创意写作方式。在创作时,我们首先对网络小说的结构进行了深入研究,分析情节脉络,撰写大量提示词,然后在人工智能大模型中批量生成内容,形成整体线索连贯的长篇小说。后期通过人工介入,对大模型生成的小说进行修改,删除重复、累赘的部分,为情节跳跃的部分撰写连接语句,最终打磨成型。

记者:小说呈现了什么样的风格,是否实现了预期效果?

王峰:小说整体线索能够保持一致,语言具备了一定的文学性,比如开头这样写道:“他紧张地握紧了手中的武器,指尖在冰冷的金属中寻找一丝安慰。他的心跳如同在狂风中的鼓点,敲击着他的胸膛。仪式即将开始,他需要做的,就是走向山谷中心的火光处。”但是,在细节方面还存在大量跳跃和重复之处,需要人工修改。比如,大模型对每个提示词的生成内容都是有始有终的,会为每次生成内容添加一个结尾,我们称之为“光明的尾巴”,这个就需要后期调整。在语言上,人工智能小说表现出一种愣呼呼的风格,不少大模型生成的作品都是论文腔,我们只能不断微调本地大模型来提升表达水平。下一步我们会训练出一个专注于文学(小说)创作的大模型,让“人人皆可写作长篇”成为可能。

记者:人工智能会根据提示词顺利生成适合的内容吗?创作过程中做了哪些调整?

王峰:提示词被业界亲切地称为“耳语者”,要提供情节、环境、人物情绪及事件等信息。一开始,我们希望大模型能够生成符合我们期望的文本结果,但现实是大模型的生成结果往往显得有些“失控”。我们努力进行控制,但很快发现,几乎所有的控制都无法完成任务。提示词长了不行,短了也不行。将提示词输入大模型时,每次生成的内容都不一样,如果重复输入六七次,所生成的内容就开始重复出现了,这让我们感到有些手足无措。后来我们领悟到:既然无法完全控制大模型的输出,何苦一味追求符合自己完美构想的结果呢?这或许正是大模型本身的特点。“失控”不是它的缺点,而是它的变量,试图让它按照我们的期望产生完美的文本结果几乎是不可能的。所以,我们不断调整提示词内容,只为小说提供一个大致走向,使情节保持连续性,而具体故事细节就交给了大模型。

记者:为什么说超长文本输出仍是人工智能的局限?未来的人工智能小说创作将是什么样的图景?

王峰:目前,人工智能创作仍是一问一答的形式,无法实现持续输出,我们要源源不断提供提示词。对每个提示词,国内大模型平均会生成500字的内容,所以创作100万字的小说,就要提供2000个提示词。其实,大模型的长文本处理能力主要体现在其阅读理解能力上,它首先要理解我们的创作意图,然后生成连贯性的语句。

技术是快速迭代的,随着更多大模型的研发应用,超长文本输出和人工智能阅读理解能力将不是问题。举个例子说,我大约在三年前开始组建团队,探索智能写作的方法。当时,邀请了计算机、文学、语言、哲学、古籍、数学、地理等多个领域的研究者共同探讨,基于当时的大模型技术制定了创作方案。但是,2022年底,国外某个大模型的换代升级给我们先前的设计带来巨大冲击,曾经的很多问题不再是问题。眼下人工智能技术如龙卷风般迭代,我相信现在的很多困惑和难题将来都会迎刃而解。

目前,人工智能在文艺创作上主要影响网络文学,因为网络文学写作模式化、类型化比较强,写作者可以借助大模型的帮助进行各个部分的细节写作,比如人物生成、物品生成、人物关系图谱生成、段落写作等。这些功能都已经实现,只是质量还不高,留有相当大的探索空间。

记者:很多人担心人工智能创作的版权问题。您怎么看待这个问题?

王峰:关于人工智能创作的版权问题,业界正在探讨。我个人理解大致可分为两个方面:一是训练语料的问题,二是生成产品的归属问题。前者目前是最主要的瓶颈,首先我们需要获得公开语料,并对其进行进一步加工,这在研究范围内是允许的。如果进行商业化运作,就存在备案等问题,我认为一定要寻找大模型发展与语料权利保护的平衡点。至于后一个问题,生成的产品著作权到底是部分归智能平台部分归个人,还是全部归个人,要看具体的约定。这些都是未来智能写作无法避开的问题,需要研究者和实践者共同探讨。

(本报记者 刘江伟)

(责编:孙红丽、杨迪)