林黛玉葬花之时曹雪芹乱入,并与宝玉、袭人发生一场持续千年的世纪大战;鸿门宴再现,项羽喊着 " 伟大与光辉 " 与樊哙打作一团、而后项庄趁乱刺死刘邦;孔融让梨引发一场长达十多年的报复和最终精心谋划的血案;《桃花源记》中善良淳朴的村民竟会为了保守桃花源的秘密而设计害死渔民……
这些熟悉而又陌生的内容,并不是网友们对经典文学作品的恶搞,而是来自于 AI 的故事续写。
今年以来,由 AI 续写故事作为文本的视频在 B 站悄然流行开来,一些 UP 主利用市面上的 AI 创作应用续写人们熟知的文学作品,再将新的作品以人声演绎,配上 BGM 后制成视频。
经过 AI 的一顿操作,名著成了爆款爽文,前有诸葛亮开战斗机,后有庄子研究 " 三体 ",各种平行世界信手拈来,AI 一本正经胡说八道的本事,比过去的地摊文学还强。
其实,对于相关工具的使用者而言,用 AI 进行创作并没有技术门槛:只需输入文学作品的某些片段,AI 创作机器就会根据给定文字的内容与风格对故事进行续写,这些经过 AI 二次创作的故事,往往情节曲折离奇,与原作的走向大相径庭,这种内容因为反常规和新鲜感而受到一些网民的追捧。
不过话说回来,艺术创作这种高度创意化、个性化的工作,原本被视为 " 人类的最后一片净土 ",是理论上最不可能被人工智能取代的工作之一,可如今人工智能技术的发展却为艺术创作开辟了一条新的捷径。本期全媒派探析 AI 创作正在对内容创作领域产生怎样的影响。
AI 写作是怎么回事?
AI 创作也就是机器人写作,这是一种拟人化的说法,实质上是指通过一定的计算机程序,对输入的信息进行自动化的分析、处理和加工,从而生成一篇较为完整的文章。总的来说,今天流行的 AI 续写,其实已经算是比较成熟的能力。
随着人工智能技术的快速发展,自然语言生成(natural language generation, NLG)技术在世界范围内得到广泛的应用。《纽约时报》和美联社等新闻机构都曾采用 NLG 技术来撰写新闻报道;仅在 2014 年,技术公司 Automated Insights 就实现了以每秒超过 2000 篇的速度生成新闻报道,全年发布新闻共计 10 亿多篇。 [ 1 ]
图片来源:视觉中国
AI 写作背后的原理非常复杂,其核心是自然语言处理(natural language processing, NLP)技术,同时涉及到数据挖掘、机器学习、知识图谱等多项人工智能技术。自然语言处理是指让机器拥有理解并解释人类语言的能力,目标是让机器在理解语言上像人类一样智能,最终弥补人类交流(自然语言)和计算机理解(机器语言)之间的差距。 [ 2 ]
自然语言处理(NLP)涉及两个流程,分别是自然语言理解(natural language understanding,NLU)和自然语言生成(NLG)。市面上的写稿机器人大都是 NLG 系统,目前主要有模板式、抽取式和生成式这三种技术方向。 [ 3 ]
模板式写稿机器人主要通过优化算法,在预先存储的大量写作模板中,选择与给定材料相匹配的模板,将信息加以组合生成文本,是目前应用最成熟、实现最容易的一种机器写作方法。
抽取式机器人会对文本进行语义分析,识别冗余信息,抽取重要内容,通过摘录或概括的方法压缩文本,形成对于既定文字的摘要,再加以计算确保文摘的连续性,这种技术广泛应用于新闻内容概括和文摘生成。
生成式 NLG 主要通过深度学习和增强学习技术实现,机器通过大量的文学作品样本进行训练,学习各类写作风格、建立写作模型,再根据输入的文字片段获知任务需求,预测并生成与需求相匹配的文稿,进行输出。
从现阶段来看,模板式和抽取式写稿机器人的技术已经趋于成熟,在市场上得到了广泛的应用;生成式 NLG 技术更加智能,也是当前 NLG 技术中更为高级的目标,OpenAI 等研究机构在这方面做出了尝试,并在市场上得到了应用。
当 AI 创作技术应用于写稿,可以诞生机器版的记者、小说家、诗人、编剧等,而当它应用于绘画、音乐和舞蹈领域时,则可以 " 培养 " 出画家、作曲家和编舞人员。 AI 绘画创作大放异彩
利用机器绘画早已写入了人类的梦想清单:早在 18 世纪 70 年代,瑞士已经有人利用机械臂绘画;2016 年,谷歌研发的绘画 AI 在旧金山拍卖会上大放异彩,其作品一度拍出单幅 8000 美元的高价;2019 年,微软小冰独立完成的原创绘画作品在中央美术学院美术馆展出,并于 2020 年推出个人绘画作品集。 [ 7 ] AI 音乐创作谱写别样乐章
AI 在音乐创作中的应用比比皆是:2016 年,索尼公司计算机科学实验室 CSL 的 DeepBach 项目仿照巴赫的风格创作的合唱曲目,被专业音乐家误认为是巴赫的作品。
除了谱曲,AI 还可以创作可以唱出声音的歌曲,CSL 实验室的机器人 Flow Machine 模仿披头士的风格,自主创作了歌曲 Daddy ’ s car。法国计算机科学家 Pierre Barreau 创造的作曲 AI 应用 Aiva 可以根据需求创作不同风格的音乐,甚至可以根据图画作曲,Aiva 也于 2017 年成为 " 法国及卢森堡作曲家协会 "(SACEM)的首个非人类会员。 AI 舞蹈创作演绎非凡舞曲
有不少团队开发了舞蹈创作类的 AI:谷歌研究院建立了名为 AIST++ 的 3D 舞蹈动作数据集,据此训练的 AI 能够根据给定的音乐和一段 2 秒左右的种子动作生成长序列的逼真的 3D 动作。目前已有的舞蹈创作 AI 基本都能根据目标音乐生成与之匹配的舞蹈动作,并通过 3D 建模的方式将舞蹈进行表演。经过模型构建方法的迭代升级,AI 生成的 3D 舞蹈在动作质量、动作多样性和动作与音乐的相关性方面均有着还不错的表现。
AIST++ 舞蹈数据集的示例。| http://arxiv.org/pdf/2101.08779.pdf
OpenAI 公司最新推出的 GPT-3 模型,则开放了 API 服务,申请者可以调用 GPT-3 的 API,将其进一步开发为论文翻译工具,网页生成工具,前端设计器,聊天机器人甚至游戏开发工具。在 GPT-3 的身上,我们看到 AI 从某一个领域的创作者成为各方面兼修全才的可能性。 [ 8 ]
AI 作为内容生产者还有哪些缺陷?
AI 创作固然强大,但要想做到大规模的普及和落地,尚有一些问题横亘于我们面前。
首先就是 AI 的价值判断问题。机器学习只是提取训练集数据的风格特征,并对这种加以模仿,机器看似具有 " 学习 " 功能,实质上仍落入了按图索骥的窠臼。
AI 本身对文本创作并没有价值判断,所以在 AI 生成的故事当中,我们可以读到讽齐王纳谏的邹忌为了保住权势富贵而出卖小妾,读到为孩子买橘子的父亲在月台摔倒暴毙……这些离奇的情节不仅与逻辑不符,对正常的价值导向也难以判定。如果训练内容存在问题,或者某些用户输入时刻意引导,AI 生成的内容在伦理道德方面的处境更会雪上加霜。
其次是 AI 创作的版权问题。在当前技术框架下,AI 的训练效果在很大程度上取决于语料库,没有足够量的语料库,AI 便无法进行学习,更无法进行创作。
那么 AI 产出的作品该归语料的作者还是归 AI 的创作者所有呢?如果归语料作者所有,那么又如何为庞大的网络语料资源划定作者呢?如果归创作者所有,又能否将使用了相同技术线路和算法的创作者视为抄袭?这些问题仍然需要法理和伦理上的探讨。
图片来源:视觉中国
最后便是 AI 使用者的问题。
AI 为内容创作提供了一种更加轻松、便利的可能性,但在一些别有用心的人眼中,AI 成为了助长抄袭的洗稿工具:输入一段语句,AI 就会对语言结构进行重组,对关键词加以替换,从而在短时间内复制网络爆文……技术虽为中立,但不良的使用意图让技术成为了帮凶。
自 AI 诞生之日起,有关于 AI 取代人工的忧虑便不绝于耳。显然,由 AI 续写的故事虽然有点扯,但终究还是能满足一部分人的内容消费需求,甚至有走红的潜质。至于智能机器与内容创作者的关系,终归还是会走向人机协作、共生共进,而不是相互取代、零和博弈。