首页 / 行业

权游结局烂尾,AI 能写得更好吗?

2019-06-10 09:08:00

《权力的游戏》结局烂尾？

《权力的游戏》第八季崩盘，在一片“烂尾结局”的评价声中落下了帷幕。采访身边很多剧迷的观后感，一位同事给的评价只有一句话：“书是一本好书”。

近日，国外，Medium 平台一位作者也分享了他的感受：

“权力的游戏”第8季的故事情节，因为其匆忙而不尽如人意的结局，让数百万名粉丝（包括作者）十分失望。大部分人都在呼吁重写该剧的最后一季，而其他人为了让自己舒心，则想出他们自己版本的结局。大家都在等待GRRM完成他的书，希望他能塑造一个更令人难以置信的角色，但这可能需要很多年。

作为一名技术人，任何问题都会忍不住想一下：技术能不能搞一下？

如果让 AI 学习 GRRM 的写作风格，然后写一个结局如何？

AI 能写得更好吗？

随后，作者便用年初 OpenAI 提出的 GPT-2 文本生成模型实践操作了一波。模型学习的是《冰与火之歌》（A Song of Ice and Fire）原著，输出三大反派人物（the Night King, Cersei Lannister and Daenerys Targaryen）的结局。

接下来的内容，我们会先简单一下 GPT-2，详细的介绍可以参考我们以前给大家推送的文章；然后介绍一下作者训练模型的方法；最后根据模型生成结果进行总结与反思。文章没有涉及非常详细的技术细节，而是从方法上帮助大家整体把握，后续无论是增加数据集，还是结合自己需求做调整，思路都可以借鉴，对技术细节没有进行详细说明。

GPT-2（生成预训练的迁移模型）

在现有的 AI 语言模型中，GPT-2 是一种达到了 SOTA 效果的文本生成模型。他能生成类似人类语言的连贯性语句，并且可以长期关注某个主题。相比于其他语言模型，GPT-2 两个较大改进在于：

大量数据：研究人员抓取了 800 万个网页，制作了一个 40GB 的文本语料库，用于进行无监督的训练。它涵盖了各种各样的主题，这就是为什么预先训练的模型非常适合迁移到特定领域，比如这次我们用到的原著 GoT。
大量计算：Transformer 模型结构中使用了 15 亿个参数。不过，出于安全考虑，他们发布了仅包含 3.45 亿个参数的较小版本。这次的模型也是使用这个版本。
迁移模型

GPT-2 使用的是 Transformer 网络架构，而不是序列建模传统模型 RNN、LSTM 等网络。不同之处在于 Transformer 使用基于注意力机制的解码/编码器，而不是拥有'memory'门和时间步长的循环单元。

编码器利用字节对和位置嵌入处理输入，其中位置嵌入描述的是输入句子中“嵌入的单词”和“在何处嵌入”。相同的编码器将字节和位置嵌入转换为矢量编码，然后将该矢量编码输入解码器，解码器的任务是将编码转换为目标文本序列。该输出和来自前一步骤的编码被馈送到下一个编码- 解码步骤，并且重复多次，以产生更好的文本序列。

而 GPT-2 就可以经过训练，预测给定输入句子中的下一个单词。如果模型可以相当准确地预测下一个单词，那么模型可能具备理解输入单词上下文含义的能力。如果不理解文本，语言模型只能预测符合语法规则的单词，而生成的文本可能不会符合语义规则。不同于机器翻译任务中的 seq2seq 模型，GPT-2 仅使用预训练模型 Transformer 中的解码器来生成后续文本，在文本生成期间并不需要编码器。

训练模型

数据：作者从《冰与火之歌》的 5 本书中摘录，组合文本数据用于训练。
模型：预训练 GPT-2 模型包含 345M 参数。
时间：该模型在 Google Colab 的 K80 GPU 上训练了大约12个小时。
在训练过程中，作者意外发现，预训练模型很擅长撰写《权利的游戏》里的角色特征，可能与在初始训练期已经接触过这些内容有关。想让模型撰写的内容更贴近 GRRM 的风格，需要继续利用 GoT 数据集。
结果与分析

先在原剧结局中，找出一些令大家感到失望的情节，然后再尝试用训练好的 GPT-2 模型生成结果，详细结果大家可以看下面的视频介绍，后面会对一些文本输出做部分介绍。

以下是视频格式的输出，后面是相同的文本输出。

https://youtu.be/_vSov4sldsQ

下面分析一下选取的 3 个场景

失望场景 1：重写Night King 虎头蛇尾的结局

根据 GPT-2，Hodor还活着并赶来救营 Bran，这真是一个转折点！或者可能是 Hodor的灵魂进入了 Bran 的身体。不过之后，也不知道这个模型想说些什么。。。

Lightbringer 是杀死 Night King的剑。如果 Night King 的冰剑原来是 Lightbringer 并且最终会杀死他，那会有多酷？！
就算编剧忘了，不过 GPT-2 还记得关于 Azor Ahai 的预言，还围绕 Lightbringer 做了不少展开。

这里有个地方很有意思，不是因为故事写得精彩，而是因为模型居然知道 the dragon 实际上是“Other”（也就是书中的 White Walker）。将所有这些细节正确地放在一个段落中，真的太奇妙了。神奇的是，这个模型已经完全了解有关人物的这些细节！
失望场景 2：Cersei Lannister 在没有任何计划或适当的战斗的情况下倒下

嗯，好吧，这个生成的剧本完全是垃圾。但作者还是保留了它，然后再试了一次！

这次稍微好一些！虽然模型输出的某些细节错了，特别是关于 Mad King，但”Jaime试图在那一刻给予 Cersei 力量的想法“还挺不错的。也许在这个时候使用某种野路子会给她的故事情节带来一些正义感。两个疯狂的女王，激烈战斗，毁坏城市的剩余部分。这也不失为一个更好的结局，表明为什么Iron Throne 的战争是不好的。
失望场景 3：Daenerys 急速转弯的结局

总是吃喝的好时光？我听说 King's Landing 有一家很好的咖啡店，Dany 可以尝试（如果它还没有被烧掉）
这段真是挺垃圾的，让我们再试一次。

这段也没有多大意义。两次下来，似乎模型坚持 Dany 想要将 King's Landing 的人们从暴君手中解放出来。
总结

虽然尝试为这些故事情节生成更多的样本，但没有哪个能在故事背景下讲得通。尽管生成的故事文本不够好，不过也能看出来模型清晰地描述了角色特征和技能。，并且在模型输出结果中也体现了彼此之间的关联。此外，作者认为 OpenAI 提出的 GPT-2 研究工作，也体现了近来 NLP 领域取得的一些进展。

同时，我们和作者一样，都很好奇在最大的 GPT-2 模型上训练会取得怎样的结果？毕竟模型训练数据也不是十分充分，感兴趣的小伙伴们可以把原著所有的文本数据加入到最大的 GPT-2 模型训练中，看看是有更多惊喜还是惊吓？

而无论是编剧的结局，还是 AI 改写的结局，其实大家心目中的 Perfect Ending 还是要等 GRRM 赶快写完他的书。

好吗写得结局都在

免责声明：本网信息来自于互联网，目的在于传递更多信息，并不代表本网赞同其观点。其原创性以及文中陈述文字和内容未经本站证实，对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺，并请自行核实相关内容。本站不承担此类作品侵权行为的直接责任及连带责任。如若本网有任何内容侵犯您的权益，请及时联系我们，本站将会在24小时内处理完毕。

最新内容

Efuse是什么？聊聊芯片级的eFuse
英飞凌推出XENSIV胎压传感器，满足智能胎压监测系统的需
FPGA学习笔记：逻辑单元的基本结构
创造多样信号的万能工具：函数/任意波形发生器
位移传感器结构类型及工作原理与应用
开关电源供应器的功能、应用场景以及重要性
重庆东微电子推出高性能抗射频干扰MEMS硅麦放大器芯片
拒绝一次性芯片，新技术：无线升级芯片
芯片迈向系统化时代：EDA软件的创新之路
智能安全帽功能-EIS智能防抖摄像头4G定位生命体征监测
卫星应用受关注，GNSS导航芯片/模块发展加速
AI边缘智能分析设备：智慧食堂明厨亮灶的智能化应用
美光低功耗内存解决方案助力高通第二代骁龙XR2平台
浅谈芯片常用的解密器
电路板技术水平和质量水平，影响着机器人赛道的发展前景
直播回顾 | 宽禁带半导体材料及功率半导体器件测试
写flash芯片时为什么需要先擦除？
DigiKey 凭借品牌更新荣获四项 MarCom 大奖
高精度3D视觉技术，助力工业机器人实现汽车零部件高效上
不只是芯片看看传感器技术我们离世界顶级有多远
加特兰毫米波雷达SoC芯片赋能室内安防新应用
所有遥不可及，终因AI触手可及
一种基于聚合物的化学电阻式传感器使患者检测更容易
MTK天玑9300重磅发布：全大核时代到来，330亿参数AI大模型
如何测量温度传感器的好坏？
ACCEL光电芯片，性能超GPU千倍，新一代计算架构将更早来临
如何利用示波器快速测量幅频特性？有何注意事项？
射频连接器使用技巧与注意事项
STC15W芯片A/D、D/A转换的简单使用
群芯微车规级认证的光电耦合器备受电池BMS和电驱电控
芯朋微：服务器配套系列芯片已通过客户验证可应用于AI
新能源高压连接器高压互锁(HVIL)功能详解
FPGA和AI芯片算哪一类？芯片的不同分类方式
MPS全系列电机驱动产品，助力新能源汽车实现更好的智能
基于穿隧磁阻效应(TMR)的车规级电流传感器
豪威发布新款 4K 分辨率图像传感器，适用于安防摄像头
苹果发布M3系列新款MacBook Pro/iMac：业界首批PC 3nm芯
硅谷：设计师利用生成式 AI 辅助芯片设计
电容式触摸按键屏中应用的高性能触摸芯片
DigiKey 推出《超越医疗科技》视频系列的第一季

手机

相关内容

AMD桌面市场的中低端显卡都在哪儿？
AMD桌面市场的中低端显卡都在哪儿？，NVIDIA,显卡,amd，显卡,市场,桌面,都在，AMD桌面市场的中低端显卡都在哪儿？-上一代显卡中，RX 6800 XT
全球超过90%的半导体产能都在10纳
全球超过90%的半导体产能都在10纳米或以上，10nm,半导体,微控制器，部门,美元,美国,半导体，全球超过90%的半导体产能都在10纳米或以上-
三相异步电动机上的故障解决
三相异步电动机上的故障解决，异步电动机,电动机，故障解决,电动机,三相异步电动机,都在，三相异步电动机上的故障解决-无论是家用单相
如何应对？全球PC市场迎来历史最大下
如何应对？全球PC市场迎来历史最大下滑，PC,数据,苹果，数据,下滑,市场,也不，此外，整体市场的不景气，不仅让品牌商感受到了寒意，产业链也不
电池生产及原材料的开采加工
电池生产及原材料的开采加工，电池,电动汽车,新能源，导致,紧张,原材料,电动汽车，很多汽车生产商都在迫不及待地向全世界推销电动汽车，
为什么人工智能技术已经进入“黄金
为什么人工智能技术已经进入“黄金时代”，人工智能,AI,神经网络，人工智能,神经网络,黄金时代,技术，为什么人工智能技术已经进入“黄
什么是摩尔定律？1nm是摩尔定律的尽
什么是摩尔定律？1nm是摩尔定律的尽头？，摩尔定律,1nm，摩尔定律,芯片,都在,这段，芯片制程的演化，从微米、亚微米、深亚微米，到193nm、157nm
比亚迪海豹将于本月开启量产工作，预
比亚迪海豹将于本月开启量产工作，预计月产量达1.5万，比亚迪，海豹,订单,汽车行业,本月，比亚迪海豹是比亚迪在今年5月20日开启预售的新

热门文章

DigiKey 推出《超越医疗科技》视频

华为公开半导体芯片专利：可提高三维
电流互感器作用电流互感器为什么
DigiKey 推出《超越医疗科技》视频
射频连接器使用技巧与注意事项
写flash芯片时为什么需要先擦除？
重庆东微电子推出高性能抗射频干扰
位移传感器结构类型及工作原理与应
苹果即将推出Mac系列新品，或搭载3nm

推荐文章

DigiKey 推出《超越医疗科技》视频

DigiKey 凭借品牌更新荣获四项 MarCom 大奖
Transphorm 最新技术白皮书：常闭耗尽型 (D-Mode)与增强
基于5G边缘网关的储能在线监测方案
Transphorm氮化镓器件助力DAH Solar(大恒能源)全球首
DigiKey 在 2023 年上半年新增 300 多家供应商

标签云

公司

视觉

机器视觉

智能

网络

系统

模型

参数

市场

行业

智能手机

显示

测试

解决方案

存储器

嵌入式

英伟达

平台

低功耗

升级

电网

4G

扩展

音频

猜你喜欢

2020年十大科技新闻汇总和解读
频率-电压变换电路
FAULHABER推出MC 3001系列两款新型
燃气灶脉冲点火器原理
Qorvo®推出两款高性能PMIC用于数
海洋所开发可独立供能的摩擦纳米发
今年年底,思立微将量产LCD屏下指纹
京东方与AOC合作推出首款34英寸Min
松下NE-K653 NN-K663微波炉电路图
5G成云计算重要引擎,运营商如何乘