特稿 >

前沿热点 >

AI作文不再遥远!人工智能已能“赏析”文学作品

AI作文不再遥远!人工智能已能“赏析”文学作品

语忆科技原创 丨 前沿热点

37328
5402

2017-06-21

语忆科技

Xtecher特稿作者

关注

近日,由阿里举办的以倡导API经济为主要目的的2017全国API Solution大赛正式于上海跨国采购会展中心落下了帷幕。本届比赛云集了国内众多顶尖的团队及他们所带来的产品创意和技术成果,其中不乏一些极具潜力、可能推动行业变革的作品。今天我们所要聊聊的便是这样一款在本次大赛中展现的新一代智能引擎——网络文学分析平台,以及利用人工智能分析网络文学IP价值的未来。


网络文学与IP


根据相关机构对我国网络文学市场体量以及网络文学用户规模的统计结果可知,近年来网络文学市场不断膨胀,虽然增长率有所下滑,但是截至2016年末,市场容量已经达到了惊人的90亿元人民币;与之相似的是,我国网络文学用户的数量截至2016年上半年末,也已经达到3.08亿人,即每4.5个国人中就有一个是网络文学读者。由此可见,网络文学在我国的发展前景十分可观。而其带来的巨大利益之一,便是IP价值被充分地开发。


Y视角:你知道人工智能是如何“欣赏”文学的吗?

Y视角:你知道人工智能是如何“欣赏”文学的吗?

数据源:2016中国泛娱乐行业数据报告


优秀的文学作品在当今不断被贴上了IP标签后都被版权方收购,并拍成了电视剧或电影,得到了广泛关注。而《花千骨》、《琅琊榜》、《三生三世十里桃花》等现象级作品更是聚集了大量目光,引起了全民观剧和热议,商业价值被无限放大…这些电视剧的共同点:剧本皆是根据已有的网络文学IP改编而成,通过借助原IP庞大的受众基础和良好口碑,形成极其高效化的市场宣传和品牌建设。再加以不错的制作团队和适当的拍摄成本,“爆款”几乎可以预期。


Y视角:你知道人工智能是如何“欣赏”文学的吗?

数据源:2016网络文学发展报告


以2016年为例,IP翻拍数量达到了132部,为2015年的2倍以上


IP充分开发


随着腾讯文学和盛大文学合并成立阅文集团,资本流入网络文学领域,挖掘网络文学IP价值变得越来越百花齐放,不局限于仅仅某一形态。


笔者以《择天记》这本经典的网络文学IP是如何进行开发和运作为例进行一个简单的分析。总体来说,不仅仅局限于最初的网页游戏,《择天记》这个IP被授权为端游、动画、电视剧、手游、电影等多重形式。阅文集团自身拥有《择天记》的版权,首先在《择天记》小说开始更新后,就将同名端游授权给了巨人网络进行端游的开发,于此同时,推出《择天记》同名的动画产品,于自身的腾讯视频进行线上唯一播放渠道,之后在经过两年小说更新时间,推出同名电视剧,找来流量小生鹿晗,在电视剧播出同时推出同名手游,所有一切的开发运作都是想把IP背后各产业的用户进行深度统一和转化。换句话说,开发商希望《择天记》的读者不仅仅是付费阅读,更通过来收看电视剧来增加收视率,也同样希望鹿晗的粉丝能通过电视剧去玩同名手游,进行充值消费,来达到一个商业闭环。


IP开发的瓶颈


Y视角:你知道人工智能是如何“欣赏”文学的吗?

中国网络文学生态图


作为网络文学市场急速膨胀的产物之一,各类网络文学平台纷纷孕育而生。目前我国活跃的网络文学网站已达千家。加上众多专注于IP孵化的版权提供方,可以说整个网文孵化的市场玩家已经趋于饱和,孵化能力的差异化和效率化变得至关重要。


然而,正如我们在上一篇《Y资讯:阿里AaaS大赛》中所提及的一样,在这样一个朝阳产业中,其最根本的IP挑选和审核流程却因为技术手段一直限制了其产出效率。编辑或者IP孵化的专业人士仍然需要每天阅读上百万字才能持续地从无数本小说中找到优秀的有潜在价值的IP。矛盾的是这样有能力从洋洋几千万字中提炼出文学作品价值的专家一般都具有着极其丰富的从业经验,对IP开发流程有着非常清晰的认识。而也真是这样一群人,却又要浪费不计其数的时间在阅读那些毫无改编价值的作品上。


故简单地说,目前网络文学IP挑选和内容审阅方面仍有以下三个问题需要解决:


1) 审稿效率低。网络文学大爆发,编辑的单日阅读量巨大,疲劳感将会降低工作效率和质量;

2) 评价难量化。如今的文学评价建立在编辑、读者的相对感性认识上,缺乏数值化的评价工具;

3) 标准难统一。文学类型多种多样,缺乏普适化、可比较的标准体系来对小说的走红潜力进行定量分析。


人工智能与文学分析


由于人工地对网络文学IP进行审阅及删选筛选有着各种各样的弊端,那随即而来的问题便是,在人工智能技术发展如此之快的当今,到底机器是否可以完全代替人类完成这项任务呢?或者,人工智能是否能在某种程度上帮助提高编辑或相关从业人员的文学审阅效率呢?答案是肯定的。


换个角度,我们所需要的人工智能系统即只需能帮助改善上文所提到的3个难点那便代表着我们的效率能被提高。这也正是语忆文学分析平台诞生的初衷,让我们来看看具体的解决方案:


首先文学作品本质是基于自然语言的文本数据集合,这要求智能系统不可避免地需要一定的自然语言处理能力。有别于传统的文本语义识别,网络文学分析平台所运用到的核心技术是目前领先的中文情感解析引擎,该引擎不止能判断自然语言情感的正负极,还能从语句中提炼出多维度的细腻情绪表现。


Y视角:你知道人工智能是如何“欣赏”文学的吗?

语忆情感解析引擎示意


有了基于中文文本的情感解析引擎,我们就可以通过对小说的各个章节进行情感解析,把握章节间的情绪变动趋势。结合关键词技术,甚至可以对小说中的人物情感冲突进行精细化描绘等……最终我们可以得到如下多重分析维度:


  • 整体情绪极性值趋势

  • 各细节情绪趋势

  • 各情绪变化幅度

  • 小说节奏分析

  • 同类小说对比分析

  • 主要角色情绪分析


基于对上百本小说进行如上多维度地分析,最终对上文中所提到的“瓶颈”制定了如下解决方案:


1)审稿效率低 —— 定位精华章节


Y视角:你知道人工智能是如何“欣赏”文学的吗?

图1 整体情感极性变化趋势及节奏

Y视角:你知道人工智能是如何“欣赏”文学的吗?

图2 细节情绪变化趋势及节奏


通过分析小说整体情感极性值以及细节情绪变化趋势,我们发现每一本小说的高低潮情节对应的文本情绪变化趋势有着非常显著的特征。诸如《盗墓笔记》《鬼吹灯》一类的惊悚类小说,“胆怯”的情绪值在高潮部分有着显著的上升。而类似《裸婚时代》的都市题材作品,读者由于会产生相对较强的带入感,其情绪则主要以“焦虑”“兴奋”为主。同时,我们根据不同作品的整体情绪表现设定了一个“正常范围”,从图1中我们可以看到本书有许多超出设定的阈值上限……基于这些分析,我们可以快速地帮助编辑迅速定位文学作品的高低潮章节位置,让其有个理性的对文章结构的认识,同时也便于精准地定位审阅。


2)评价难量化 —— 量化阅读体验


Y视角:你知道人工智能是如何“欣赏”文学的吗?

图3 量化阅读体验示例


通过文学分析平台,系统为原有的人类感性体验赋予了可量化的数值。如图3,一些我们在阅读文学作品时常见的感性体验都可以通过语忆的情绪解析引擎加上归纳算法,形成语忆特有的映射函数,从而将这些感受都转化成了可量化的数值。这些指标同样能为编辑或版权运作方提供了数据化的决策支持。


剧情紧凑度感受= f(高潮章节密度)

剧情紧张度感受= f(焦虑、兴奋等情绪变化幅度、密度)

剧情精彩度感受= f(激动、悲伤等情绪变化幅度、密度)


3)标准难统一 —— 定义指数标准


语忆潜力值 = f ( 情绪幅度变化指数,高潮区域比,低潮区域比 )


利用上述的可量化参数,网络文学分析平台为所有文学作品建立了一套评价标准,我们将其定义为语忆潜力值。这是综合了由语忆情绪解析引擎所判断的高潮章节区域比、低潮章节区域比、情节波动性等因素所构建成的一个量化指标。我们将这个指数与近年来已影视化的几部大IP进行比较,如下图所示,柱状图代表潜力值大小、虚线则为我们所对应IP改编成的影视作品在线总视频播放量。可以看到,除了《芈月传》和《花千骨》两部远超预期表现的现象级IP之外,其余IP潜力值高低都大致符合了改编后的热度表现。这更让我们相信,通过语忆潜力值,人工智能某种程度上可以帮助网络文学IP开发商更好的识别判断哪些网络文学IP在剧情结构上更具有改编成影视剧的潜力。


Y视角:你知道人工智能是如何“欣赏”文学的吗?


除此之外,网络文学分析平台还可以定制小说节奏分析,同类小说对比分析,主要角色情绪分析,主要角色联想等等一系列功能,帮助编辑及IP开发商从更多的维度上去理解一部文学作品。


最后我们不得不面对的一个事实是,在这个新兴的行业环境中,IP开发和孵化所需要遇到的抉择和难题是异常复杂且多变的,其中很多环节都缺乏标准化……然而,我们依然相信,当这个产业越来越成熟之后,人们会更多地抛开各种各样的外在干扰而专注于内容本身的优胜劣汰。而随着文本分析算法的精进和越来越多交叉人才的参与,利用、甚至依靠人工智能提升IP挑选和内容审阅将是未来的必然趋势。

【本文来自投稿,文中观点不代表Xtecher立场。】

打开微信“扫一扫”,打开网页后点击屏幕右上角分享按钮

账号登录

重置密码

还没有账号?立即注册>

账号注册

已有账号?立即登录>注册企业会员

重置密码

返回

绑定手机