Top
首页> 财经资讯 > 正文

91获客AI2.0时代——人机智能融合

发布时间:2020-09-02 10:10:27        来源:互联网

“人工智能就像一列火车,它临近时你听到了轰隆隆的声音,你在不断期待它的到来。他终于到了,一闪而过,随后便远远把你抛在身后。”

2020年7月24日,以“新场景·新势能·新动力”为主题,91获客于遵义举办了人工智能产品发布会暨2020渠道大会。电子科技大学教授、美国亚利桑那州立大学访问学者、91获客首席科学家陈峥博士出席并做《91获客AI2.0演进之路》主题演讲,分享了91获客AI技术在内容写作的成果及2.0的发展。

1140_b557bbed9e5ec8bb78fb7edff8d12568.png

机器写作的发展与现状

说起机器自动写作,最早要追溯到2009年,美国棒球大联盟首次用智能机器人StatsMonkey通过统计分析,识别比赛期间的重大事件并总结整体比赛动态,自动编写了一篇体育报道。

到2015年,“写稿机器人”在行业中真正爆发。至今,最为成熟和典型的主要是新闻机器人、小说机器人、写诗机器人三类。


1140_7b20b646fb8d8e2cd469be11ef55c6f3.png


新闻机器人一般是基于模板的写作,即使用一个文章模板,将数据库中的结构化信息(包括具体数字、百分比等)填充进去。


1140_1b2b0b5e109341073497446274ea775c.png


小说和写诗机器人更偏向于另外一类,提取后整理、重组,即对包含无用信息的长自然语言文本进行分析,提取文章中的关键信息,重新组织语言后输出。

但都不是真正意义上的机器写作!

严格意义上来说,这些都是属于伪原创工具,存在随意拼凑,模板填空,同义词替换、变换,语义不通顺等等问题,长远来看并不可取。

什么是真正的机器写作

陈峥博士表示,真正的机器写作是需要完全依靠机器自动生成,是通过训练语言模型,对语言进行数学建模,然后不使用原始文本,而是通过人工智能的方式逐句地生成算法认为“最能够体现原文含义而且看起来像一句话”的文字。


1140_fddbce1c9888649d11c07c242f7d227f.png


如图所示,机器写作是一个学习、训练的结果。其本质是通过找到结果与多维输入之间的关系来进行预测,计算机是没有办法处理语言的,所以需要将自然语言转换为向量才能进行机器学习。

91获客AI1.0 到 2.0量变到质变的过程

1、从隐马尔科夫模型到深度神经网络


1140_e2a89fac41386cc96fa55943c9d0f2c7.png


首先,隐马尔科夫模型(Hidden Markov Model)是机器写作的初级模型,简单理解,就是一个输入只对应一个输出。

而91获客AI模型是利用深度神经网络(Deep Neural Network)。深度神经网络顾名思义是更加复杂、有深度的多层神经网络,N个输入对应N个输出,不断反复训练,模拟人的思考方式。

2、AI能力参数提升千倍


1140_46b6b6fef2fc9bfa67d6e5bc495c3a06.png


91获客AI1.0训练模型的参数个数为1.542亿,而当前,我们正在训练的2.0模型数据集容量达到45TB,参数个数1750亿,也就是说即将推出的91获客的AI模型2.0版本将在文本质量及相关性提升一个数量级。

这样的能力值能做什么事情?

前不久OpenAI发布最新的NLP模型,用户只需要输入需求,前端代码会自动生成,就连摸爬滚打几十年的资深IT人士都表示吃惊得说不出话来;另外,在去年DOTA2的顶级赛事TI8上,部分道具和功能禁用的条件下,以2:0完胜了人类冠军......编码AI、游戏AI、内容创作AI等等无不达到一个质的提升。

3、投入大规模硬件,AI计算力不断深化


1140_122e304bfa0961f03fc78f6ad4e534a3.png


左图可见,我们的模型参数量处于不断上升趋势,而边际成本在不断降低,这是因我们我们花费了大量资金投入了规模性计算机硬件设备,利用更好的计算机完成最高的算法。

人机共存时代未来可期

陈峥教授对于大家最关心的91获客机器写作几个核心要点进行了回答。

内容生成速度/质量。完全能满足现在的需求。

内容原创度/重复度。100%原创,且风格多样。

是否会被检测到。有可能,但很难。

最后,陈峥教授谈到,社会各界对人工智能需求和呼声越来越大,相信未来也是属于91获客的新时代,91获客将继续发挥AI和大数据技术的协同优势,创造更多跨行业跨领域的创新机遇,为企业营销注入更高更好的“新动能”。