搜索
搜索

个性化与人工智能:信息传播的新现象 ——以今日头条客户端为例(上)

  • 分类:传媒
  • 作者:孟海波、李鑫、杜晨
  • 来源:
  • 发布时间:2019-06-19 15:07
  • 访问量:26

个性化与人工智能:信息传播的新现象 ——以今日头条客户端为例(上)

【概要描述】摘要:由于手机的随身性、私密性等特点,个体用户的个性化信息需求不断被激发,同时,智能手机的普及与性能提升,也使得推荐引擎、人工智能这样的前沿技术开始介入信息传播,深刻改变着人阅读的行为与信息传播的规律。个性化、碎片化、社交化、此报告以国内领先的个性化推荐引擎——今日头条客户端(以下简称今日头条)为例,分析机器学习、数据挖掘和智能分析技术如何满足网民的个性化阅读,并通过分析网民阅读大数据发掘在移动互

  • 分类:传媒
  • 作者:孟海波、李鑫、杜晨
  • 来源:
  • 发布时间:2019-06-19 15:07
  • 访问量:26
详情

摘要:

由于手机的随身性、私密性等特点,个体用户的个性化信息需求不断被激发,同时,智能手机的普及与性能提升,也使得推荐引擎、人工智能这样的前沿技术开始介入信息传播,深刻改变着人阅读的行为与信息传播的规律。个性化、碎片化、社交化、此报告以国内领先的个性化推荐引擎——今日头条客户端(以下简称今日头条)为例,分析机器学习、数据挖掘和智能分析技术如何满足网民的个性化阅读,并通过分析网民阅读大数据发掘在移动互联条件下信息传播的规律。

本报告主体分为五个部分,第一部分以今日头条客户端为例,介绍个性化推荐技术的特点和基本原理,第二部分主要通过分析不同区域、不同年龄、不同性别网民的阅读数据,发现不同网民群体的阅读特点;第三部分主要从阅读内容方面发现传播规律,通过分析个性化阅读研究移动互联网如何影响传播;第四部分是阅读大数据应用的具体案例,以“一带一路”话题为分析样本,寻找网民的关注点和相关信息的传播特点,例如,网民对“一带”的关注度要高于对“一路”的关注度;第五部分综述,对全文进行概括。

 

关键词:移动互联网、人工智能、算法、大数据、个性化、政务新媒体

一 今日头条是依靠机器学习、大数据挖掘的智能分发平台

  今日头条诞生于2012年8月,截至2016年6月,客户端总下载激活量已超过5亿,日活跃用户超过4800万,平均每个用户每天的使用时长达65分钟,是用户平均使用时长最长、日均启动次数最多、社交分享量最大、第三方好评度最高的移动资讯客户端。

(一)产品特点:

今日头条可根据用户的阅读习惯、结合用户所处的环境和文章内容等,向用户推荐个性化信息,随刷随有、千人千面。今日头条在满足广大用户对个性化信息阅读需求的同时,也在移动互联网上建立了先进的信息分发平台,为不同种类的信息发布提供了最有效的技术支撑平台,如政务头条号平台主要推荐分发来自各级党政机关的权威信息、政务信息、正能量信息;头条号平台则面向广大自媒体创作者,将他们的文章精准推荐给对其内容兴趣相关度高的用户,以取得良好的传播效果。

(二)技术发展带来传播形式变革:

从信息传播的角度来看,今日头条是信息传播的新型技术平台,通过先进的推荐引擎,让信息的传播更具效率。具体有如下优势:

1.个性化信息,千人千面,随刷随有

今日头条的信息流是基于分析用户的兴趣后产生的,并且可以时时刷新,信息层出不穷。这些都是“今日头条”在移动互联网上的重要创新。

2.信息精准抵达受众,极大提升了信息传播的效率

通过数据挖掘、智能分析、机器学习等技术,今日头条通过机器对每则资讯进行计算和分发3,并且能够结合用户阅读习惯、阅读时间、阅读环境等多个维度,建立起个人用户模型,两者结合后,可以智能地为用户推荐越来越精准的个性化信息。

3.大数据+算法,越用越懂用户

今日头条之所以非常懂用户,得益于大数据与算法。今日头条的后台系统每天观察4800万用户的使用行为,每天产生100 TB的数据,通过大数据挖掘不断的促进机器学习功能,进而使得今日头条越来越了解用户的兴趣分布。

4.“人找信息”变为“信息找人”

今日头条的推荐引擎能有效帮助用户快速发现感兴趣和高质量的信息,降低用户信息搜集成本,提升用户体验,增加用户使用产品时间,并有效减少用户浏览到重复或者厌恶的信息带来的不利影响。

(三)今日头条的市场地位

TrustData在2015年11月份发布了《2015年1月到10月份的中国移动互联网新闻客户端发展分析报告》,其中显示出2015年新闻客户端日均活跃用户覆盖率从10%左右增长到约14%,用户规模上升约四成。今日头条月度覆盖率占据6.77%的市场份额,与腾讯新闻客户端共同构成新闻客户端的第一阵营,远高于其他品牌新闻客户端的市场占比,具体数据见图1。

图1新闻客户端月覆盖率TOP10(数据来源TrustData)

 

根据QuestMobile2016春季APP实力榜单数据,2016年1季度今日头条平均阅读时长在安卓和iOS两个平台上均位居第1位,两平台数据均远高于位列第2的网易新闻客户端。其中今日头条在安卓平台的平均阅读时长为723.4分,在iOS平台的平均阅读时长为882.2分,由此可以看出IOS平台的用户阅读粘性更高,具体数据见图2。

 

图2 2016年1季度新闻客户端用户平均时长(数据来源:QuestMobile)

 

QuestMobile数据显示,2016年第一季度新闻客户端阅读总时长方面,今日头条在安卓平台和iOS平台上均位居第1位。首先,今日头条在安卓平台阅读总时长为3646995万分钟,位列第一。其次,今日头条在iOS平台阅读总时长为2616308.6万分钟,在时长和增长率方面排名第一具体数据见图4。

图3 2016年1季度安卓平台新闻客户端用户阅读总时长(数据来源QuestMobile)

 

图4 2016年1季度iOS平台新闻客户端用户阅读总时长(数据来源QuestMobile)

 

(四)报告术语界定

1.评估时间范围

2015年6月1日至2016年5月31日

2.名词解释

头条号:今日头条公共信息发布平台,头条号注册单位发出的文章可通过今日头条客户端分发。

跳出率:指用户点开一篇文章后又马上退出的比率,“马上退出”以停留时间小于3秒来衡量。

性别占比=男(女)用户数/头条全网用户数

用户占比=某年龄段用户数/头条全网用户数

阅读占比=某人群阅读数/该人群全网阅读数

相关度=某关键词与相关话题同时被阅读的次数/相关话题的总阅读数

二  今日头条用户行为分析

(一) 用户规模

对今日头条用户数据的分析,截至2016年5月31日,今日头条累计激活用户数达到5亿人次,男女性别占比有一定差距,具体数据见图5。在“今日头条”客户端上中18岁到30岁的青年是主力用户人群,占比超过全部用户数的3/4,其中24-30岁人群占比最大,接近全体用户数的1/2,18-23岁人群占比也超过了全体用户数的1/4,其他具体数据见图6。

     图5 今日头条用户性别占比                                                 图6今日头条用户年龄段占比

 

(二)用户区域分布

通过对今日头条用户数据的分析,我们发现在今日头条上广东省的用户数量最大,占到全部用户份额的12.58%。用户占比超过5%的省份属于第一梯队,占到全部用户数量的39.06%,分别是广东、江苏、山西、河南和四川5个省份;用户占比超过3%的省份属于第二梯队,占到全部用户数量的29.70%,分别是福建、陕西、湖南、安徽、北京、湖北、浙江和河北这8个省份,具体数据见图7。由此可以看出,秦岭淮河一线以南地区,移动互联渗透率更高,“今日头条”客户端用户规模更大。

图7  今日头条全国32个省份用户占比图

 

(三)用户行为分析

1.男女阅读行为差异

通过2015年6月-2016年5月这一时间段对今日头条的实时监测,我们发现男女用户在阅读行为上有着明显的差异。男性用户平均每天打开客户端9次,每次平均使用时长为6.5分钟;女性用户平均每天打开客户端6次,每次平均使用时长为10分钟。由此我们可以看出,男性用户的阅读行为显示出打开频率高,阅读时间短的特征,而女性用户的阅读行为则显示出打开频率低,阅读时间长的特征。

2.不同用户每日阅读时间差异

通过对今日头条用户每日活跃时间段进行分析,发现每天会产生两次阅读高峰,分别出现于中午13点-14点和晚上22点-23点两个时间段,具体数据见图8。这一方面与移动互联整体的每日阅读高峰有明显的区别,移动互联每日第一个阅读高峰产生于早晨的8点-9点时间段,而在今日头条上第一个阅读高峰向后推迟到了4个小时,出现在13点-14点,即工作的午休时间,显示出今日头条更加具有社交性的特点。

图8 今日头条用户每日活跃时间

 

(1)不同性别用户每日活跃时间差异

在今日头条上男性用户在每日大部分时间段阅读量高于女性用户,与客户端男女性别占比数据相吻合。女性用户在晚间22点最为活跃,男性用户的活跃最高峰则推迟1个小时,出现在晚间23点,由此可见以看出女性用户作息时间更为健康的,也符合女性追求美容和健康的天性,具体数据见图9。

图9今日头条男女用户每日活跃时间段

 

(2)不同年龄段用户每日活跃时间差异

我们将今日头条用户分为青少年、中青年和中老年三个年龄段,分别对应23岁以下、24岁至50岁和50岁以上三种人群。根据图10可以看出,虽然三个年龄段每日阅读量最高的时间点均出现在晚间22点,但年龄越大的人群深夜阅读量下降幅度越大。而在5点至7点的清晨时间段,则显示出年龄越大的人群阅读量越高的特性,说明中老年人群更加注意养生,养成了早睡早起的好习惯。

图10今日头条不同年龄段用户每日活跃时间段

 

 

三 今日头条用户阅读兴趣分析

(一)不同人群在阅读表现出明显兴趣差异

1.男女阅读兴趣差异

在大多数人的印象中,男女在阅读上的差异可能主要体现在娱乐资讯上,根据今日头条的数据统计,这个印象得到了数据的印证。86.68%的女性用户具有娱乐标签,排在女性群体兴趣的第一位,而男性群体的第一兴趣标签则是社会,有70.73%的男性对社会类资讯感兴趣,但同时,也有53.14%的男性用户对娱乐有兴趣。

除此之外,兴趣标签的比例排序能够清晰的体现出男女阅读兴趣的差别,除了娱乐与社会两个兴趣之外,男性对资讯的兴趣体现在本地、汽车、时政、世界、财经等方面,以下是男性的前十五大兴趣标签。

图11 男性前十五大阅读标签(以阅读占比为序)

 

而女性的兴趣标签则集中在时尚、育儿、健康、本地、情感等方面,以下是女性的前十五大兴趣标签,有趣的是,女性群体对段子的兴趣比例与男性相当,在13%左右,说明段子这种特色的短内容还是让人喜闻乐见的。

图12女性前十五大阅读标签(以阅读占比为序)

 

2.各年龄段阅读兴趣差异

我们在男女阅读兴趣的基础上再加入年龄的维度,可以清晰的看到:随着年龄的增长,男女在阅读兴趣上发生的变化。我们划分了三个年龄段,18至23岁、24岁至50岁、50岁以上,对应为还处于学生阶段的青少年,踏入社会后的青壮年以及中老年,男性在这三个阶段的兴趣转变是从关注科技、娱乐、游戏、体育逐渐过度到社会、娱乐、汽车、时政,继而再到社会、国际、时政与健康。具体数据见图13。

图13男性不同年龄段阅读兴趣变化(以阅读占比为序)

 

女性的三个阶段的兴趣变化为:18至23岁关注娱乐、时尚、情感、社会,24岁至50岁兴趣点在娱乐、社会、时尚、育儿,50岁以上则为健康、社会、美食、时尚。其中时尚类资讯贯穿了女性的所有年龄段,成为了女性恒久的兴趣主题。具体数据见图14。

图14 女性不同年龄段阅读兴趣变化(以阅读占比为序)

3.对于热点话题不同区域表现出明显差异

通过对今日头条用户阅读数据的分析,我们发现,不同地区的网民表现出较为显著的地域性差异。例如,在2015年初,今日头条统计了各地用户的阅读行为差异,其中最关心时政新闻的地区是山西(占比42%),较最不关心时政新闻的地区澳门(占比14%)高出28个百分点;最关心娱乐新闻的地区天津(占比62.54%),较最不关注娱乐新闻的地区贵州(占比43.41%)高出近19个百分点。作为传播量最大的类型之一的“情感类”文章,有21.75%的湖北用户关注表现出明显的阅读偏好,而上海地区表现出偏好“情感”的用户只有11.36%。但同时不可忽视的是,每个地区表现出的阅读倾向地域差异一直在不断变化,受热点新闻的影响较大,存在较强的时效性。因此,为更好地分析兴趣热点的地域差异,我们可以通过对热点信息的分析进行局部展示。本报告中引用不同地区对“两学一做”的阅读偏好差异进行分析。

例:不同地区对“两学一做”话题表现出的偏好差异

从2月28日至6月6日整100天的时间内,我们分别对比分析了北京、上海、广东三地对“两学一做”的关注重点和关注“两学一做”的人群兴趣标签分布。其差别主要体现在对不同关键词的关注度差异上,如表1所示:

表1北上广人群“两学一做”兴趣标签

 

#

北京

上海

广东

关键词

阅读占比

关键词

阅读占比

关键词

阅读占比

1

从严治党

24.50%

从严治党

22.77%

从严治党

27.07%

2

看齐意识

16.43%

理想信念

15.55%

看齐意识

17.86%

3

理想信念

16.19%

看齐意识

15.52%

理想信念

17.27%

4

大局意识

14.47%

大局意识

13.81%

大局意识

16.38%

5

政治意识

14.22%

政治意识

13.38%

政治纪律

15.91%

6

核心意识

13.63%

核心意识

13.02%

政治意识

15.66%

7

政治纪律

13.17%

政治纪律

12.80%

核心意识

15.20%

8

三严三实

11.18%

三严三实

10.33%

三严三实

10.81%

9

四风

9.64%

四风

9.09%

四风

10.68%

10

高度一致

8.82%

高度一致

8.28%

高度一致

8.30%

北京、上海、广东对两学一做的十大热点关键词完全重合,但是在具体热词的热度和热度排列上体现出差异。广东用户对于“从严治党”的关注度高于北京和上海地区。“看齐意识”在北京和广东读者群众占比排名第二,而在上海用户对于“理想信念”和“看齐意识”的阅读占比差异不大。广东读者对“政治纪律”的关注度要高于北京和上海。

(二)短文章跳出率较低

在今日头条上,什么样的文章最受用户欢迎?要了解这个问题的答案需要引入两个指标,一个是跳出率,另一个是平均停留时长。跳出率是指用户点开一篇文章后又马上退出的比率,“马上退出”以停留时间小于3秒来衡量。

从单一的跳出率指标来看,字数越少跳出率越低,用户读完文章的比例也就越大,从今日头条的统计分析来看,1000字以内文章的跳出率为22.1%,是最低的,也就是说,短文章用户读得快,也相对受欢迎。所以,在移动客户端上,大众的阅读行为特征更倾向于短平快,快速阅读。所以,在文章的写作上,尽量保持在千字左右,同时也需配图,图文并茂,更易受用户的青睐。

表2 文章跳出率及平均停留时长

 

跳出率

平均停留时长

1000字以内:

22.10%

48.3秒

1000~2000:

39.10%

66.6秒

2001~4000:

52.80%

69.3秒

4000字以上:

65.80%

95.6秒

 

另一个指标是平均停留时长,尽管4000字的长文章跳出率达到了65.8%,但其平均停留时长则达到了约96秒,也就是说,有很多人是认真在手机上读完了4000字以上的长文的,他们在文章上的长时间停留拉长了平均值。

今日头条对10篇阅读量过百万的长文章进行了数据分析,这些长文章基本上都为描述和讨论的是严肃的题材,比如纪实性报道、人物报道、深度调查,通过分析这些4000字长文的阅读构成,发现其中的阅读量有49.8%是由24-30岁年龄段的用户带来的,还有12.6%来自31-40岁的用户,由此简单相加,阅读长报道的人中有超过6成的用户处于24岁-40岁之间。这些用户是使用手机的主要人群,也是社会的主流和中坚力量,他们用每一次的点击,证明着优质长文在0和1的时代仍独具魅力。

(三)视频成为文章越来越重要的表现形式

2015年初我国移动互联网由3G时代进入4G时代,随着移动互联技术的快速发展,使得人们随时随地的访问多媒体资源成为可能,移动资讯客户端内容的表现形式呈现出多样化,媒体形式融合化的趋势。与此同时,人们对于随时随地的多媒体访问需求日益迫切。通过对今日头条视频内容数据的分析,我们发现内容创作者敏锐的感知到受众的需求,包含视频内容的文章数量不断增加,视频越来越成为文章的重要表现形式,相关内容的阅读量也得到快速的增长,视频成为了4G时代最主流的最具代表性的传播介质,具体数据见图15。

图15今日头条2015.6-2016.5期间视频文章发文量、阅读量趋势图

 

首先,从传播媒介或形式来看,视频本身就比文字、图片或音频等形式更容易获得传播因为更能够给受众带来更大、更为刺激的感官体验。其次,从用户使用或体验层面来看,视频更符合用户移动上网的习惯,更容易吸引用户关注。视频因此逐渐成为自媒体创作的重要表现形式,甚至成为一些行业文章的首选表现形式,比如在铁路行业头条号发布的阅读量最高1000篇文章中,包含249篇视频内容,文章占比约为25%,然而在阅读占比方面则超过了60%,达到63.18%。可以看出,在铁路行业内相较于其他表现形式的文章,视频内容能更加聚集更高的关注度,产生更大阅读量。

 

(四)长尾内容得到释放

以今日头条为代表的个性化推荐技术可以极大释放“长尾”信息的传播。媒体发展近20年已经经历了从“都市报时代”到“门户和市场化媒体并行时代”再到“社交媒体时代”的发展历程,现在正在经历个性化“推荐引擎时代”。         每一次时代的跃进都伴随着内容的跳跃式膨胀发展和信息分发水平的提高。自从社交媒体出现以来,信息传播的成本更低、人人都可以成为信息发布源、用户是读者的同时也是信息传播者成为显著的时代特征。由此,市场上涌现出大量的内容创作者,其中相当一部分作者以创作某些领域的“长尾”内容获得了成功。随着近些年社交媒体的迅速发展,依托于社交网络的信息传递模式表现出以下特点:

第一,信息产量爆炸式增长,内容繁荣的同时也不可避免带来了“泥沙俱下”的困扰;

第二,产生大量的所谓“大号”和“意见领袖”(也称KOL),“网红”概念也属于此范畴;

第三,用户关注大量信息源。

随着社交媒体的发展,用户越来越多,社交媒体最近也暴露出一些行业性问题:

第一,信息传播效率问题,内容太多,创作者太多,读者总量却没有明显变化,大量信息被湮没;

 第二,公平性问题,一些知名大号、意见领袖把持流量,新的公众账号、中小账号很难获得广泛传播,即使这些账号的内容优质,也很难改变现状。

以今日头条为代表的个性化推荐技术,可以有效地解决社交媒体信息传播效率偏低的问题,解放长尾信息的传播。今日头条推出的自媒体平台——头条号为众多内容创作者提供了可靠的信息传播渠道,帮助内容创作者通过机器的自动推荐,准确找到目标用户。

1.畜牧养殖类内容典型案例

畜牧养殖类信息与食品安全、科普、三农等话题密切相关,虽然食品安全、科普等信息在互联网上、特别是移动互联网上一直是传播最广的信息内容,但畜牧养殖类信息一直是小众信息,并未获得太广泛的传播。相当多的优质信息仍然深度依赖传统媒体(主要是报纸、电视等)传播。由于今日头条可以根据内容发现潜在的目标读者,因此读者不必主动表达自己的阅读偏好,系统会自动推荐相关信息,因此个性化的推荐技术使畜牧这样的小众信息也获得了广泛传播,并且发掘出了一大批对此类感兴趣的读者。

“猪倌巴巴”是一个自媒体作者的头条号,专注于养殖信息。开通头条号以来累计阅读已经超过了4000万。“猪倌巴巴”内容专注于养殖技术、科普信息、行业动态、养殖政策等,每一种类型都对应了相应的用户群。

图16 “猪倌巴巴”头条号截图

2.文化类长尾内容典型案例

无论是在双微上还是在传统媒体上,文化类内容一直是广受读者关注的内容之一。但文化类内容也存在“大号”、“大V”垄断流量的窘境。中小账号很难获得关注,一些优质账号并未在双微平台上成为明星。

“李天飞”是一个专门创作《西游记》解读文章的头条号,由于《西游记》的广泛群众基础,该头条号创作的文章一经上线就获得了巨大阅读量。其第2篇文章阅读量即突破10万,第5篇文章阅读量突破39万,而其单篇最高阅读已经超过115万。单篇文章阅读量普遍超过双微平台数十乃至上百倍。

图17 “李天飞”头条号截图

(五)今日头条成为党政机关直接发声的主渠道之一

党政机关对外宣传、民生服务等工作一直是各项工作的重中之重。过去,主要通过借助媒体实现信息和服务的分发。自从2010年后出现的社交媒体大发展以来,党政机关拥有了广泛传播的基础,开始更倾向于通过这些平台自主发声。党政机关和网民在社交平台上直接交流互动成为主流。

在经历了社交媒体“双微”时代之后,各级党政机关通过开通今日头条“政务头条号”抢占移动客户端渠道,实现“两微一端”全覆盖。

1.务头条号的规模和趋势

自从2014年9月今日头条正式推出面向各级党政机关的“政务头条号”服务以来,截至2016年6月30日,全国各级党政机构入驻今日头条开通政务头条号的数量已经超过了1万家,发布文章总数达85万篇,产生了35亿阅读,推荐量高达320亿。如果按每天平均数量来算,相当于全国各级党政机关每天在今日头条上发布1300多篇文章,每篇文章通过机器智能推荐给了3.8万人。在政务信息传播上,机器的智能分发正成为主流的方式。

图18 今日头条政务号发文数、阅读数走势图

 

从图18可以看出,政务头条号在今日头条传播效果明显。而且这个趋势仍然在快速上涨过程中。

2.政务头条号的优势

由于政务头条号精确传递可以有效提高党政机关的信息传播效率,集群化开通头条号,通过头条号平台打造“政务新媒体矩阵”已经成为一个政务新媒体行业内极具标志性的现象。例如,2015年,由最高人民检察院牵头,全国四级检察院系统集体开通头条号,从而打造了一个涵盖全国31家省级检察院、300多家地市级检察院和3000多家区县级检察院、检察专业媒体的新媒体矩阵,极大地拓展了检务信息的传播渠道。仅2016年5月一个月,全国检察系统头条号矩阵共发文4.3万篇,产生有效阅读超过6200万,推荐次数超过7亿。良好的传播效果、多样的服务形式、丰富的数据支持,吸引众多地区和行业纷纷开通头条号矩阵。

通过头条号平台搭建本区域、本行业、本单位政务新媒体矩阵优势主要包括以下四个方面:

第一、迅速扩大党政机关在新媒体平台上的流量。实现传播渠道向移动互联网的全覆盖,抢占宣传阵地制高点。整体开通极大拓宽了当地宣传系统发声渠道,由两微延伸到一端,实现政务新媒体建设“两微一端”全覆盖。

第二、精准传播。政务头条号矩阵可以从面上覆盖全国、全省、全市,从点上精准推送到各区县、各乡镇,实现矩阵由单点传播变为多点多层级传播,并形成立体传播模式,把各地、各行业信息精准推荐到有阅读需要的人群。

第三、树立头部政务新媒体账号的领先优势。政务头条号矩阵可使各地各级各行业头部账号成为移动互联行业的领头羊,改变官方声音发声不足、地方自媒体各自为战的局面,形成行业集群优势,引领整个互联网生态的正面导向和健康发展。

第四、发掘大数据价值,用信息流带动影响力。加入政务头条号矩阵的单位对于头条号的使用越多,就能收集更详尽、更丰富的大数据,通过后台的机器算法,可以从大数据角度分析传播现象,发现传播规律,为宣传系统提高传播效率提供支持。

 

 

关键词:

相关文件

暂时没有内容信息显示
请先在网站后台添加数据记录。

新媒体与大数据联盟

电话:136 6193 7953

微信二维码

版权所有北京世研信息咨询有限公司  京ICP备05057290号-5  Copyright ©2003-2019CRC Media Co.,Ltd. All Rights Reserved.

网站建设:中企动力 北二分