智能时代算法型内容分发的问题与对策
作者:靖鸣 管舒婷
来源:《新闻爱好者》2019年第05期
【摘要】人工智能的开发让算法推荐强势崛起成为当下最流行的内容分发方式。在给传播领域带来革命性改变的同时,算法背后存在的隐患也逐渐凸显。文章从问题角度出发,分析算法型内容分发所导致的信息茧房、假新闻泛滥、算法偏见、把关权力迁移等现象。这些问题将导致受众孤独倍增和新的“知识鸿沟”出现的风险。针对算法型分发存在的问题,在优化算法内容分发模式的同时建立网络世界人行道,展望互联网向智联网发展的未来走向,以期算法推荐在内容分发2.0时代更好地服务人类。 【关键词】算法;内容分发;问题;今日头条
数据显示,截至2018年底,中国移动互联网活跃用户规模高达11.3亿人。[1]对于通信行业来讲,内容分发指的是采用智能分析法对用户访问互联网留下的痕迹以及其所占用的网络流量进行分析,按照服务运营商定义的内容分发策略,将节点的流媒体资源数据库中指定的内容推送到下一级节点的过程。现阶段,算法推荐系统可划分为三个不同的种类:第一是协同过滤推荐;第二是以内容为核心的推荐;第三是关联规则推荐。在西方国家,利用算法分发信息并非出奇制胜的媒体新秀,个性化分发实际存在很多信息风险。如何利用人工智能更新算法分发并制定科学的机制以保证分发安全,在满足受众差异化需求的同时构建稳定的网络环境是现今最急需解决的课题。
随着移动互联网的广泛普及与智能手机功能的深度开发,信息的内容分发打破了塔奇曼所说的“新闻常规”。传统人工采编衰落,社交分发、算法分发兴盛崛起。在用户获得新信息的速度与准度越来越高的基础上,三种分发模式正朝着并行的方向发展。
在移动通信设备广泛应用以前,报纸、电视等传统媒体是人们对信息的主要获取渠道。传统媒体在内容分发阶段,主要由专业的记者编辑担任“把关人”角色,对媒体收集到的信息进行筛选、排版、审核的人工分发方式。
在移动终端上首先诞生的手机报,实际上是报纸的便携版。其内容排版呈现方式都和传统媒体类似,延续着人工采编的分发方式,可以算作线下媒体向智能终端的过渡媒介。例如,2004年,《中国妇女日报》“彩信版”作为中国第一份手机报正式发行。随后,各类新闻资讯APP井喷式诞生并主宰信息源,如以纸质内容为主体,以移动端方式传递给用户的南方周末APP等新闻客户端和将网站信息迁移至手机屏幕的凤凰、腾讯等。
在这种以编辑为核心的传统分发模式下,移动用户仍然是以被动的受众身份接收着内含专业编辑记者倾向看似多样且全面、实际却“千人一面”的信息。
龙源期刊网 http://www.qikan.com.cn
目前,主流社交媒体已成为人们获取信息的核心来源。在以社交为核心的分发机制下,无论是微博还是“朋友圈”都代表着大众传播实现了“千人千面”的颠覆性改变:一是移动用户不再麻木地被动接受,而是通过自己的社交结构主动拥有了无法复制的信息;二是在这种模式下,根据用户关注的对象与好友所形成的人际关系网络提供用户在海量信息中筛选和过滤的功能。目前,用户通过社交媒体关注某一热点事件的比例通常超过83%。[2]
但在社交网络经历过疯长并逐渐过载的现状下,基于社交分发的信息变得单调甚至劣质。在微信朋友圈里,微商、养生链接、炫富等垃圾信息的数量与日俱增;大V和营销类账号的流量占据了微博总流量的一半以上,相关调查显示:超过九成的微博信息都是“大V”账号发布的,而其账号数量只占总数的3%。[3]
“算法”的概念来源于计算机领域。它是指解决问题的一系列明确指示,是系统地描述问题解决的战略机制。2012年,“今日头条”率先使用算法进行内容分发。随着人工智能的深入发展,这种智能分配模式已成为主流移动媒体转型的新選择。
就拿“今日头条”来讲,其算法内容分发的方式主要依靠如下几个方面:一是画像。根据用户提供的个人信息包括区域、职业、年龄等进行粗略标签。之后,通过用户每一次的搜索,记录浏览的信息类别、阅读频次、文章主题、内容热度、来源等进一步刻画使用者的兴趣取向。二是场景。彭兰认为:从其本质来讲,移动通信是建立在场景服务基础之上的,对场景进行感知,以及对信息进行适应。[4]通俗地说,“算法”分析会感知出用户使用今日头条时所处的网络状态。若在移动数据环境下,接收的内容可能多是图片或者文字。在Wi-Fi环境中,客户端将刷新出更多视频或动态图片。由此,让适合的场景在恰当的时机出现。三是学习。系统对用户的使用情况持续追踪,例如某用户对推送的内容是忽略了还是阅读了,阅读的推送是读完了还是中途放弃。浏览用时较长的内容有什么关键词,是在什么时间、什么地点浏览的等。根据这些数据将用户画像进行实时调整。四是筛选。通过上述及时反复的“教育与学习”,后台根据平台设定的标准对海量信息的质量、转载率、原创性等因素进行判断,再逐层筛选并准确抓取用户需求的内容。
综上所述,倘若用户登录头条使用的账号属于微博等社交账号,登录系统会按照用户已经上传保存好的基本信息,在很短的时间内对用户兴趣进行分析,并迅速获取用户的画像(不超过10秒)。之后头条系统会根据用户的阅读行为,对其画像进行优化,并给出相应的信息推荐。[5]
人民网曾连续三天推出《不能让算法决定内容》《别被算法困在“信息茧房”》《警惕算法走向创新的反面》三篇文章批评算法推荐模式。[6]指出如果平台仅仅依托于算法的话将会出现如下三种问题:第一是价值观的严重缺失;第二是信息茧房;第三是竞争手段会经常性地突破底线。这会导致平台迟早被有关部门约谈。进入网络时代以后,算法和人工智能虽然给我们带来了无限未来,但是其技术仍存在着局限性,因此,我们必须为智能推荐设立一个把关人。
龙源期刊网 http://www.qikan.com.cn
国内移动媒体发布的虚假信息主要集中在醫疗领域(减肥、保健等)、金融领域(股市下跌、房地产市场等)、虚假社会信息、虚假娱乐报道等。2018年,中央电视台《经济半小时》节目曝光了“今日头条”在二三线城市推送虚假广告,当记者抵达广西机场时,“今日头条”头版广告就精准地变化为“补气血”。
因为平台编辑没有对内容进行很好的把关,同时后置了内容审查环节,造成平台系统将不同价值观的内容向不一样的用户群体分发。当平台系统任由猎奇、低俗等人性本能需求进行个性推荐时,其价值观和质量将会无法得到有效保障,在价值导向和质量上就难以保证。 无独有偶,2019年1月,独立研究机构PlainSite发布了一份报告指出,Facebook可能有50%的僵尸用户。“虚假账户可以随机点击广告,或自主按下‘喜欢’网页的按键,以摆脱反欺诈算法。如果不去仔细追踪虚假账户的操作模式,它们看上去就像是真的。这类活动虽然欺骗了广告商,却给Facebook带来了收入,虚假账户通常通过诈骗、假新闻、敲诈和其他形式的欺骗来欺骗Facebook上的其他用户。”在2016年美国总统大选中,Facebook被指疏于监管,让大量假新闻、假数据在平台上传播,误导了美国选民。[7]
无论是国外的Facebook、Google,还是国内的“今日头条”“一点资讯”,都把自己定位成科技公司而非新闻媒体。从本质上看,智能算法是这些科技公司为了吸引更多的用户群体,最大限度延长他们对公司产品的使用时间,从而获取经济效益而提出的。陈昌凤等认为,信息的“把关权”被算法所掌控,但算法的事实核查能力、信息质量的辨别力的发展还远达不到足以处理信息内容真伪和价值判断的程度。[8]平台利用算法会对“眼球”标题及低俗色情信息进行过滤。尽管如此,这些信息带来的巨大阅读量,会利诱平台降低把关的“度”,让打擦边球的文章都可以通过审核。
随着信息把关权利的不断迁移,数字环境中的新闻行业出现了很大的变化。算法平台正在取代大众媒体成为新闻分发权的新把关者,这导致了新闻把关权的滞后。同时新闻的选择权也正在由用户群体向算法平台逐渐转移。编辑的缺位,很可能导致公共性、突发性、政治性等严肃话题难以通过算法审查,最终造成媒体公共内容的缺失而带来严重后果。
2006年,美国哈佛大学法学院教授凯斯·R.桑斯坦在《信息乌托邦——众人如何生产知识》中,对“信息茧房”这个定义进行了确切阐述,指出:网络化让资讯的选择性变得多种多样,这或许让社会看起来更为民主和自由。可因“个人本位”理念的影响,终将对民主带来巨大的破坏。[9]简言之,“信息茧房”就是“我们只听我们选择的东西和愉悦我们的东西的通讯(信)领域”。[10]
隶属于“今日头条”的抖音,是我国最具影响力的短视频平台之一。沉迷其中的用户根据平台推出的音乐素材,观看并自行制作导致同类型同质化的短视频井喷式诞生。民众反复沉迷在如“学猫叫”等抖音神曲里,被封闭在抖音的围墙里,这对民族文化的发展造成了一定的阻碍。
龙源期刊网 http://www.qikan.com.cn
信息茧房形成的最主要原因是,在唯流量主义的媒介环境中信息传播特点已经发生了转变,吸引用户注意力代替以往生产专业新闻成为传播的重点。从这个意义上而言,用户接收的网络新闻内容,都是由互联网平台上的机器算法用“过滤泡”过滤之后的产物。2011年,以利·巴里瑟(EliPariser)在其著作《过滤泡:互联网没有告诉你的事》中提出了“过滤泡”(filterbubbles)这个概念。他指出,以机器推荐算法为代表的互联网技术,正在使得用户获取的信息日益个人化;用户接收到的信息,往往会受到其检索历史、阅读记录等的影响,并受到机器算法的操控。[11]“过滤泡”的出现会导致平台出现两大突出问题:第一,经过“过滤泡”获得的信息,会受到用户的价值观和爱好的影响以及机器算法的操控,从而会导致信息出现一定的偏向使接收信息失衡;第二,因为算法自身存在的一些弊端,会造成其向用户推荐的信息不是他们所需要的。比如,据某个网友透露,其在“今日头条”浏览新闻时,不经意间点开了一个花圈的新闻,导致其以后数天都收到“今日头条”所推荐的有关丧葬用品的新闻。
2018年,王思聪为庆祝IG电子竞技俱乐部拿下德玛西亚杯冠军,在微博随机抽取113位用户每人发一万元作为奖励。但获奖名单中仅有一名男性获奖者,而参与抽奖的男女比率为1∶1.2,这引发大批网友质疑算法抽奖的公正性。
“今日头条”创始人张一鸣一再主张算法没有价值观。实际上,“数字系统以清晰的方式和它们根植于其中的文化紧密地融合在一起”。[12]算法新闻的设计是人主导的,其中不可避免地存在着商业竞争、权力压迫等冲突。《自然》杂志曾用BIBO表示BiasIn,BiasOut(即偏见进,偏见出)。可见,偏见从人类社会移植而来,隐秘地隐藏在算法之中。
皮尤研究中心发布的《算法面前的公众态度》调查结果显示,58%的美国成年人认为算法不同程度地带有人为偏见。[13]亚马逊公司曾开发一款用于筛选简历的算法意外被“培养”出歧视女性应聘者的偏好;谷歌旗下的PHOTOAPP将两名黑人的照片标记为大猩猩;微软聊天机器人Tay上线几个小时就被美国青少年“教”成满口暴力语言,集种族歧视、性别歧视等于一身的“坏小孩”。[14]大数据是现实的一面“照妖镜”,它将人类社会中不易察觉又影响深远的歧视,映射到算法所控制下的所有领域。
对于平台运营商来说,用户的使用时长是判定用户黏性的标准之一。但从受众角度来看,人们在移动媒体上停留的时间越长,意味着他们越容易沉浸在自我的话语场中,脱离整个社会的发展,导致共同体关系的维系出现问题,使用户以个体为单位陷入更加严重的孤独之中。 《经济学人》曾刊发文章表示,今日头条的1.2亿用户平均每天使用此APP约74分钟,超过包括Facebook和微信在内的大多数国内外大型社交平台。[15]在传统的信息整合、分发模式下,人们曾对电视着迷,整天沉浸在与电视相对的狭小空间里,与现实社会的人际互动保持一定的距离,并由此形成了孤独、自闭的性格,日本学者中野收将这种人称作“容器人”。 如今,随着人工智能化的分发模式的普及,人们的内心需求更容易被识别。受众仿佛掉入了更大更坚固的容器中,无须主动集群即可获得精准的信息服务。此外,当碎片般的个性化推
龙源期刊网 http://www.qikan.com.cn
送无孔不入地侵入到生活中时,人们耗费在依附网络的弱人脉上的时间正越来越长,面对面的人际传播势必将减少。这样,现代人的孤独感势必会增加。
壁龛在现代装修中指的是在墙壁上开辟的储物小空间。经济学教授菲利普·科特勒根据壁龛(壁龛的英文为“Niche”,也就是“利基”)的特点,在《营销管理》中对其进行了经济学上的阐述,即“利基是更窄地确定某些群体,这是一个小市场并且它的需要没有被服务好”[16]。一个个“壁龛”,将看似公平的互联网中所暗藏的阶级划分得更加明晰。
一方面,人类主动地被差异化兴趣取向所分类。基于用户的兴趣点不断推送相关内容,依靠强大的学习功能,相似的信息不断出现。长此以往,媒介素养不足的用户被低俗趣味的内容所捆绑,推入束之高阁的“壁龛”而导致视野被局限,从而失去与高媒介素养用户交流的机会,形成新“知沟”。
另一方面,部分用户通过付费缓和信息选择的焦虑,人类被动地被收入水平的差距所割裂。例如,同样在喜马拉雅APP中收听音频,如果付费收听过一次优质内容后,算法会不断推送出小众的精品音频。这些精品内容可能需要无法支付的用户花费百倍精力,通过不停地搜索才能获得。《纽约时报》关于“新贫富数字鸿沟”的调查显示,高收入家庭的青少年大约花费5个多小时在网络上学习而收入相对较低家庭的孩子则需要花更多的时间寻找好的网络资源。[17]
2018年1月,“今日头条”、凤凰新闻客户端等均因传播色情低俗信息被国家互联网信息办公室约谈,关停整治部分频道,“今日头条”旗下的内涵段子客户端甚至在4月被国家广电总局勒令永久关停,传统的“算法+数据”存在的漏洞已经清晰可见。[18]专业的媒体意识到“过滤泡”“信息茧房”的存在并通过技术手段,发起“戳泡”运动,尝试在分发中帮助受众摆脱思维定式的桎梏,开放包容地倾听全方位的声音。
例如,美国BuzzFeed对“Outside Your Bubble”功能进行推出,那就是在一部分流传范围非常广的新闻底部,加上一些平台的评论,比如Twitter、Facebook等等。瑞士报纸NZZ开发了一款名为theCompanion的APP。这款APP通过机器学习生推送个性化信息,与众不同的是,算法能够保障在每一次给读者所推荐的信息中,至少有一条信息不是读者原本感兴趣的领域。谷歌推出了“逃离泡沫”插件。该插件能够通过对用户的阅读喜好进行分析,将一些积极、容易被用户接纳的信息向用户进行反向推荐。用户每次访问Facebook时,插件会将不同视角的文章自动导入用户的信息流。[19]
此外,百度推出了“搜索+推荐”双引擎的新型内容分发模式,实现了从“人找信息”到“信息找人”的内容领域升级。通过“搜索+推荐”的双引擎模式,让用户更高效地获取信息,其内容分发的核心是基于用户的主动搜索,在对用户的搜索内容和行为进行全面分析以后,实现二者的双向互补循环,从而对一个能够和用户生活场景完全融为一体的“不搜即得”场景进行创建。该模式能够不断地为传统算法的精准分发提供有效保障,同时还能够通过对用户的搜索行为进行
龙源期刊网 http://www.qikan.com.cn
分析,从而获取其不为人所知的爱好。同时,该模式不但可以对“信息茧房”这个突出问题进行有效处理,同时还能够在感官上给用户带来很好的体验效果。
在《数字化生存》一书中,尼古拉·尼葛洛庞帝明确提出用户不仅需要拥有极端个性化的“我的日报”,同时还对具有公共性特征的“我们的日报”也是非常急需的。[20]信息茧房并不是算法时代独有的产物,信息茧房存在的根源是“选择性心理”,而“协同过滤算法”则加剧了信息茧房效应。桑斯坦在《信息乌托邦》的开篇对网络中的过滤机制是美梦还是梦魇进行了追问,他认为网络传播的“回音室”局限同样会产生群体极化与群体盲思问题。所以,桑斯坦指出,为了避免信息茧房的影响,必须创建网络世界的“人行道”。就和人们在逛街时不知道自己会碰见什么人、不在计划内的事情,不同的人群因此有新鲜的体验和言行互动。在用户无法想象的地方,为他们分发各种不在计划内的信息,能够让社会上不同层次的人都可以对各种领域的信息有所接触,从而摆脱“信息茧房”的束缚。
“智联网”这个定义是马化腾2018年在腾讯的“云+”未来峰会上提出的。智联网是互联网在将来的主要发展趋势,其指的是在智能环境中,任何事物都是可以相互联系的,其是建立在互联网、物联网等技术基礎之上的,其核心系统是知识自动化系统,主要职能就是对知识进行获取、表述、关联,从而让各个智能实体在语义层次上进行联结、让它们的知识实现相互联通。当全平台的信息共享成为现实之时,“信息茧房”问题也将迎刃而解。
学界关于算法型内容分发的研究主要集中在技术原理与优势价值上。本文在算法分发热潮之下,提出其现存的具体问题与风险,以期对运用算法的移动平台敲响警钟。后信息时代的根本特征就是真正的个人化。不可否认,现存的算法是实现个人化的阶段性产物,它的确为人类社会迈进智能时代做出了贡献。为促进人工智能时代算法推荐的优化,防止负面效应的激化,广大网民应消除信息茧房的影响,提升自身的媒介及网络素养。与此同时,各大平台只有从现存风险中找寻突破口,发展信息平衡与纠偏技术,对用户进行校正性推送或反向推送,才能在智能技术的潮流中胜出。
[1]QuestMobile.中国移动互联网2018年度报告[R].2019.
[2]智研咨询.2016—2022年中国大数据行业深度分析及投资战略咨询报告[R].2016. [3]喻国明,韩婷.算法型信息分发:技术原理、机制创新与未来发展[J].新闻爱好者,2018(4).
[4]彭兰.场景:移动时代媒体的新要素[J].新闻爱好者,2015(3).
[5]刘晓洁.新闻聚合类平台内容分发方式的优势与不足[J].新闻战线,2018(17). [6]观察者.人民网三评今日头条媒体:不要拿对媒体的标准要求地摊杂志[EB/OL].https://www.guancha.cn/society/2017_09_21_428110.shtml,2017.
龙源期刊网 http://www.qikan.com.cn
[7]華尔街见闻.继续水逆:报道称50%的用户是僵尸Facebook股价应声下挫
[EB/OL].https://baijiahao.baidu.com/s?id=1623603093213869419&wfr=spider&for=pc,2019. [8]陈昌凤,霍婕.权力迁移与人本精神:算法式新闻分发的技术伦理[J].新闻与写作,2018(1).
[9]胡婉婷.“信息茧房”对网络公共领域建构的破坏[J].青年记者.2016(15).
[10]凯斯·R.桑斯坦.信息乌托邦:众人如何生产知识[M].毕竞悦,译.北京:法律出版社,2008.
[11]Eli Pariser.The Filter Bubble:What the Internet Is Hiding from You[M].Penguin,2011 [12]托马斯·克伦普.数字人类学[M].郑元者,译.北京:中央编译出版社,2007.
[13]全媒派.算法真的没有价值观?皮尤调查发现依然忧虑偏见与隐私问题[EB/OL].https://baijiahao.baidu.com/s?id=1618336311426390072&wfr=spider&for=pc,2018. [14]罗锦霖.算法歧视·大数据折射人类社会偏见与阴暗[EB/OL].http://www.woshipm.com/it/1649545.html,2018.
[15]中国网.今日头条用户平均使用时长超过Facebook和微信[EB/OL].http://it.people.com.cn/n1/2017/1121/c1009-29660004.html,2017.
[16]科特勒,凯勒.营销管理[M].王永贵,译.北京:中国人民大学出版社,2012. [17]全媒派.新贫富数字鸿沟:你沉迷手机时,金字塔尖父母早已让孩子远离屏幕[EB/OL].https://edu.qq.com/a/20181115/003303.htm,2018.
[18]北京日报.今日头条、凤凰新闻手机客户端被约谈[EB/OL].http://news.ifeng.com/a/20171230/54663165_0.shtml,2017. [19]全媒派.围观良心外网的“戳泡运动”[EB/OL].https://news.qq.com/original/dujiabianyi/paopao.html,2017.
[20]尼古拉·尼葛洛庞帝.数字化生存[M].胡泳,范海燕,译.北京:电子工业出版社,2017. (靖鸣为浙江越秀外国语网络传播学院特聘教授,南京师范大学新闻与传播学院教授,博士生导师;管舒婷为南京师范大学新闻与传播学院硕士生) 编校:郑 艳
龙源期刊网 http://www.qikan.com.cn
因篇幅问题不能全部显示,请点此查看更多更全内容