三、研究发现
1.热搜定义与测量民意的方式
通过对微博公开材料的文本分析,笔者发现热搜作为民意基础设施,不仅具有社交媒体的共性特征(如样本非随机、数据不受干预),还具有不同于推特等西方平台的独特一面。社交媒体定义和测量民意的方式并非铁板一块、一成不变,有必要引入历时性视角来考察其动态发展过程。
参照前人的研究成果[12,6],结合文本分析材料,本文提炼出了热搜定义与测量民意的三个动态变化,分别是:从个体走向关系、从私下走向公开、从自动走向调控。
1)从个体走向关系
我们发现,2018年3月15日是一个重要的分界点,热搜的上榜规则从单一考量“搜索热度”转变为“(搜索热度+讨论热度+传播热度)×互动因子”的多重考量[24]。根据微博热搜的官方介绍,“搜索热度指搜索量,是基于搜索行为建立的热度模型,反映用户对热点的关注和探索程度;讨论热度指讨论量,是基于原创和转发的发博行为建立的热度模型,反映用户热议和参与的热情;传播热度指阅读量,是基于热搜结果的关联微博在全站的阅读量建立的热度模型,反映热点在微博体系内的传播情况;互动因子指用户在热搜结果页下转评赞等行为的互动比率,归因到[1,1.2]区间,反映用户消费内容的意愿”。
这标志着一场重要的却几乎悄无声息的变革:热搜从表面上看仍然是原来的排行榜,然而其对民意的定义与测量方式发生了根本改变:从“原子化个体的搜索痕迹聚合”走向“处于社交网络中的人际交互”。前者是孤立的、彼此隔绝的、平等的,后者则是联结的、交互的、分层级的。
2)从私下走向公开
2018年之前,热搜计算的搜索量是人们私下的意见表达,它类似于民意调查是对个体意见的聚合,“是针对彼此没有联系的个人、秘密地同时又科学地完成的”。不同之处在于民意调查采集到的是被访者的自我报告(self-report),而热搜对用户搜索痕迹的聚合则具有非干预(noninterventionism)的特点。此外,热搜对民意的测量不是随机的、有代表性的,而是遵循多数主义,且主要反映了青年群体的意见。根据微博发布的《2021上半年微博热搜榜趋势报告》,热搜用户中19~29岁用户占76%,40岁以上用户仅占2%。
随着热搜上榜规则的改变,其定义与测量民意方式也走向公开。计算公式“(搜索热度+讨论热度+传播热度)×互动因子”中的搜索热度和传播热度具有私下的特点,用户的搜索与阅读行为在“后台”进行,且具有匿名性;而讨论热度和互动因子则具有公开表达的特点,用户在讨论、转发、点赞或评论时往往带有“前台”表演的成分。例如,用户点赞的内容会以“某人某月某日赞过的微博”的形式显示在个人微博主页上。
3)从自动走向调控
2018年,首次整改后的热搜上线了“新时代”版块,且宣布放弃纯粹的算法模式,引入编辑人工干预模式[25]。2021年上半年,热搜将“减少娱乐占比”作为平台的主要调控目标,设置正能量推荐位,加大对正向内容宣传力度[22]。2022年1月,微博宣布将优化热搜榜单内容配比机制,并基于热搜生态和价值导向加强人工调控。具体举措包括突出媒体、政务在社会时事报道中的主导作用,结合重大事件和重要时间节点调节榜单氛围等[26]。整改前的热搜,其权威性主要建立在“计算机程序的无意识自动化客观性”(unthinking automated objectivity)上[19];随着算法弊端的显露以及主流媒体发起了“算法批判运动”[20],人工的专业判断开始受到微博的推崇和强调。
综上,微博热搜糅合了“分散个体的意见聚合”和“公众间的互动、讨论与连接”这两种民意定义与测量方式:既是私下的、个体的、平等的,也是公开的、关系的、分层级的,且日益走向人机联姻。
2.大众媒体对微博热搜的合法性建构及其历时性演变
1)大众媒体对微博热搜的合法性建构
大众媒体是如何看待和阐释微博热搜的?热搜日益成为占据主导地位的舆论载体,大众媒体在其中扮演了什么作用?为了回答上述问题,笔者以“热搜”为关键词,在《人民日报》等十家大众媒体微信公众号搜集到了1 133篇有关文章。其中,2018年80篇,2019年289篇,2020年245篇,2021年396篇,2022年1月—5月123篇。虽然不同年份间报道量有所起伏,但整体呈增长趋势。内容分析结果显示,绝大多数文章认可和接纳了热搜的合法性,仅有56篇提出了质疑和批评的声音,仅占样本总量的4.9%。卡方检验分析发现,不同媒体在微博热搜的合法性建构方面不存在显著性差异(χ2=15.970,P>0.05),表现出了态度的相似性(见表1)。
表1 十家媒体对待热搜的总体态度
此外,研究使用Python对样本标题进行词频分析。首先,利用jieba库对样本数据进行分词,并实现对于关键词词频以及关键词两两之间共同出现频率的统计。其次,利用networkx初始化创建一个尚不包含节点信息的简单无向图G,并在新创建的网络关系图中逐个添加新的节点Node和新的连边Edge,设置节点和连边的属性和布局。最后,在词频分析的基础上完成绘图。将每个关键词当作图中的一个节点,节点大小反映了关键词的词频大小,计算节点之间的关系,共同出现过则连线,连线粗细反映了两个关键词之间共同出现的频率大小。
如图1所示,大众媒体最常将“热搜”(n=998)与“冲上”(n=187)、“第一”(n=116)放在一起使用,其次是“刷屏”(n=20)、“火上”(n=16)、“登上”(n=16)、“又双叒”(n=9)、“连上”(n=7)、“引爆”(n=6)和“整改”(n=5)。除了“整改”带有质疑/批评的意涵外,其余高频词汇均显现出了大众媒体将热搜等同于民意的倾向。在大众媒体的报道中,排在热搜第一的一般是能够多次登上热搜的内容,等同于引发了广泛的公众关注。
图1 大众媒体建构热搜的高频词汇
2)大众媒体对微博热搜合法性建构的历时性演变
卡方检验分析发现,随着时间的推移,大众媒体对热搜的阐释存在显著差异(χ2=44.548,P<0.05),即大众媒体对热搜的合法性建构存在着历时性变化(见表2)。如图2所示,大众媒体日益认可和接纳了热搜的合法性,而质疑和批评的声音逐年减少,从2018年的20%下降到2022年的2.4%。需要指出的是,2018年1月和2020年6月,北京市网络信息办公室曾两度约谈微博,责令其立即整改,暂停更新微博热搜榜一周,对此事件的报道均被编码为“质疑/批评”。2018年样本总量最小,因此,“质疑/批评”类的推文比例最高。2020年尽管也出现了热搜整改的相关报道,但由于样本总量最高,“质疑/批评”类的推文比例占较小比例。
表2 十家媒体对待热搜的态度演变
图2 大众媒体对待热搜态度的历时性演变
这种历时性变化可能与微博热搜愈加强调正能量和人工调控有关,带来的直接后果就是,大众媒体推动话题登上热搜的比例越来越高。2021年上半年热搜中的社会时事热点话题81%由媒体主持,而后续发布的《热搜双月报》显示,7—8月该比例是85%,9—10月该比例是88%,11—12月该比例达到了89%。面对国家对算法推荐平台的调控,热搜愈发注重编辑价值以及社会公共职责的履行,这与大众媒体的目标趋于一致。