你的浏览器OUT了o(╯□╰)o,想更好的浏览网站,请升级你的浏览器: IE8+ Chrome Firefox

mile米乐首页

舆情实践的数据主义:问题审思及进路探讨

发表时间:2023-12-18 03:37:37 来源:mile米乐首页

  近年来,舆情业界更显现出对数据的高度依赖,数据主义慢慢的变成为舆情实践的贯穿逻辑和评价标准。然而,舆情实践中数据主义取向带来的诸多问题逐步显现,影响了舆情实践的准确性、科学性和公正性。

  舆情是由个人以及各种社会群体构成的公众,在一定的社会空间内,对自己关心或与自身利益紧密相关的各种公共事务所持有的多种情绪、态度和意见交错的总和。从社会治理角度看,舆情对治理主体具有决策参考意义。2004年,党的十六届四中全会《中央关于加强党的执政能力建设的决定》指出,要“建立舆情汇集和分析机制,畅通社情民意反映渠道”。同年,中宣部舆情信息局正式成立,作为顶层设计的舆情工作机制开始在全社会范围内全面铺开。

  20世纪80年代中后期,我国学术型、政府型和商业型舆论研究调查机构兴起。1986年,中国社会调查所成立,这是中国第一家民营社会调查机构。该机构相继开展了“全国电视观众调查”“中央人民广播电台全国听众调查”“全国新闻界改革问题的调查”等。早期调查多采取问卷、入户访谈、电话调查等质性方法,对民众的人口特征、情感倾向、意愿诉求等展开数据统计与分析。但由于数据收集的人力成本比较高、操作的主观性较大、很难准确提供全域视角下的社情民意。

  社会调查与计算机辅助的初步结合始于CATI系统(计算机辅助电线年,CATI系统开始被国内调查机构使用,多被应用于品牌知名度研究、消费习惯研究、选举民意测验等诸多领域。CATI系统为大规模采集数据提供了可能性,初步具备了大数据“Volume”的特征,这标志着社会调查的数据化转向。

  伴随互联网快速地发展和深度嵌入,网络化生存已成为人类生活主要状态,网民行动轨迹和情绪诉求等都以数据形式留痕。传统调查手段已无法适应新形势,舆情调查开始整体转向数据化,即数据思维下,通过大数据技术方法对舆情信息做多元化的分析处理,包括了舆情甄别、舆情监测、舆情分析与研判、舆情处置、舆情引导以及案例库建设等。整一个完整的过程贯穿了对信息数据的挖掘、清洗、分类、统计、建模、分析等一系列大数据方法。与之相应,计算机、数学统计等理工科技术及方法被大量引入舆情实践。舆情系统研发上,以计算机学科为主导的监测与分析系统一直更新迭代,国内外涌现了大量专业舆情监控系统。作为数据主要贡献者的社会化媒体平台也更加重视自有数据的保护与开发,如新浪微博、抖音、百度等平台凭借数据优势,形成了微博热搜、抖音热搜、百度指数等产品,其舆情价值日益被重视。智库机构、学界借助Python等软件也对公开数据来进行爬梳,根据特定研究目的进行数学建模和计算,对目标事件及话题的舆情规模与热度、舆情风险、舆情传播图谱等进行研判,以供决策或学习研究之用。

  舆情实践数据化是对早期民意调查在样本量、统计性、主观性等方面不足的有益补充和改善,能提供概率学关联分析、局面评估和趋势预判等,具备极其重大应用价值。

  当前舆情实践中数据主义倾向日益凸显,具体表现在理念上绝对信任数据,实践上高度依赖数据及舆情实践人文主义理念弱化、社会科学研究方法边缘化。社会舆情是一项以人为本的复杂工作,需要对在更深层次上对舆情的因果联系、小数据(反常数据)、深层意义等方面开展多维分析,才能真正去伪存真、精准研判。

  (一)对数据盲目信任导致舆情研判的真伪失准。舆情实践必须建基于高质量数据之上,尤其是真实数据。然而在当前复杂数据环境中,真实数据并非自动呈送,这需要舆情实践主体保持审慎与质疑的态度,对数据来进行合理排查和有效清洗,从源头上剔除虚假数据、为准确研判舆情打下坚实基础。然而,数据主义者对数据盲目信任则体现在无条件承认数据的真实与准确,在此基础上统计与运算并得出相关结论。不难看出,这套操作显然是在数据中立的完美逻辑下运行的。问题就在于,大数据时代数据的来源与性质极端复杂、泥沙俱下、真假难辨。出于各种目的与动机,数据伪造、遮蔽、放大、过滤、区隔等操纵行为屡见不鲜。例如在社会化媒体时代,商业机构招募网民组成网络“水军”,他们在论坛、微博等社会化媒体平台上大规模、有组织地转发、评论、点赞,这些行为生成的数据其本质是虚假数据,并未真实反映民众的意见态度等,在真实的操作中应予去除。又如智媒阶段,算法驱动的社交机器人使舆情数据造假更上台阶,它们以隐蔽且无从察觉的方式、生成海量虚假的舆情数据,伪造有关议题的民意和舆情,这给舆情实践带来更大挑战。苏州大学东吴智库网络舆情团队的研究表明,通过对西方社会化媒体上涉北京冬奥会相关推文进行统计发现,机器人账号占比22.2%,机器人发布推文占比24.8%。从社会化媒体到智能媒体,以舆情伪造为目的数据操纵行为发生了从“人类”范式向“机器”驱动范式的转变,这在某种程度上预示着虚假数据、偏见性数据等不良数据将长期持续地污染舆情数据源头。在此背景下,倘若仍然秉持无条件盲信数据的信念与原则,在此基础上运算得到的舆情规模、体量、热度等都可能会产生巨大误差,最终呈现的将是虚假的舆情图景和错误的舆情研判,从而失去舆情研判的决策意义和参考价值。

  (二)对数据单边考察导致舆情分析的意义失察。舆情是社会民众情绪、意见、态度等主观心理健康状态多样分散的反映与呈现,其发生发展与具体事件、时空场景、文化习俗、社会情绪等社会因素有复杂而密切的因果联系,对舆情发生的因果考察可以揭示和厘清舆情生成的深层原因及过程,也能更好地分析和阐释其意义。从方法上看,仅依靠数据统计的定量分析,虽能在概率相关性方面得到强烈提示,但难以深入检视因果联系。舆情因果关联的分析方法应超越数学概率统计的量化范式,重回质性范式。但数据主义者往往只注重对数据的概率分析。在具体实践中,舆情从业人员依靠自动化数据系统、大规模、全覆盖地实时采集全网数据,并通过数学模型开展对有关数据的运算,最终生成以呈现数据为主的舆情报告。综观当前舆情报告体例,大体包括舆情热度、舆情趋势、舆情渠道分布、舆情主题分布、情感分布、关键节点呈现、主要观点梳理等,这些依据数据统计而得的报告从各个角度对舆情进行描摹,较为全面地呈现舆情发生演变的全过程,有助于对舆情形成整体认知、进行宏观把握,但在深层意义探究尤其是因果探究和意义分析上,显得力有不逮:舆情何以发生并形成热度、某种情感和观点何以成为主流、舆情何以指向某一特定主体等问题没办法得到有力阐明。对于舆情应对主体而言,这些深度信息缺失就无法为其提供更精准有效的“治本”方案。因此,舆情实践要克服数据主义的单边思维,结合人文社科的思维和研究范式,向纵深推进舆情研判深度,阐明因果联系和深层意义,提升舆情服务价值。

  (三)过度倚重“大数据”导致“小数据”舆情的监测失焦。数据主义实践者倾向于对规模、趋势等大数据的宏观研判,即通过技术方法大规模收集和批量处理数据,即主要对大概率事件、多数人群体等进行趋势和规模研判。这较为突出地体现在数据公司对“流行度”(Popularity)的专注与追逐。以新浪微博“热搜”为例,据新浪微博官方介绍,该指标是根据微博用户的社交行为数据来进行计算,通过实时发现微博场域中的热点话题,形成热搜话题榜单。其热搜算法主要指标就是海量网友的搜索量、讨论量、传播量等数据。

  以“流行度”“热度”为导向的大数据研判思维被普遍应用于各类舆情评估指标体系之中。依据该算法,大概率事件、多数人的诉求等将会在舆情场域中脱颖而出,被置于聚光灯下进一步形成焦点舆情。这同时意味着,小概率事件、少数群体的诉求等可能被无条件地忽视或遮蔽。但舆情监测或者预判的痛点恰恰在此。战国宋玉《风赋》有云“风生于地,起于青萍之末”,后人多用“风起于青萍之末,浪成于微澜之间”描述社会情绪、思潮乃至变革都是从细微无声之处生成,舆情生成亦是如此。最初引发舆情的青萍之末、微澜之间的敏感信息必然不是“大数据”,而是尚未形成规模的、容易被人忽视的小概率事件或者少数人的观点,即“小数据”。赵云泽研究认为,有的舆情信息虽然转发数量小,但触及某个在社会酝酿已久的矛盾,数小时以后可能就会成为热帖,形成重大舆情事件,此类信息具有“冲突势能”。热点、趋势等大数据标志着舆情已在爆发之中,从处置时效性来看是滞后的;相反,对小样本、小概率、具有“冲突势能”的敏感信息的监测和预判,则对舆情应对具有“事前”指导意义,尤显珍贵。

  数据主义带来舆情实践的真伪失准、意义失察、监测失焦等问题,其本质在于人文与技术、工具理性与价值理性的碰撞与失调。重回价值理性和人本主义,平衡舆情实践中人与技术、工具与价值的关系,或成为破解数据主义困境的有效出路。

  (一)回归人文,重拾舆情实践的价值理性。数据为舆情实践提供了更科学客观的思维与方法,但对数据的单边倚重和绝对推崇背离了舆情“以人为本”的逻辑起点和最终目标。2020年“人物”微信公众号发表标题为《外卖骑手,困在系统里》的报道,引发社会热议和学界的多方反思。外卖平台一方面通过对送餐距离、实时路况甚至电梯运行时长等数据,精准计算骑手预计送达时间,并以送达时间、好评率等数据作为骑手的绩效评价等;另一方面,顾客也逐渐确立以评价骑手服务的“数据”导向,通过骑手距离、送达时间等数据决定是不是退单,是否好评等。在骑手群体身上,显而易见数据主义对“人”的异化。

  数据是抽象的,但数据更是具体的,包含着丰富的社会和人文意义,唯有进一步探索数据背后的因果,数据蕴含的意义、数据深藏的隐忧等,舆情分析才是真正意义上以“人”为观照、尊重人的价值和主体地位。具体而言,应重拾人文社科思维范式,采取深度访谈、田野观察、内容分析等质化研究方法,对舆情“为何”以及“如何”发生和演化加以剖析,深入梳理其因果联系、细致描述其生成机制、追问背后隐藏的“人的价值”问题。此外,舆情实践并非对一时一势的权宜之策,每次的舆情反思和经验提炼都具备极其重大借鉴意义。因此,复盘重大舆情事件,建设舆情案例库,从自审与反思的角度积累舆情经验。超越数据主义的工具理性,回归价值理性,舆情实践才能更好地服务于“以人为本”的社会治理。

  (二)平衡“大数据”与“小数据”,升级舆情实践的预判性。现实中由于较低的可见度和可感度,“小数据”常常被数据主义者忽视。从舆情有关技术上看,也鲜有专门对“小数据”进行自动抓取和分析研判的系统。从目前来看,“小数据”监测与研判仍属于舆情实践中的难点之一。就人工监测来看,舆情人员是不是具备足够丰富的知识与经验是抓取“小数据”舆情的基础,也即他们必有见微知著、以小见大、由此及彼的敏感力、前瞻力和预判力。这一过程与新闻记者养成新闻敏感一样,需要长期的专业训练和积累。随着人工智能技术的发展,敏感“小数据”的抓取也逐渐发展出倚重“前馈”(Feedforward)的技术路径。在控制论中,前馈与“反馈”(Feedback)形成闭环。两者的不同之处在于,反馈是事发之后再进行反应,前馈则是在事发之前就进行干预,即事先对风险和偶然的范围、种类、趋势等进行预判、预测,预先调节甚至是预先消除。有研究慢慢的开始关注舆情事前预警体系的打造,重点是技术能否像人一样准确判断数据所蕴含的“冲突势能”的大小。

  人类真实的生活的种种以数据的形式被映射、被量化,以至于被生动描刻和精准分析。这一转向导致了数据主义思潮和哲学的全面确立和大范围的应用,也深刻影响了舆情数据实践演进与发展。从当前来看,舆情实践中数据主义倾向日盛并逐渐显现诸多弊端,因此,需要对舆情实践中的数据主义进行审视和反思。回归与平衡是未来舆情实践的两条发展进路,一方面,要回归人文,重拾价值理性,舆情实践要切实观照“人”,尊重人的需求与发展,从方法论上要重拾质化研究,重视对因果关系的深度挖掘,不能止步于关联关系的呈现;另一方面,要平衡“大数据”和“小数据”。“小数据”具有舆情生成的“前馈”价值,对“小数据”的有效抓取和科学研判将对舆情实践和社会治理的效率提升具备极其重大意义。

回到顶部