-
摘要: 【目的】随着自动撰稿技术的发展和移动终端的普及,媒体新闻数据量呈现爆发式增长,给舆论研究人员和舆情监测工作带来了极大的挑战。[1] 针对海量新闻稿件的采集、筛选工作,仅依靠人工处理或简单的语义查询技术,已无法高效应对。【方法】文章利用模糊综合评判模型对新闻数据进行清洗的方法。【结果】得到有效减少数据处理总量和去除数据噪声的结果,进而形成适用于报业集团舆情数据的清洗规则库,并通过评判等级和隶属函数确定具体评级分数。【结论】最终得出有效提升舆情监测和处理效率的清洗方法。
-
[1] 王楷鑫,鄢睿,王立国,王双立.新媒体数据分析与应用浅析[J].中国传媒科技,2021(10):145-148. [2] 郝爽,李国良,冯建华,王宁.结构化数据清洗技术综述[J].清华大学学报(自然科学版),2018(12):1037-1050. [3] 吴信东,董丙冰,堵新政,杨威.数据治理技术[J].软件学报,2019(9):2830-2856. [4] 韩孟婷,柴彬彬,马立民.大数据环境下高校新媒体舆情分析模型的探索与实践[J].北京教育(高教),2020(4):76-78. [5] 廖书妍.数据清洗研究综述[J].电脑知识与技术,2020(20):44-47. [6] 陈舒枝.舆情大数据系统的设计与实现[J].无线互联科技,2020(15):72-73. [7] 李洪烈,夏栋,王倩.基于回归模型的采集数据清洗技术[J].电光与控制,2022(4):117-120. [8] 黎伟健,胡斌,李威,唐健玲,肖西西.大数据视角下的非结构化文本挖掘分析方法[J].新媒体研究,2021(8):8-10+52. [9] 米允龙,李金海,米春桥,刘文奇,刘佳,王添.基于区间模糊匹配函数的数据清洗算法研究及其在问卷调查中的应用[J].南京师范大学学报(工程技术版),2017(3)70-79. [10] 陈珺.媒体大数据服务平台设计与构建方法研究[J].中国传媒科技,2018(9):64-66.
点击查看大图
计量
- 文章访问数: 248
- HTML全文浏览量: 35
- PDF下载量: 27
- 被引次数: 0