-
摘要: 【目的】随着互联网和人工智能技术的发展,新闻行业也已进入大数据时代,充分利用好新闻产品制作以及 传播中产生的数据对做出可靠的分析判断乃至决策有着重要的意义。【方法】数据仓库技术提供了这样的数据分析 处理能力,本文介绍了数据仓库技术的发展现状和相关应用,特别是近几年出现的众多如 Hive、Flink 及 Hudi 这样 新的技术框架,以及实时数仓和流批一体等新的技术理念。【结果】实现将数据仓库的最新技术和理念在新闻生产、 传播以及考核评价等业务的应用实践。【结论】数据仓库技术在新闻行业的应用可以为我们的宣传工作提供更有力 的数据决策支持。
-
[1] 杨力 . 大数据 Hive 离线计算开发实战 [M]. 北京:人民邮 电出版社,2020. [2] Fabian Hueske,Vasiliki Kalavri. 基于 Apache Flink 的流处 理 [M]. 北京:中国电力出版社,2020. [3] 李春葆,李石君,李筱弛 . 数据仓库与数据挖掘实践 [M]. 北京:电子工业出版社,2014. [4] Flink 在 顺 丰 的 应 用 实 践 [EB/OL].https://mp.weixin. qq.com/s/I4a1xCn0gAjxyQ2XxpbQNA,2021-08- 31/2023-06-23. [5] Disney 流媒体广告 Flink 的应用实践 [EB/OL].https:// zhuanlan.zhihu.com/p/599527894?utm_id=0,2023-01- 16/2023-06-24. [6] 韩嫕 . Lambda 架构在处理海量高并发数据中的应用 [J]. 现 代电视技术,2016(12):70-72. [7] 基肖睿,许红涛,吴保杰,蔚赵春,王洪涛 . 于 Kappa 架 构的实时日志分析平台研究与实践 [J]. 中国金融电脑, 2021(8):81-84. [8] Apache Flink Documentation[EB/OL]. https://nightlies. apache.org/flink/flink-docs-release-1.17/docs/learn-flink/ overview/.
点击查看大图
计量
- 文章访问数: 153
- HTML全文浏览量: 39
- PDF下载量: 6
- 被引次数: 0