春节不停更,此文正在参加「[星光计划春节更帖活动](https:harmonyos.51cto.composts9923)」大家好,我是怀瑾握瑜,一只大数据萌新,家有两只吞金兽,嘉与嘉,上能code下能teach的全能奶爸如果您喜欢我的文章,可以[关注⭐]+[点赞👍]+[评论📃],您的三连是我前进的动力,期待与您共同成长什么是ProtoBufprotocolbuffers是一种语言无关、平台无关、可扩展的序列化结构数据的方法,它可用于(数据)通信协议、数据存储等。protobu...
2022-01-25 22:10:59 7363浏览 0点赞 0回复 0收藏
春节不停更,此文正在参加「[星光计划春节更帖活动](https:harmonyos.51cto.composts9923)」大家好,我是怀瑾握瑜,一只大数据萌新,上能code下能teach的全能奶爸,家有两只吞金兽,嘉与嘉如果您喜欢我的文章,可以[关注⭐]+[点赞👍]+[评论📃],您的三连是我前进的动力,期待与您共同成长1.起因在进行数据处理时,会经常用到一些中间表,比如DIM表,比如其他数据源的数据。如果这些数据量很小,直接与大数据做JOIN,会很影响性...
2022-01-23 18:45:53 7581浏览 2点赞 0回复 1收藏
春节不停更,此文正在参加「[星光计划春节更帖活动](https:harmonyos.51cto.composts9923)」大家好,我是怀瑾握瑜,一只大数据萌新,家有两只吞金兽,嘉与嘉,上能code下能teach的全能奶爸如果您喜欢我的文章,可以[关注⭐]+[点赞👍]+[评论📃],您的三连是我前进的动力,期待与您共同成长前言Spark提供了三种主要的与数据相关的API:RDD:全称ResilientDistributedDataset,弹性分布式数据集,Spark中最基础的数据抽象,特点是R...
2022-01-22 18:31:20 6587浏览 0点赞 0回复 0收藏
春节不停更,此文正在参加「[星光计划春节更帖活动](https:harmonyos.51cto.composts9923)」大家好,我是怀瑾握瑜,一只大数据萌新,家有两只吞金兽,嘉与嘉,上能code下能teach的全能奶爸如果您喜欢我的文章,可以[关注⭐]+[点赞👍]+[评论📃],您的三连是我前进的动力,期待与您共同成长数据仓库简介数据仓库是一个面向主题的、集成的、随时间变化的、但信息本身相对稳定的数据集合,用于对管理决策过程的支持。互联网时代,由...
2022-01-21 23:33:02 7.4w浏览 1点赞 0回复 3收藏
春节不停更,此文正在参加「[星光计划春节更帖活动](https:harmonyos.51cto.composts9923)」大家好,我是怀瑾握瑜,一只大数据萌新,家有两只吞金兽,嘉与嘉,上能code下能teach的全能奶爸如果您喜欢我的文章,可以[关注⭐]+[点赞👍]+[评论📃],您的三连是我前进的动力,期待与您共同成长前言Flume是一个分布式、可靠、和高可用的海量日志采集、聚合和传输的系统。支持在日志系统中定制各类数据发送方,用于收集数据;同时,Flum...
2022-01-20 23:34:50 7852浏览 1点赞 0回复 1收藏
春节不停更,此文正在参加「[星光计划春节更帖活动](https:harmonyos.51cto.composts9923)」大家好,我是怀瑾握瑜,一只大数据萌新,家有两只吞金兽,嘉与嘉,上能code下能teach的全能奶爸如果您喜欢我的文章,可以[关注⭐]+[点赞👍]+[评论📃],您的三连是我前进的动力,期待与您共同成长前言Hive中对中间数据或最终数据都会做压缩处理,以提高吞吐量和性能。通常压缩比高的占用空间小,但解压缩慢,反之亦然,常用的压缩格式有...
2022-01-19 20:30:38 6375浏览 0点赞 0回复 0收藏
春节不停更,此文正在参加「[星光计划春节更帖活动](https:harmonyos.51cto.composts9923)」大家好,我是怀瑾握瑜,一只大数据萌新,家有两只吞金兽,嘉与嘉,上能code下能teach的全能奶爸如果您喜欢我的文章,可以[关注⭐]+[点赞👍]+[评论📃],您的三连是我前进的动力,期待与您共同成长题外话我说:我要买鼠标,领导的声音飘来:你姑娘要交伙食费了我说:我要买键盘,领导的声音飘来:你姑娘要学舞蹈了我说:我要买手机,领导...
2022-01-18 23:06:12 6619浏览 0点赞 0回复 0收藏