【本文正在参加2023年第一期优质创作者激励计划】老规矩,还没看前面的文章而且对这些知识点不熟悉的,可以点击连接进行观看哦:[hive从入门到放弃(一)——初识hive](https:ost.51cto.composts21537)[hive从入门到放弃(二)——DDL数据定义](https:ost.51cto.composts21604)[hive从入门到放弃(三)——DML数据操作](https:ost.51cto.composts21691)[hive从入门到放弃(四)——分区与分桶](https:ost.51cto.composts22503)话不多说...
2023-03-29 14:52:29 5115浏览 6点赞 5回复 3收藏
【本文正在参加2023年第一期优质创作者激励计划】今天讲讲分区表和分桶表,前面的文章还没看的可以点击链接:[hive从入门到放弃(一)——初识hive](https:ost.51cto.composts21537)[hive从入门到放弃(二)——DDL数据定义](https:ost.51cto.composts21604)[hive从入门到放弃(三)——DML数据操作](https:ost.51cto.composts21691)分区分区可以提高查询效率,实际上hive的一个分区就是HDFS上的一个目录,目录里放着属于该分区的数据...
2023-03-28 10:30:38 3132浏览 3点赞 1回复 2收藏
【本文正在参加2023年第一期优质创作者激励计划】上一篇给大家介绍了hive的DDL数据定义语言,这篇来介绍一下DML数据操作语言。没看过的可以点击跳转阅读:[hive从入门到放弃(一)——初识hive](https:ost.51cto.composts21537)[hive从入门到放弃(二)——DDL数据定义](https:ost.51cto.composts21604)数据写入数据导入部分默认数据文件格式为textfile,每一列由‘,’进行分割,以换行分行。insertinsert表示向表中插入数据,可以...
2023-03-05 21:30:50 3126浏览 1点赞 0回复 1收藏
【本文正在参加2023年第一期优质创作者激励计划】前一篇文章,介绍了什么是hive,以及hive的架构、数据类型,没看的可以点击阅读:[hive从入门到放弃(一)——初识hive](https:ost.51cto.composts21537)今天讲一下hive的DDL数据定义创建数据库CREATEDATABASE[IFNOTEXISTS]①databasename[COMMENTdatabasecomment]②[LOCATIONhdfspath]③[WITHDBPROPERTIES(propertynamepropertyvalue,...)]④;①若存在则不创建,不存在则创建②数...
2023-03-01 20:20:51 4005浏览 1点赞 0回复 1收藏
【本文正在参加2023年第一期优质创作者激励计划】[toc](目录)hive介绍hive是一个开源的用于大数据分析和统计的数据库工具,它的存储基于HDFS,计算基于MapReduce或Spark,可以将结构化数据映射成表,并提供类SQL查询功能。特点提供类SQL查询,容易上手,开发方便封装了很多方法,尽量避免了开发MapReduce程序,减少成本支持自定义函数,可以根据需求实现函数适用于处理大规模数据,小数据的处理没有优势执行延迟较高,适合用于...
2023-02-27 17:24:26 4432浏览 3点赞 0回复 1收藏