博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
053 关于hive的存储格式
阅读量:6888 次
发布时间:2019-06-27

本文共 310 字,大约阅读时间需要 1 分钟。

1.存储格式

  textfile

  rcfile

  orc

  parquet

 

2.存储方式

  按行存储

    -》textfile

  按列存储

    -》parquet

 

3.压缩比

  

 

4.存储textfile的原文件

  

  并加载数据

  

5.大小

  

 

6.保存为textfile,经过mapreduce

  

 

7.结果的大小

  

 

8.保存为orc格式

  

 

9.大小

  

 

 10.存储为parquet

  

 

11.大小

  

 

12.使用命令求大小

   bin/hdfs dfs -du -s -h /user/hive/warehouse/track_log.db/yhd_par

  

 

转载地址:http://agtbl.baihongyu.com/

你可能感兴趣的文章
web站点和windows服务项目发布时如何排除指定文件
查看>>
九度 1138 - 大数除余 - 进制转换
查看>>
Sql Server中集合的操作(并集、差集、交集)学习
查看>>
Linux文字分段裁剪命令cut(转)
查看>>
linux下mysql的root密码忘记解决方
查看>>
onClickRow 事件
查看>>
学习图像算法阶段性总结 (附一键修图Demo)
查看>>
SpringMVC hibernate增加多数据源 (SSHE/SYPRO增加多数据源为例)
查看>>
MS SQL批量生成作业脚本方法介绍总结
查看>>
mongodb中批量将时间戳转变通用日期格式
查看>>
es5.0 安装ik中文分词器 mac
查看>>
挖一挖C#中那些我们不经常使用的东西之系列(4)——GetHashCode,ExpandoObject
查看>>
jquery选择div下的ul下的li下的a
查看>>
老鼠毒药问题和它的扩展
查看>>
JAVA -- 内省 Introspector
查看>>
EntityFramework Core问题处理集锦(一)
查看>>
Windows10上搭建Kinect 2 开发环境
查看>>
免费开源分布式系统日志收集框架 Exceptionless
查看>>
编程语言的弱类型、强类型、动态类型、静态类型
查看>>
怎样查看class文件的jdk版本号
查看>>