Hive导入csv文件示例


Posted in 数据库 onJune 25, 2022

正文

现有文件为csv格式,需要导入hive中,设csv内容如下

1001,zs,23
1002,lis,24

首先创建表

create table if not exists csv2(
    uid int,
    uname string,
    age int
)
row format serde 'org.apache.hadoop.hive.serde2.OpenCSVSerde'
stored as textfile ;

导入数据及查询

load data local inpath '/data/csv2.csv' into table csv2;
select * from csv2;

其他注意事项

如果建表是parquet格式可否load导入csv文件?

drop table csv2;
create table if not exists csv2(
    uid int,
    uname string,
    age int
)
row format serde 'org.apache.hadoop.hive.serde2.OpenCSVSerde'
stored as parquet ;

load data local inpath '/data/csv2.csv' into table csv2;
select * from csv2;

使用时会报错

Failed with exception java.io.IOException:java.lang.RuntimeException: hdfs://192.168.10.101:8020/user/hive/warehouse/csv2/csv2.csv is not a Parquet file. expected magic number at tail [80, 65, 82, 49] but found [44, 50, 52, 10]

**不可以,需要先导入成textfile,之后再从临时表导入成parquet,**如下

drop table csv2;
create table if not exists csv2
(
    uid   int,
    uname string,
    age   int
)
    row format serde 'org.apache.hadoop.hive.serde2.OpenCSVSerde'
    stored as textfile;
-- 先导入csv文件到表格csv2,保存格式是textfile
load data local inpath '/data/csv2.csv' into table csv2;


drop table csv3;
-- 创建csv3,保存格式parquet
create table if not exists csv3
(
    uid   int,
    uname string,
    age   int
)
    row format delimited
        fields terminated by ','
    stored as parquet;
-- 提取csv2的数据插入到csv3
insert overwrite table csv3 select * from csv2;

总结

  • 关键是要引入org.apache.hadoop.hive.serde2.OpenCSVSerde
  • csv要保存到hiveparquet,需要先保存成textfile

以上就是Hive导入csv文件示例的详细内容,更多关于Hive导入csv文件的资料请关注三水点靠木其它相关文章!


Tags in this post...

数据库 相关文章推荐
SQLServer2019 数据库的基本使用之图形化界面操作的实现
Apr 08 SQL Server
MySQL主从搭建(多主一从)的实现思路与步骤
May 13 MySQL
zabbix agent2 监控oracle数据库的方法
May 13 Oracle
redis内存空间效率问题的深入探究
May 17 Redis
MySQL通过binlog恢复数据
May 27 MySQL
Mysql binlog日志文件过大的解决
Oct 05 MySQL
MySQL数据库⾼可⽤HA实现小结
Jan 22 MySQL
Redis命令处理过程源码解析
Feb 12 Redis
MySQL学习之基础操作总结
Mar 19 MySQL
MySQL插入数据与查询数据
Mar 25 MySQL
sql server偶发出现死锁的解决方法
Apr 10 SQL Server
Redis实现一个账号只能登录一个设备
Apr 19 Redis
Hive HQL支持2种查询语句风格
Jun 25 #数据库
Hive日期格式转换方法总结
Jun 25 #数据库
PostgreSQL怎么创建分区表详解
Jun 25 #PostgreSQL
Mysql中的触发器定义及语法介绍
Jun 25 #MySQL
Hive常用日期格式转换语法
Jun 25 #数据库
MySQL数据库配置信息查看与修改方法详解
Jun 25 #MySQL
SQL语句中EXISTS的详细用法大全
Jun 25 #MySQL
You might like
php include加载文件两种方式效率比较
2010/08/08 PHP
php字符串截取的简单方法
2013/07/04 PHP
一个简单的PHP验证码实现代码
2014/05/10 PHP
PHP中提问频率最高的11个面试题和答案
2014/09/02 PHP
php一维二维数组键排序方法实例总结
2014/11/13 PHP
php使用递归函数实现数字累加的方法
2015/03/16 PHP
PHP中ajax无刷新上传图片与图片下载功能
2017/02/21 PHP
gearman中任务的优先级和返回状态实例分析
2020/02/27 PHP
纯CSS打造的导航菜单(附jquery版)
2010/08/07 Javascript
function foo的原型与prototype属性解惑
2010/11/19 Javascript
基于jquery的不规则矩形的排列实现代码
2012/04/16 Javascript
js实现在页面上弹出蒙板技巧简单实用
2013/04/16 Javascript
javascript中字符串的定义示例代码
2013/12/19 Javascript
JavaScript实现的Tween算法及缓冲特效实例代码
2015/11/03 Javascript
详解Node.js串行化流程控制
2017/05/04 Javascript
简单实现js放大镜效果
2017/07/24 Javascript
基于JavaScript实现新增内容滚动播放效果附完整代码
2017/08/24 Javascript
vue实现登陆登出的实现示例
2017/09/15 Javascript
React Native之prop-types进行属性确认详解
2017/12/19 Javascript
微信小程序实现搜索功能并跳转搜索结果页面
2019/05/18 Javascript
nodejs对项目下所有空文件夹创建gitkeep的方法
2019/08/02 NodeJs
让Vue响应Map或Set的变化操作
2020/11/11 Javascript
Python找出文件中使用率最高的汉字实例详解
2015/06/03 Python
wxpython中Textctrl回车事件无效的解决方法
2016/07/21 Python
python实现二维码扫码自动登录淘宝
2016/12/27 Python
python使用邻接矩阵构造图代码示例
2017/11/10 Python
python是否适合网页编程详解
2019/10/04 Python
Python 面向对象之封装、继承、多态操作实例分析
2019/11/21 Python
Python基于yield遍历多个可迭代对象
2020/03/12 Python
openCV提取图像中的矩形区域
2020/07/21 Python
HTML5 embed标签定义和用法详解
2014/05/09 HTML / CSS
Move Free官方海外旗舰店:美国骨关节健康专业品牌
2017/12/06 全球购物
实习生求职自荐信
2014/02/07 职场文书
党的群众路线教育实践活动整改落实情况报告
2014/10/28 职场文书
黑白记忆观后感
2015/06/18 职场文书
ElementUI实现el-form表单重置功能按钮
2021/07/21 Javascript