Hive导入csv文件示例


Posted in 数据库 onJune 25, 2022

正文

现有文件为csv格式,需要导入hive中,设csv内容如下

1001,zs,23
1002,lis,24

首先创建表

create table if not exists csv2(
    uid int,
    uname string,
    age int
)
row format serde 'org.apache.hadoop.hive.serde2.OpenCSVSerde'
stored as textfile ;

导入数据及查询

load data local inpath '/data/csv2.csv' into table csv2;
select * from csv2;

其他注意事项

如果建表是parquet格式可否load导入csv文件?

drop table csv2;
create table if not exists csv2(
    uid int,
    uname string,
    age int
)
row format serde 'org.apache.hadoop.hive.serde2.OpenCSVSerde'
stored as parquet ;

load data local inpath '/data/csv2.csv' into table csv2;
select * from csv2;

使用时会报错

Failed with exception java.io.IOException:java.lang.RuntimeException: hdfs://192.168.10.101:8020/user/hive/warehouse/csv2/csv2.csv is not a Parquet file. expected magic number at tail [80, 65, 82, 49] but found [44, 50, 52, 10]

**不可以,需要先导入成textfile,之后再从临时表导入成parquet,**如下

drop table csv2;
create table if not exists csv2
(
    uid   int,
    uname string,
    age   int
)
    row format serde 'org.apache.hadoop.hive.serde2.OpenCSVSerde'
    stored as textfile;
-- 先导入csv文件到表格csv2,保存格式是textfile
load data local inpath '/data/csv2.csv' into table csv2;


drop table csv3;
-- 创建csv3,保存格式parquet
create table if not exists csv3
(
    uid   int,
    uname string,
    age   int
)
    row format delimited
        fields terminated by ','
    stored as parquet;
-- 提取csv2的数据插入到csv3
insert overwrite table csv3 select * from csv2;

总结

  • 关键是要引入org.apache.hadoop.hive.serde2.OpenCSVSerde
  • csv要保存到hiveparquet,需要先保存成textfile

以上就是Hive导入csv文件示例的详细内容,更多关于Hive导入csv文件的资料请关注三水点靠木其它相关文章!


Tags in this post...

数据库 相关文章推荐
SQL Server2019数据库之简单子查询的具有方法
Apr 27 SQL Server
sql中mod()函数取余数的用法
May 29 SQL Server
MySQL 百万级数据的4种查询优化方式
Jun 07 MySQL
浅析MySQL如何实现事务隔离
Jun 26 MySQL
MySQL 开窗函数
Feb 15 MySQL
Mysql多层子查询示例代码(收藏夹案例)
Mar 31 MySQL
Mysql使用全文索引(FullText index)的实例代码
Apr 03 MySQL
数据分析数据库ClickHouse在大数据领域应用实践
Apr 03 MySQL
MySQL 数据库范式化设计理论
Apr 22 MySQL
Redis 报错 error:NOAUTH Authentication required
May 15 Redis
MySql如何将查询的出来的字段进行转换
Jun 14 MySQL
MySQL数据管理操作示例讲解
Dec 24 MySQL
Hive HQL支持2种查询语句风格
Jun 25 #数据库
Hive日期格式转换方法总结
Jun 25 #数据库
PostgreSQL怎么创建分区表详解
Jun 25 #PostgreSQL
Mysql中的触发器定义及语法介绍
Jun 25 #MySQL
Hive常用日期格式转换语法
Jun 25 #数据库
MySQL数据库配置信息查看与修改方法详解
Jun 25 #MySQL
SQL语句中EXISTS的详细用法大全
Jun 25 #MySQL
You might like
长波知识介绍
2021/03/01 无线电
php字符串分割函数explode的实例代码
2013/02/07 PHP
浅析PHP编程中10个最常见的错误
2014/08/08 PHP
thinkphp连贯操作实例分析
2014/11/22 PHP
PHP简单实现断点续传下载的方法
2015/09/25 PHP
人脸识别测颜值、测脸龄、测相似度微信接口
2016/04/07 PHP
PHP实现的登录,注册及密码修改功能分析
2016/11/25 PHP
php和redis实现秒杀活动的流程
2019/07/17 PHP
Aster vs Newbee BO3 第三场2.18
2021/03/10 DOTA
基于jquery实现的类似百度搜索的输入框自动完成功能
2011/08/23 Javascript
jQuery实现切换页面布局使用介绍
2011/10/09 Javascript
js实现数组冒泡排序、快速排序原理
2016/03/08 Javascript
详解Node.js模块间共享数据库连接的方法
2016/05/24 Javascript
微信小程序 跳转方式总结
2017/04/20 Javascript
Vue 去除路径中的#号
2018/04/19 Javascript
解决vue-cli项目webpack打包后iconfont文件路径的问题
2018/09/01 Javascript
JQuery获取元素尺寸、位置及页面滚动事件应用示例
2019/05/14 jQuery
js实现的在本地预览图片功能示例
2019/11/09 Javascript
原生JS实现留言板功能
2020/02/08 Javascript
详解JavaScript原型与原型链
2020/11/16 Javascript
解析Python中的生成器及其与迭代器的差异
2016/06/20 Python
利用Python脚本生成sitemap.xml的实现方法
2017/01/31 Python
python 编码规范整理
2018/05/05 Python
Python3列表内置方法大全及示例代码小结
2019/05/10 Python
Python pandas.DataFrame调整列顺序及修改index名的方法
2019/06/21 Python
python 一篇文章搞懂装饰器所有用法(建议收藏)
2019/08/23 Python
python函数中将变量名转换成字符串实例
2020/05/11 Python
Python是什么 Python的用处
2020/05/26 Python
Python Selenium实现无可视化界面过程解析
2020/08/25 Python
python UIAutomator2使用超详细教程
2021/02/19 Python
Python实现图片指定位置加图片水印(附Pyinstaller打包exe)
2021/03/04 Python
CSS3中的display:grid,网格布局介绍
2019/10/30 HTML / CSS
音乐教学案例
2014/01/30 职场文书
财务检查整改报告
2014/11/06 职场文书
检讨书范文2000字
2015/01/28 职场文书
php解析非标准json、非规范json的方式实例
2022/05/10 PHP