如何在Win10系统使用Python3连接Hive


Posted in Python onOctober 15, 2020

由于数据存放在大数据平台的Hive数据仓库中,我需要在Win10系统上利用Python3连接Hive,然后读取数据,进行探索、分析和挖掘工作。

如何在Win10系统使用Python3连接Hive

我通过网上查找资料和实际测试,把Win10系统Python3成功连接Hive配置总结如下。

第一步:安装依赖库

pip install bitarray
pip install bit_array
pip install thrift
pip install thriftpy
pip install pure_sasl
pip install --no-deps thrift-sasl==0.2.1

提示:若是无法安装,也可以点击如下网址,

https://www.lfd.uci.edu/~gohlke/pythonlibs/

选择合适库的whl下载,然后进行本地化安装。

第二步:安装impyla库

我采用本地化安装方式,先下载impyla库的whl,如下图:

如何在Win10系统使用Python3连接Hive

再安装

pip install E:/Python_Library/impyla-0.16.2-py2.py3-none-any.whl

提示:上面的绝对路径根据你自己的情况而定

第三步:测试impyla库是否可以使用

from impala.dbapi import connect #用来连接Hive的函数
from impala.util import as_pandas #用来把数据结构转换为pandas

若是运行通过,表示利用impala连接Hive配置成功。

简单示例:

从Hive的一张表读取100条记录,放到pandas的DataFrame里面。

参考代码:

from impala.dbapi import connect #用来连接Hive的函数
from impala.util import as_pandas #用来把数据结构转换为pandas

conn = connect(host='my.host.com', port=21050)
cursor = conn.cursor()
cursor.execute('SELECT * FROM mytable LIMIT 100')
df = as_pandas(cursor)
cursor.close()

参考资料

https://github.com/cloudera/impyla

以上就是如何在Win10系统使用Python3连接Hive的详细内容,更多关于Python3连接Hive的资料请关注三水点靠木其它相关文章!

Python 相关文章推荐
python通过定义一个类实例作为ftp回调方法
May 04 Python
python使用wmi模块获取windows下的系统信息 监控系统
Oct 27 Python
Python基于opencv的图像压缩算法实例分析
May 03 Python
Pandas Shift函数的基础入门学习笔记
Nov 16 Python
Python文件打开方式实例详解【a、a+、r+、w+区别】
Mar 30 Python
Python timer定时器两种常用方法解析
Jan 20 Python
pytorch对梯度进行可视化进行梯度检查教程
Feb 04 Python
关于TensorFlow新旧版本函数接口变化详解
Feb 10 Python
浅谈pandas.cut与pandas.qcut的使用方法及区别
Mar 03 Python
jupyter notebook tensorflow打印device信息实例
Apr 20 Python
Python3与fastdfs分布式文件系统如何实现交互
Jun 23 Python
Python实现GIF动图以及视频卡通化详解
Dec 06 Python
Python进行特征提取的示例代码
Oct 15 #Python
Python通过递归函数输出嵌套列表元素
Oct 15 #Python
Python安装第三方库攻略(pip和Anaconda)
Oct 15 #Python
Python return语句如何实现结果返回调用
Oct 15 #Python
python 进程池pool使用详解
Oct 15 #Python
python 输入字符串生成所有有效的IP地址(LeetCode 93号题)
Oct 15 #Python
Python3使用 GitLab API 进行批量合并分支
Oct 15 #Python
You might like
phpinfo 系统查看参数函数代码
2009/06/05 PHP
一些被忽视的PHP函数(简单整理)
2010/04/30 PHP
PHP实现防盗链的方法分析
2017/07/25 PHP
Lumen timezone 时区设置方法(慢了8个小时)
2018/01/20 PHP
php微信开发之图片回复功能
2018/06/14 PHP
PHP+swoole+linux实现系统监控和性能优化操作示例
2019/04/15 PHP
PHP-FPM 设置多pool及配置文件重写操作示例
2019/10/02 PHP
Laravel框架实现抢红包功能示例
2019/10/31 PHP
张孝祥JavaScript学习阶段性总结(2)--(X)HTML学习
2007/02/03 Javascript
JavaScript this调用规则说明
2010/03/08 Javascript
javascript 循环读取JSON数据的代码
2010/07/17 Javascript
基于jquery的横向滚动条(滑动条)
2011/02/24 Javascript
利用jQuery接受和处理xml数据的代码(.net)
2011/03/28 Javascript
Javascript 加载和执行-性能提高篇
2012/12/28 Javascript
html的DOM中Event对象onabort事件用法实例
2015/01/21 Javascript
JavaScript操作Oracle数据库示例
2015/03/06 Javascript
jQuery实现判断滚动条到底部
2015/06/23 Javascript
最佳的JavaScript错误处理实践
2016/07/16 Javascript
javascript比较语义化版本号的实现代码
2016/09/09 Javascript
仿iframe效果Aajx文件上传实例
2016/11/18 Javascript
vue实现通讯录功能
2018/07/14 Javascript
Vue项目中使用better-scroll实现菜单映射功能方法
2019/09/11 Javascript
详解JavaScript数据类型和判断方法
2020/09/04 Javascript
Python实现根据指定端口探测服务器/模块部署的方法
2014/08/25 Python
Python 实现12306登录功能实例代码
2018/02/09 Python
Python HTML解析模块HTMLParser用法分析【爬虫工具】
2019/04/05 Python
Python中的字符串切片(截取字符串)的详解
2019/05/15 Python
Python中字符串List按照长度排序
2019/07/01 Python
django表单的Widgets使用详解
2019/07/22 Python
Django之form组件自动校验数据实现
2020/01/14 Python
铭宣海淘转运:美国、日本、英国转运等全球转运公司
2019/09/10 全球购物
师范生个人推荐信
2013/11/29 职场文书
2014年局领导班子自身建设情况汇报
2014/11/21 职场文书
单位介绍信格式
2015/01/31 职场文书
2015年安全生产月活动总结
2015/03/26 职场文书
解决MultipartFile.transferTo(dest) 报FileNotFoundExcep的问题
2021/07/01 Java/Android