如何在Win10系统使用Python3连接Hive


Posted in Python onOctober 15, 2020

由于数据存放在大数据平台的Hive数据仓库中,我需要在Win10系统上利用Python3连接Hive,然后读取数据,进行探索、分析和挖掘工作。

如何在Win10系统使用Python3连接Hive

我通过网上查找资料和实际测试,把Win10系统Python3成功连接Hive配置总结如下。

第一步:安装依赖库

pip install bitarray
pip install bit_array
pip install thrift
pip install thriftpy
pip install pure_sasl
pip install --no-deps thrift-sasl==0.2.1

提示:若是无法安装,也可以点击如下网址,

https://www.lfd.uci.edu/~gohlke/pythonlibs/

选择合适库的whl下载,然后进行本地化安装。

第二步:安装impyla库

我采用本地化安装方式,先下载impyla库的whl,如下图:

如何在Win10系统使用Python3连接Hive

再安装

pip install E:/Python_Library/impyla-0.16.2-py2.py3-none-any.whl

提示:上面的绝对路径根据你自己的情况而定

第三步:测试impyla库是否可以使用

from impala.dbapi import connect #用来连接Hive的函数
from impala.util import as_pandas #用来把数据结构转换为pandas

若是运行通过,表示利用impala连接Hive配置成功。

简单示例:

从Hive的一张表读取100条记录,放到pandas的DataFrame里面。

参考代码:

from impala.dbapi import connect #用来连接Hive的函数
from impala.util import as_pandas #用来把数据结构转换为pandas

conn = connect(host='my.host.com', port=21050)
cursor = conn.cursor()
cursor.execute('SELECT * FROM mytable LIMIT 100')
df = as_pandas(cursor)
cursor.close()

参考资料

https://github.com/cloudera/impyla

以上就是如何在Win10系统使用Python3连接Hive的详细内容,更多关于Python3连接Hive的资料请关注三水点靠木其它相关文章!

Python 相关文章推荐
9种python web 程序的部署方式小结
Jun 30 Python
python实现猜单词小游戏
May 22 Python
python的几种矩阵相乘的公式详解
Jul 10 Python
python利用wx实现界面按钮和按钮监听和字体改变的方法
Jul 17 Python
python正则爬取某段子网站前20页段子(request库)过程解析
Aug 10 Python
使用python获取邮箱邮件的设置方法
Sep 20 Python
centos+nginx+uwsgi+Django实现IP+port访问服务器
Nov 15 Python
pycharm运行scrapy过程图解
Nov 22 Python
详解python 中in 的 用法
Dec 12 Python
django从后台返回html代码的实例
Mar 11 Python
Python urllib.request对象案例解析
May 11 Python
深入了解Python 方法之类方法 & 静态方法
Aug 17 Python
Python进行特征提取的示例代码
Oct 15 #Python
Python通过递归函数输出嵌套列表元素
Oct 15 #Python
Python安装第三方库攻略(pip和Anaconda)
Oct 15 #Python
Python return语句如何实现结果返回调用
Oct 15 #Python
python 进程池pool使用详解
Oct 15 #Python
python 输入字符串生成所有有效的IP地址(LeetCode 93号题)
Oct 15 #Python
Python3使用 GitLab API 进行批量合并分支
Oct 15 #Python
You might like
php输入流php://input使用浅析
2014/09/02 PHP
Linux环境下php实现给网站截图的方法
2016/05/03 PHP
javascript事件模型代码
2007/07/01 Javascript
jQuery 表格工具集
2010/04/25 Javascript
Jquery上传插件 uploadify v3.1使用说明
2012/06/18 Javascript
JavaScript中__proto__与prototype的关系深入理解
2012/12/04 Javascript
jQuery中extend函数的实现原理详解
2015/02/03 Javascript
JavaScript编程的单例设计模讲解
2015/11/10 Javascript
项目实践一图片上传之form表单还是base64前端图片压缩(前端图片压缩)
2016/07/28 Javascript
JS查找字符串中出现次数最多的字符
2016/09/05 Javascript
Node.js connect ECONNREFUSED错误解决办法
2016/09/15 Javascript
react-router JS 控制路由跳转实例
2017/06/15 Javascript
jQuery扩展_动力节点Java学院整理
2017/07/05 jQuery
详解vue2.0 资源文件assets和static的区别
2018/11/27 Javascript
Vue项目服务器部署之子目录部署方法
2019/05/12 Javascript
使用localStorage替代cookie做本地存储
2019/09/25 Javascript
vue中是怎样监听数组变化的
2020/10/24 Javascript
Python socket编程实例详解
2015/05/27 Python
Python连接DB2数据库
2016/08/27 Python
python找出因数与质因数的方法
2019/07/25 Python
PyTorch中topk函数的用法详解
2020/01/02 Python
win10系统下python3安装及pip换源和使用教程
2020/01/06 Python
Python 实现递归法解决迷宫问题的示例代码
2020/01/12 Python
pyspark给dataframe增加新的一列的实现示例
2020/04/24 Python
Django 实现 Websocket 广播、点对点发送消息的代码
2020/06/03 Python
Python如何批量生成和调用变量
2020/11/21 Python
python3字符串输出常见面试题总结
2020/12/01 Python
Linux机考试题
2015/10/16 面试题
如何用Python来进行查询和替换一个文本字符串
2014/01/02 面试题
李开复演讲稿
2014/05/24 职场文书
2014党员学习习主席讲话思想汇报
2014/09/15 职场文书
债务纠纷代理词
2015/05/25 职场文书
校园歌手大赛主持词
2015/07/03 职场文书
《作风建设永远在路上》心得体会
2016/01/21 职场文书
python获取对象信息的实例详解
2021/07/07 Python
python使用torch随机初始化参数
2022/03/22 Python