如何将PySpark导入Python的放实现(2种)


Posted in Python onApril 26, 2020

方法一

使用findspark

使用pip安装findspark:

pip install findspark

在py文件中引入findspark:

>>> import findspark
>>> findspark.init()

导入你要使用的pyspark库

>>> from pyspark import *

优点:简单快捷
缺点:治标不治本,每次写一个新的Application都要加载一遍findspark

方法二

把预编译包中的Python库文件添加到Python的环境变量中

export SPARK_HOME=你的PySpark目录
export PYTHONPATH=$SPARK_HOME/libexec/python:$SPARK_HOME/libexec/python/build:$PYTHONPATH

优点:一劳永逸
缺点:对于小白可能不太了解环境变量是什么

问题1、ImportError: No module named pyspark

现象:

  • 已经安装配置好了PySpark,可以打开PySpark交互式界面;
  • 在Python里找不到pysaprk。

参照上面解决

问题2、ImportError: No module named ‘py4j'

现象:

已经安装配置好了PySpark,可以打开PySpark交互式界面;
按照上面的b方式配置后出现该问题。
解决方法:

把py4j添加到Python的环境变量中

export PYTHONPATH= $SPARK_HOME/python/lib/py4j-x.xx-src.zip:$PYTHONPATH

注意:这里的py4j-x.xx-src.zip根据自己电脑上的py4j版本决定。

测试成功的环境

  • Python: 3.7、2.7
  • PySpark: 1.6.2 - 预编译包
  • OS: Mac OSX 10.11.1

参考
Stackoverflow: importing pyspark in python shell
Stackoverflow: Why can't PySpark find py4j.java_gateway?

到此这篇关于如何将PySpark导入Python的放实现(2种)的文章就介绍到这了,更多相关PySpark导入Python内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木!

Python 相关文章推荐
Python发送Email方法实例
Aug 21 Python
python统计日志ip访问数的方法
Jul 06 Python
详解Python中最难理解的点-装饰器
Apr 03 Python
Python字符串格式化%s%d%f详解
Feb 02 Python
在numpy矩阵中令小于0的元素改为0的实例
Jan 26 Python
python循环定时中断执行某一段程序的实例
Jun 29 Python
Python利用requests模块下载图片实例代码
Aug 12 Python
Python3实现建造者模式的示例代码
Jun 28 Python
opencv 图像滤波(均值,方框,高斯,中值)
Jul 08 Python
python画图时设置分辨率和画布大小的实现(plt.figure())
Jan 08 Python
Python之qq自动发消息的示例代码
Feb 18 Python
python微信智能AI机器人实现多种支付方式
Apr 12 Python
基于python实现对文件进行切分行
Apr 26 #Python
python matplotlib模块基本图形绘制方法小结【直线,曲线,直方图,饼图等】
Apr 26 #Python
简单了解Java Netty Reactor三种线程模型
Apr 26 #Python
Python Selenium截图功能实现代码
Apr 26 #Python
使用Pycharm(Python工具)新建项目及创建Python文件的教程
Apr 26 #Python
Python实现密钥密码(加解密)实例详解
Apr 26 #Python
Python基于QQ邮箱实现SSL发送
Apr 26 #Python
You might like
二次元帅气男生排行榜,只想悄悄收藏系列
2020/03/04 日漫
PHP 应用程序的安全 -- 不能违反的四条安全规则
2006/11/26 PHP
ThinkPHP中url隐藏入口文件后接收alipay传值的方法
2014/12/09 PHP
CI框架出现mysql数据库连接资源无法释放的解决方法
2016/05/17 PHP
根据当前时间在jsp页面上显示上午或下午
2014/08/18 Javascript
全面解析JavaScript中apply和call以及bind(推荐)
2016/06/15 Javascript
jQuery模拟Marquee实现无缝滚动效果完整实例
2016/09/29 Javascript
javascript中闭包概念与用法深入理解
2016/12/15 Javascript
Bootstrap导航简单实现代码
2017/03/06 Javascript
Vue2.x中的父子组件相互通信的实现方法
2017/05/02 Javascript
JS 学习总结之正则表达式的懒惰性和贪婪性
2017/07/03 Javascript
如何在js代码中消灭for循环实例详解
2018/07/29 Javascript
js实现简单贪吃蛇游戏
2020/05/15 Javascript
vue接通后端api以及部署到服务器操作
2020/08/13 Javascript
vue.js+element 默认提示中英文操作
2020/11/11 Javascript
[04:52]DOTA2亚洲邀请赛附加赛 TOP10精彩集锦
2015/01/29 DOTA
[51:06]DOTA2-DPC中国联赛 正赛 Elephant vs Aster BO3 第二场 1月26日
2021/03/11 DOTA
全面分析Python的优点和缺点
2018/02/07 Python
python leetcode 字符串相乘实例详解
2018/09/03 Python
在python中pandas读文件,有中文字符的方法
2018/12/12 Python
python实现的MySQL增删改查操作实例小结
2018/12/19 Python
NumPy 数组使用大全
2019/04/25 Python
关于tf.reverse_sequence()简述
2020/01/20 Python
TensorFlow通过文件名/文件夹名获取标签,并加入队列的实现
2020/02/17 Python
CSS3 绘制BMW logo实的现代码
2013/04/25 HTML / CSS
某公司C#程序员面试题笔试题
2014/05/26 面试题
实习教师自我鉴定
2013/09/27 职场文书
大学生学习2014全国两会心得体会
2014/03/13 职场文书
《果园机器人》教学反思
2014/04/13 职场文书
计算机系本科生求职信
2014/05/31 职场文书
2014乡镇干部纪律作风整顿思想汇报
2014/09/13 职场文书
服务整改报告
2014/11/06 职场文书
时尚女魔头观后感
2015/06/04 职场文书
九年级语文教学反思
2016/03/03 职场文书
Python内置的数据类型及使用方法
2022/04/13 Python
解决IDEA翻译插件Translation报错更新TTK失败不能使用
2022/04/24 Python