如何将PySpark导入Python的放实现(2种)


Posted in Python onApril 26, 2020

方法一

使用findspark

使用pip安装findspark:

pip install findspark

在py文件中引入findspark:

>>> import findspark
>>> findspark.init()

导入你要使用的pyspark库

>>> from pyspark import *

优点:简单快捷
缺点:治标不治本,每次写一个新的Application都要加载一遍findspark

方法二

把预编译包中的Python库文件添加到Python的环境变量中

export SPARK_HOME=你的PySpark目录
export PYTHONPATH=$SPARK_HOME/libexec/python:$SPARK_HOME/libexec/python/build:$PYTHONPATH

优点:一劳永逸
缺点:对于小白可能不太了解环境变量是什么

问题1、ImportError: No module named pyspark

现象:

  • 已经安装配置好了PySpark,可以打开PySpark交互式界面;
  • 在Python里找不到pysaprk。

参照上面解决

问题2、ImportError: No module named ‘py4j'

现象:

已经安装配置好了PySpark,可以打开PySpark交互式界面;
按照上面的b方式配置后出现该问题。
解决方法:

把py4j添加到Python的环境变量中

export PYTHONPATH= $SPARK_HOME/python/lib/py4j-x.xx-src.zip:$PYTHONPATH

注意:这里的py4j-x.xx-src.zip根据自己电脑上的py4j版本决定。

测试成功的环境

  • Python: 3.7、2.7
  • PySpark: 1.6.2 - 预编译包
  • OS: Mac OSX 10.11.1

参考
Stackoverflow: importing pyspark in python shell
Stackoverflow: Why can't PySpark find py4j.java_gateway?

到此这篇关于如何将PySpark导入Python的放实现(2种)的文章就介绍到这了,更多相关PySpark导入Python内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木!

Python 相关文章推荐
python读取csv文件示例(python操作csv)
Mar 11 Python
Python中暂存上传图片的方法
Feb 18 Python
解析Python中的二进制位运算符
May 13 Python
Python批量按比例缩小图片脚本分享
May 21 Python
对python捕获ctrl+c手工中断程序的两种方法详解
Dec 26 Python
Pytorch Tensor的索引与切片例子
Aug 18 Python
Python使用python-docx读写word文档
Aug 26 Python
python 实现图片上传接口开发 并生成可以访问的图片url
Dec 18 Python
Python使用requests xpath 并开启多线程爬取西刺代理ip实例
Mar 06 Python
解决django FileFIELD的编码问题
Mar 30 Python
Python正则表达式如何匹配中文
May 27 Python
Python基于百度API识别并提取图片中文字
Jun 27 Python
基于python实现对文件进行切分行
Apr 26 #Python
python matplotlib模块基本图形绘制方法小结【直线,曲线,直方图,饼图等】
Apr 26 #Python
简单了解Java Netty Reactor三种线程模型
Apr 26 #Python
Python Selenium截图功能实现代码
Apr 26 #Python
使用Pycharm(Python工具)新建项目及创建Python文件的教程
Apr 26 #Python
Python实现密钥密码(加解密)实例详解
Apr 26 #Python
Python基于QQ邮箱实现SSL发送
Apr 26 #Python
You might like
PHP冒泡算法详解(递归实现)
2014/11/10 PHP
PHP实现通用alert函数的方法
2015/03/11 PHP
yii2简单使用less代替css示例
2017/03/10 PHP
小议Function.apply() 之一------(函数的劫持与对象的复制)
2006/11/30 Javascript
js实例属性和原型属性示例详解
2014/11/23 Javascript
JavaScript获得指定对象大小的方法
2015/07/01 Javascript
web 前端常用组件之Layer弹出层组件
2016/09/22 Javascript
微信小程序 五星评分(包括半颗星评分)实例代码
2016/12/14 Javascript
JS轮播图中缓动函数的封装
2020/11/25 Javascript
小程序两种滚动公告栏的实现方法
2019/09/17 Javascript
JavaScript ES6 Class类实现原理详解
2020/05/08 Javascript
2分钟实现一个Vue实时直播系统的示例代码
2020/06/05 Javascript
openLayer4实现动态改变标注图标
2020/08/17 Javascript
vue封装自定义指令之动态显示title操作(溢出显示,不溢出不显示)
2020/11/12 Javascript
python实现封装得到virustotal扫描结果
2014/10/05 Python
Python实现统计文本文件字数的方法
2017/05/05 Python
Python yield与实现方法代码分析
2018/02/06 Python
python增加矩阵维度的实例讲解
2018/04/04 Python
python面试题之列表声明实例分析
2019/07/08 Python
解决Tensorflow sess.run导致的内存溢出问题
2020/02/05 Python
python 如何调用远程接口
2020/09/11 Python
CSS3中文字镂空、透明值、阴影效果设置示例小结
2016/03/07 HTML / CSS
纯CSS3+DIV实现小三角形边框效果的示例代码
2020/08/03 HTML / CSS
Harrods美国:英国最大的百货公司
2018/11/04 全球购物
What is the purpose of Void class? Void类的作用是什么?
2016/10/31 面试题
读群众路线的心得体会
2014/09/03 职场文书
社区个人对照检查材料(群众路线)
2014/09/26 职场文书
抄袭同学作业检讨书1000字
2014/11/20 职场文书
小学生思想品德评语
2014/12/31 职场文书
给老婆的保证书怎么写
2015/05/08 职场文书
2015年城市管理工作总结
2015/05/23 职场文书
房贷工资证明范本
2015/06/12 职场文书
高中军训感想
2015/08/07 职场文书
Nginx配置https原理及实现过程详解
2021/03/31 Servers
Nebula Graph解决风控业务实践
2022/03/31 MySQL
Spring Boot实现文件上传下载
2022/08/14 Java/Android