PyCharm搭建Spark开发环境的实现步骤


Posted in Python onSeptember 05, 2019

1.安装好JDK

下载并安装好jdk-12.0.1_windows-x64_bin.exe,配置环境变量:

  • 新建系统变量JAVA_HOME,值为Java安装路径
  • 新建系统变量CLASSPATH,值为 .;%JAVA_HOME%\lib\dt.jar;%JAVA_HOME%\lib\tools.jar;(注意最前面的圆点)
  • 配置系统变量PATH,添加 %JAVA_HOME%bin;%JAVA_HOME%jrebin

在CMD中输入:java或者java -version,不显示不是内部命令等,说明安装成功。

2.安装Hadoop,并配置环境变量

下载hadoop:https://www.apache.org/dyn/closer.cgi/hadoop/common/hadoop-2.7.7/hadoop-2.7.7.tar.gz

PyCharm搭建Spark开发环境的实现步骤

  • 解压hadoop-2.7.7.tar.gz特定路径,如:D:\adasoftware\hadoop
  • 添加系统变量HADOOP_HOME:D:\adasoftware\hadoop
  • 在系统变量PATH中添加:D:\adasoftware\hadoop\bin
  • 安装组件winutils:将winutils中对应的hadoop版本中的bin替换自己hadoop安装目录下的bin

3.Spark环境变量配置

spark是基于hadoop之上的,运行过程中会调用相关hadoop库,如果没配置相关hadoop运行环境,会提示相关出错信息,虽然也不影响运行。

  • 下载对应hadoop版本的spark:http://spark.apache.org/downloads.html
  • 解压文件到:D:\adasoftware\spark-2.4.3-bin-hadoop2.7
  • 添加PATH值:D:\adasoftware\spark-2.4.3-bin-hadoop2.7\bin;
  • 新建系统变量SPARK_HOME:D:\adasoftware\spark-2.4.3-bin-hadoop2.7;

4.下载安装anaconda

anaconda集成了python解释器和大多数python库,安装anaconda 后不用再安装python和pandas numpy等这些组件了。下载地址。最后将python加到path环境变量中。

5.在CMD中运行pyspark,出现类似下图说明安装配置正常:

PyCharm搭建Spark开发环境的实现步骤

出现这种warning是因为JDK版本为12,太高了,但是不影响运行。没有影响。

6.在pycharm中配置spark

打开PyCharm,创建一个Project。然后选择“Run” ->“Edit Configurations”?>点击+创建新的python Configurations

PyCharm搭建Spark开发环境的实现步骤

选择 “Environment variables” 增加SPARK_HOME目录与PYTHONPATH目录。

  • SPARK_HOME:Spark安装目录
  • PYTHONPATH:Spark安装目录下的Python目录

PyCharm搭建Spark开发环境的实现步骤

选择 File->setting->你的project->project structure

右上角Add content root添加:py4j-some-version.zip和pyspark.zip的路径(这两个文件都在Spark中的python文件夹下)

保存即可

7.测试是否配置成功,程序代码如下,创建一个python程序放进去就可以:

import os
import sys

# Path for spark source folder
os.environ['SPARK_HOME'] = "D:\adasoftware\spark"

# Append pyspark to Python Path
sys.path.append("D:\adasoftware\spark\python")

try:
 from pyspark import SparkContext
 from pyspark import SparkConf

 print("Successfully imported Spark Modules")
except ImportError as e:
 print("Can not import Spark Modules", e)
 sys.exit(1)

若程序正常输出: "Successfully imported Spark Modules"就说明环境已经可以正常执行。

PyCharm搭建Spark开发环境的实现步骤

 以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
python映射列表实例分析
Jan 26 Python
一步步解析Python斗牛游戏的概率
Feb 12 Python
通过Pandas读取大文件的实例
Jun 07 Python
python生成器用法实例详解
Nov 22 Python
Python魔法方法 容器部方法详解
Jan 02 Python
Django+boostrap 美化admin后台的操作
Mar 11 Python
python3用PyPDF2解析pdf文件,用正则匹配数据方式
May 12 Python
哪些是python中web开发框架
Jun 17 Python
使用matplotlib的pyplot模块绘图的实现示例
Jul 12 Python
python 中的命名空间,你真的了解吗?
Aug 19 Python
python os.rename实例用法详解
Dec 06 Python
Selenium执行完毕未关闭chromedriver/geckodriver进程的解决办法(java版+python版)
Dec 07 Python
浅谈Python_Openpyxl使用(最全总结)
Sep 05 #Python
python实现人工智能Ai抠图功能
Sep 05 #Python
深入了解Python在HDA中的应用
Sep 05 #Python
python urllib爬虫模块使用解析
Sep 05 #Python
详解Python3 pandas.merge用法
Sep 05 #Python
python爬虫 猫眼电影和电影天堂数据csv和mysql存储过程解析
Sep 05 #Python
python爬取Ajax动态加载网页过程解析
Sep 05 #Python
You might like
PHP获取网址的顶级域名函数代码
2012/09/24 PHP
Zend的MVC机制使用分析(二)
2013/05/02 PHP
Mootools 1.2教程 类(一)
2009/09/15 Javascript
ext 同步和异步示例代码
2009/09/18 Javascript
JS 实现点击a标签的时候让其背景更换
2013/10/15 Javascript
实现51Map地图接口(示例代码)
2013/11/22 Javascript
基于jQuery仿淘宝产品图片放大镜特效
2020/10/19 Javascript
微信小程序 页面之间传参实例详解
2017/01/13 Javascript
js轮播图无缝滚动效果
2017/06/17 Javascript
Easyui使用Dialog行内按钮布局的实例
2017/07/27 Javascript
详解Layer弹出层样式
2017/08/21 Javascript
node.js实现微信JS-API封装接口的示例代码
2017/09/06 Javascript
JavaScript实现选项卡效果的分析及步骤
2019/04/16 Javascript
layUI实现三级导航菜单效果
2019/07/26 Javascript
jquery实现垂直手风琴导航栏
2020/02/18 jQuery
Vue中通过属性绑定为元素绑定style行内样式的实例代码
2020/04/30 Javascript
Python实现的HTTP并发测试完整示例
2020/04/23 Python
Python文件读取的3种方法及路径转义
2015/06/21 Python
详解Django中的权限和组以及消息
2015/07/23 Python
使用PyInstaller将Python程序文件转换为可执行程序文件
2016/07/08 Python
一个基于flask的web应用诞生 flask和mysql相连(4)
2017/04/11 Python
Php多进程实现代码
2018/05/07 Python
python K近邻算法的kd树实现
2018/09/06 Python
Python pandas.DataFrame调整列顺序及修改index名的方法
2019/06/21 Python
pytorch中torch.max和Tensor.view函数用法详解
2020/01/03 Python
python实现连连看游戏
2020/02/14 Python
详解CSS3中nth-child与nth-of-type的区别
2017/01/05 HTML / CSS
HTML5 canvas基本绘图之绘制五角星
2016/06/27 HTML / CSS
快速创建 HTML5 Canvas 电信网络拓扑图的示例代码
2018/03/21 HTML / CSS
Parfume Klik丹麦:香水网上商店
2018/07/10 全球购物
Kickers鞋英国官网:男士、女士和儿童鞋
2021/03/08 全球购物
中学生纪念九一八事变演讲稿
2014/09/14 职场文书
镇班子对照检查材料思想汇报
2014/09/24 职场文书
酒店优秀员工推荐信
2015/03/24 职场文书
导游词之吉林吉塔
2019/11/11 职场文书
《最后一头战象》读后感:动物也有感情
2020/01/02 职场文书