pyspark.sql.DataFrame与pandas.DataFrame之间的相互转换实例


Posted in Python onAugust 02, 2018

代码如下,步骤流程在代码注释中可见:

# -*- coding: utf-8 -*-
import pandas as pd
from pyspark.sql import SparkSession
from pyspark.sql import SQLContext
from pyspark import SparkContext
 
#初始化数据
 
#初始化pandas DataFrame
df = pd.DataFrame([[1, 2, 3], [4, 5, 6]], index=['row1', 'row2'], columns=['c1', 'c2', 'c3'])
 
#打印数据
print df
 
#初始化spark DataFrame
sc = SparkContext()
if __name__ == "__main__":
 spark = SparkSession\
  .builder\
  .appName("testDataFrame")\
  .getOrCreate()
 
sentenceData = spark.createDataFrame([
 (0.0, "I like Spark"),
 (1.0, "Pandas is useful"),
 (2.0, "They are coded by Python ")
], ["label", "sentence"])
 
#显示数据
sentenceData.select("label").show()
 
#spark.DataFrame 转换成 pandas.DataFrame
sqlContest = SQLContext(sc)
spark_df = sqlContest.createDataFrame(df)
 
#显示数据
spark_df.select("c1").show()
 
 
# pandas.DataFrame 转换成 spark.DataFrame
pandas_df = sentenceData.toPandas()
 
#打印数据
print pandas_df

程序结果:

pyspark.sql.DataFrame与pandas.DataFrame之间的相互转换实例

以上这篇pyspark.sql.DataFrame与pandas.DataFrame之间的相互转换实例就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
python分割文件的常用方法
Nov 01 Python
python从入门到精通(DAY 1)
Dec 20 Python
python如何求解两数的最大公约数
Sep 27 Python
python实现矩阵打印
Mar 02 Python
pandas DataFrame 交集并集补集的实现
Jun 24 Python
Python Pandas 箱线图的实现
Jul 23 Python
基于Django ORM、一对一、一对多、多对多的全面讲解
Jul 26 Python
pytorch 固定部分参数训练的方法
Aug 17 Python
关于Python Tkinter Button控件command传参问题的解决方式
Mar 04 Python
Python实现邮件发送的详细设置方法(遇到问题)
Jan 18 Python
python opencv检测直线 cv2.HoughLinesP的实现
Jun 18 Python
 Python 中 logging 模块使用详情
Mar 03 Python
Python实现两个list求交集,并集,差集的方法示例
Aug 02 #Python
python爬虫框架scrapy实现模拟登录操作示例
Aug 02 #Python
python爬虫之线程池和进程池功能与用法详解
Aug 02 #Python
Python列表推导式与生成器用法分析
Aug 02 #Python
python flask实现分页的示例代码
Aug 02 #Python
Django分页查询并返回jsons数据(中文乱码解决方法)
Aug 02 #Python
Python实现正整数分解质因数操作示例
Aug 01 #Python
You might like
Terran热键控制
2020/03/14 星际争霸
PHP无限分类代码,支持数组格式化、直接输出菜单两种方式
2011/05/18 PHP
php str_getcsv把字符串解析为数组的实现方法
2017/04/05 PHP
JQuery 1.4 中的Ajax问题
2010/01/23 Javascript
自定义ExtJS控件之下拉树和下拉表格附源码
2013/10/15 Javascript
用Jquery.load载入页面实现局部刷新
2014/01/22 Javascript
调整小数的格式保留小数点后两位
2014/05/14 Javascript
jQuery插件datalist实现很好看的input下拉列表
2015/07/14 Javascript
jQuery实现文本框邮箱输入自动补全效果
2015/11/17 Javascript
jQuery实现侧浮窗与中浮窗切换效果的方法
2016/09/05 Javascript
easyui datagrid 大数据加载效率慢,优化解决方法(推荐)
2016/11/09 Javascript
理解javascript中的闭包
2017/01/11 Javascript
Vue.js实现多条件筛选、搜索、排序及分页的表格功能
2020/11/24 Javascript
node.js中debug模块的简单介绍与使用
2017/04/25 Javascript
详解关于react-redux中的connect用法介绍及原理解析
2017/09/11 Javascript
JS中的多态实例详解
2017/10/15 Javascript
JavaScript实现元素滚动条到达一定位置循环追加内容
2017/12/28 Javascript
JS引用传递与值传递的区别与用法分析
2018/06/01 Javascript
vue项目页面嵌入代码块vue-prism-editor的实现
2020/10/30 Javascript
python模拟enum枚举类型的方法小结
2015/04/30 Python
Python学生信息管理系统修改版
2018/03/13 Python
python实现微信防撤回神器
2019/04/29 Python
PyQt5根据控件Id获取控件对象的方法
2019/06/25 Python
python 自动轨迹绘制的实例代码
2019/07/05 Python
python中struct模块之字节型数据的处理方法
2019/08/27 Python
python中pathlib模块的基本用法与总结
2020/08/17 Python
python实现发送带附件的邮件代码分享
2020/09/22 Python
使用css3实现的windows8开机加载动画
2014/12/09 HTML / CSS
全球知名鞋履品牌授权零售商:Journeys
2016/09/17 全球购物
aden + anais官方网站:婴儿襁褓、毯子、尿布和服装
2017/06/21 全球购物
来自南加州灵感的工作和娱乐服装:TravisMathew
2019/05/01 全球购物
如何清空Session
2015/02/23 面试题
毕业生自荐书模版
2014/01/04 职场文书
个人维稳承诺书
2015/05/04 职场文书
Python实现照片卡通化
2021/12/06 Python
nginx之queue的具体使用
2022/06/28 Servers