pyspark.sql.DataFrame与pandas.DataFrame之间的相互转换实例


Posted in Python onAugust 02, 2018

代码如下,步骤流程在代码注释中可见:

# -*- coding: utf-8 -*-
import pandas as pd
from pyspark.sql import SparkSession
from pyspark.sql import SQLContext
from pyspark import SparkContext
 
#初始化数据
 
#初始化pandas DataFrame
df = pd.DataFrame([[1, 2, 3], [4, 5, 6]], index=['row1', 'row2'], columns=['c1', 'c2', 'c3'])
 
#打印数据
print df
 
#初始化spark DataFrame
sc = SparkContext()
if __name__ == "__main__":
 spark = SparkSession\
  .builder\
  .appName("testDataFrame")\
  .getOrCreate()
 
sentenceData = spark.createDataFrame([
 (0.0, "I like Spark"),
 (1.0, "Pandas is useful"),
 (2.0, "They are coded by Python ")
], ["label", "sentence"])
 
#显示数据
sentenceData.select("label").show()
 
#spark.DataFrame 转换成 pandas.DataFrame
sqlContest = SQLContext(sc)
spark_df = sqlContest.createDataFrame(df)
 
#显示数据
spark_df.select("c1").show()
 
 
# pandas.DataFrame 转换成 spark.DataFrame
pandas_df = sentenceData.toPandas()
 
#打印数据
print pandas_df

程序结果:

pyspark.sql.DataFrame与pandas.DataFrame之间的相互转换实例

以上这篇pyspark.sql.DataFrame与pandas.DataFrame之间的相互转换实例就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
python获取远程图片大小和尺寸的方法
Mar 26 Python
Windows下实现Python2和Python3两个版共存的方法
Jun 12 Python
Python实现命令行通讯录实例教程
Aug 18 Python
python 调用win32pai 操作cmd的方法
May 28 Python
python Matplotlib画图之调整字体大小的示例
Nov 20 Python
用Python写王者荣耀刷金币脚本
Dec 21 Python
Python反射用法实例简析
Dec 22 Python
Python Json序列化与反序列化的示例
Jan 31 Python
浅谈python正则的常用方法 覆盖范围70%以上
Mar 14 Python
pycharm创建scrapy项目教程及遇到的坑解析
Aug 15 Python
使用tensorflow进行音乐类型的分类
Aug 14 Python
Python暴力破解Mysql数据的示例
Nov 09 Python
Python实现两个list求交集,并集,差集的方法示例
Aug 02 #Python
python爬虫框架scrapy实现模拟登录操作示例
Aug 02 #Python
python爬虫之线程池和进程池功能与用法详解
Aug 02 #Python
Python列表推导式与生成器用法分析
Aug 02 #Python
python flask实现分页的示例代码
Aug 02 #Python
Django分页查询并返回jsons数据(中文乱码解决方法)
Aug 02 #Python
Python实现正整数分解质因数操作示例
Aug 01 #Python
You might like
PHP 数字左侧自动补0
2008/03/31 PHP
PHP 字符串长度判断效率更高的方法
2014/03/02 PHP
php操作(删除,提取,增加)zip文件方法详解
2015/03/12 PHP
php发送邮件的问题详解
2015/06/22 PHP
JQuery 常用方法基础教程
2009/02/06 Javascript
浅谈Javascript嵌套函数及闭包
2010/11/09 Javascript
javascript中获取下个月一号,是星期几
2012/06/01 Javascript
jquery 获取表单元素里面的值示例代码
2013/07/28 Javascript
js获得当前时区夏令时发生和终止的时间代码
2014/02/23 Javascript
jquery form表单序列化为对象的示例代码
2014/03/05 Javascript
浏览器窗口大小变化时使用resize事件对框架不起作用的解决方法
2014/05/11 Javascript
解释&&和||在javascript中的另类用法
2014/07/28 Javascript
AngularJS控制器controller正确的通信的方法
2016/01/25 Javascript
浅谈JavaScript 浏览器对象
2016/06/03 Javascript
jQuery实用小技巧_输入框文字获取和失去焦点的简单实例
2016/08/25 Javascript
bootstrap paginator分页前后台用法示例
2017/06/17 Javascript
React Native实现进度条弹框的示例代码
2017/07/17 Javascript
JS解析后台返回的JSON格式数据实例
2018/08/06 Javascript
利用hasOwnProperty给数组去重的面试题分享
2018/11/05 Javascript
解决vue 单文件组件中样式加载问题
2019/04/24 Javascript
HTML元素拖拽功能实现的完整实例
2020/12/04 Javascript
js实现简单图片拖拽效果
2021/02/22 Javascript
[48:37]EG vs OG 2018国际邀请赛小组赛BO2 第一场 8.17
2018/08/18 DOTA
在Python中使用异步Socket编程性能测试
2014/06/25 Python
Python使用xlrd模块操作Excel数据导入的方法
2015/05/26 Python
Python实现快速排序和插入排序算法及自定义排序的示例
2016/02/16 Python
python解决js文件utf-8编码乱码问题(推荐)
2018/05/02 Python
Python对象与引用的介绍
2019/01/24 Python
django 中QuerySet特性功能详解
2019/07/25 Python
如何通过Python3和ssl实现加密通信功能
2020/05/09 Python
python如何调用字典的key
2020/05/25 Python
餐厅考勤管理制度
2014/01/28 职场文书
降消项目实施方案
2014/03/30 职场文书
网吧七夕活动策划方案
2014/08/31 职场文书
2016春季幼儿园小班开学寄语
2015/12/03 职场文书
千万级用户系统SQL调优实战分享
2022/03/03 MySQL