pandas和spark dataframe互相转换实例详解


Posted in Python onFebruary 18, 2020

这篇文章主要介绍了pandas和spark dataframe互相转换实例详解,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下

from pyspark.sql import SparkSession
# 初始化spark会话
spark = SparkSession \
  .builder \
  .getOrCreate()
spark_df = spark.createDataFrame(pandas_df)

spark的dataframe转pandas的dataframe

import pandas as pd
pandas_df = spark_df.toPandas()

由于pandas的方式是单机版的,即toPandas()的方式是单机版的,所以参考breeze_lsw改成分布式版本:

import pandas as pd
def _map_to_pandas(rdds):
  return [pd.DataFrame(list(rdds))]
  
def topas(df, n_partitions=None):
  if n_partitions is not None: df = df.repartition(n_partitions)
  df_pand = df.rdd.mapPartitions(_map_to_pandas).collect()
  df_pand = pd.concat(df_pand)
  df_pand.columns = df.columns
  return df_pand
  
pandas_df = topas(spark_df)

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
使用python绘制人人网好友关系图示例
Apr 01 Python
Python实现的一个找零钱的小程序代码分享
Aug 25 Python
浅析Python多线程下的变量问题
Apr 28 Python
用Python中的字典来处理索引统计的方法
May 05 Python
学习python类方法与对象方法
Mar 15 Python
Python编写通讯录通过数据库存储实现模糊查询功能
Jul 18 Python
Python 日期与时间转换的方法
Aug 01 Python
python字典key不能是可以是啥类型
Aug 04 Python
python 装饰器的使用示例
Oct 10 Python
python批量检查两个对应的txt文件的行数是否一致的实例代码
Oct 31 Python
基于Python的接口自动化unittest测试框架和ddt数据驱动详解
Jan 27 Python
Python爬虫入门案例之爬取去哪儿旅游景点攻略以及可视化分析
Oct 16 Python
PyTorch中Tensor的数据统计示例
Feb 17 #Python
pytorch实现Tensor变量之间的转换
Feb 17 #Python
Macbook安装Python最新版本、GUI开发环境、图像处理、视频处理环境详解
Feb 17 #Python
PyCharm无法识别PyQt5的2种解决方法,ModuleNotFoundError: No module named 'pyqt5'
Feb 17 #Python
python识别验证码图片实例详解
Feb 17 #Python
Python pyautogui模块实现鼠标键盘自动化方法详解
Feb 17 #Python
Matplotlib使用字符串代替变量绘制散点图的方法
Feb 17 #Python
You might like
聊天室php&mysql(六)
2006/10/09 PHP
php下统计用户在线时间的一种尝试
2010/08/26 PHP
无JS,完全php面向过程数据分页实现代码
2012/08/27 PHP
浅析PHP原理之变量(Variables inside PHP)
2013/08/09 PHP
php+mysqli实现批量替换数据库表前缀的方法
2014/12/29 PHP
php中使用key,value,current,next和prev函数遍历数组的方法
2015/03/17 PHP
PHP实现无限极分类的两种方式示例【递归和引用方式】
2019/03/25 PHP
取键盘键位ASCII码的网页
2007/07/30 Javascript
JS格式化数字保留两位小数点示例代码
2013/10/15 Javascript
用jquery仿做发微博功能示例
2014/04/18 Javascript
Javascript中prototype属性实现给内置对象添加新的方法
2015/05/14 Javascript
Javascript 实现计算器时间功能详解及实例(二)
2017/01/08 Javascript
jquery replace方法去空格
2017/05/08 jQuery
Node.js安装配置图文教程
2017/05/10 Javascript
vue-cli中的babel配置文件.babelrc实例详解
2018/02/22 Javascript
微信小程序公用参数与公用方法用法示例
2019/01/09 Javascript
JS实现的全选、全不选及反选功能【案例】
2019/02/19 Javascript
Vue渲染过程浅析
2019/03/14 Javascript
vue.js循环radio的实例
2019/11/07 Javascript
详解Python中for循环的使用
2015/04/14 Python
Python统计单词出现的次数
2018/04/04 Python
详解Python odoo中嵌入html简单的分页功能
2019/05/29 Python
Python 异步协程函数原理及实例详解
2019/11/13 Python
tensorflow 变长序列存储实例
2020/01/20 Python
通过Turtle库在Python中绘制一个鼠年福鼠
2020/02/03 Python
pandas分组聚合详解
2020/04/10 Python
韩国休闲女装品牌网站:ANAIS
2016/08/24 全球购物
ziaja齐叶雅官方海外旗舰店:来自波兰的天然护肤品牌
2017/01/02 全球购物
宝拉珍选官方旗舰店:2%水杨酸精华液,收缩毛孔粗大和祛痘
2018/07/01 全球购物
文员个人的求职信范文
2013/09/26 职场文书
弘扬职业精神演讲稿
2014/03/20 职场文书
设计专业毕业生求职信
2014/06/25 职场文书
医院营销工作计划
2015/01/16 职场文书
城管年度个人总结
2015/02/28 职场文书
2015年教研室工作总结范文
2015/05/23 职场文书
macos系统如何实现微信双开? mac登录两个微信以上微信的技巧
2022/07/23 数码科技