pandas和spark dataframe互相转换实例详解


Posted in Python onFebruary 18, 2020

这篇文章主要介绍了pandas和spark dataframe互相转换实例详解,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下

from pyspark.sql import SparkSession
# 初始化spark会话
spark = SparkSession \
  .builder \
  .getOrCreate()
spark_df = spark.createDataFrame(pandas_df)

spark的dataframe转pandas的dataframe

import pandas as pd
pandas_df = spark_df.toPandas()

由于pandas的方式是单机版的,即toPandas()的方式是单机版的,所以参考breeze_lsw改成分布式版本:

import pandas as pd
def _map_to_pandas(rdds):
  return [pd.DataFrame(list(rdds))]
  
def topas(df, n_partitions=None):
  if n_partitions is not None: df = df.repartition(n_partitions)
  df_pand = df.rdd.mapPartitions(_map_to_pandas).collect()
  df_pand = pd.concat(df_pand)
  df_pand.columns = df.columns
  return df_pand
  
pandas_df = topas(spark_df)

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
python实现数通设备tftp备份配置文件示例
Apr 02 Python
Python中使用PyHook监听鼠标和键盘事件实例
Jul 18 Python
Python字符串中查找子串小技巧
Apr 10 Python
浅谈function(函数)中的动态参数
Apr 30 Python
Python实现判断字符串中包含某个字符的判断函数示例
Jan 08 Python
Python实现的维尼吉亚密码算法示例
Apr 12 Python
获取python的list中含有重复值的index方法
Jun 27 Python
Python实现购物评论文本情感分析操作【基于中文文本挖掘库snownlp】
Aug 07 Python
Python rstrip()方法实例详解
Nov 11 Python
Python序列化与反序列化pickle用法实例
Nov 11 Python
更新升级python和pip版本后不生效的问题解决
Apr 17 Python
对python pandas中 inplace 参数的理解
Jun 27 Python
PyTorch中Tensor的数据统计示例
Feb 17 #Python
pytorch实现Tensor变量之间的转换
Feb 17 #Python
Macbook安装Python最新版本、GUI开发环境、图像处理、视频处理环境详解
Feb 17 #Python
PyCharm无法识别PyQt5的2种解决方法,ModuleNotFoundError: No module named 'pyqt5'
Feb 17 #Python
python识别验证码图片实例详解
Feb 17 #Python
Python pyautogui模块实现鼠标键盘自动化方法详解
Feb 17 #Python
Matplotlib使用字符串代替变量绘制散点图的方法
Feb 17 #Python
You might like
理解PHP5中static和const关键字的区别
2007/03/19 PHP
php中的数组操作函数整理
2008/08/18 PHP
php在字符串中查找另一个字符串
2008/11/19 PHP
PHP网页游戏学习之Xnova(ogame)源码解读(一)
2014/06/23 PHP
PHP写日志的实现方法
2014/11/05 PHP
PHP面向对象之里氏替换原则简单示例
2018/04/08 PHP
JavaScript 的继承
2011/10/01 Javascript
禁止选中文字兼容IE、Chrome、FF等
2013/09/04 Javascript
Linux下编译安装php libevent扩展实例
2015/02/14 Javascript
分享几种比较简单实用的JavaScript tabel切换
2015/12/31 Javascript
Vue.js双向绑定操作技巧(初级入门)
2016/12/27 Javascript
Jquery根据浏览器窗口改变调整大小的方法
2017/02/07 Javascript
浅谈关于angularJs中使用$.ajax的注意点
2017/08/12 Javascript
在vue项目中使用codemirror插件实现代码编辑器功能
2019/08/27 Javascript
JS寄快递地址智能解析的实现代码
2020/07/16 Javascript
如何利用JavaScript编写一个格斗小游戏
2021/01/06 Javascript
[01:52]2020年DOTA2 TI10夏季活动预告片
2020/07/15 DOTA
Python Paramiko模块的安装与使用详解
2016/11/18 Python
详解Django解决ajax跨域访问问题
2018/08/24 Python
Python实现E-Mail收集插件实例教程
2019/02/06 Python
Django Rest framework权限的详细用法
2019/07/25 Python
python实现KNN分类算法
2019/10/16 Python
python 提高开发效率的5个小技巧
2020/10/19 Python
python实现简单猜单词游戏
2020/12/24 Python
H&M美国官网:欧洲最大的服饰零售商
2016/09/07 全球购物
奥地利体育网上商店:Gigasport
2019/10/09 全球购物
自考生自我鉴定范文
2013/10/01 职场文书
店长岗位职责
2013/11/21 职场文书
工厂保洁员岗位职责
2013/12/04 职场文书
绿化工程实施方案
2014/03/17 职场文书
《观舞记》教学反思
2014/04/16 职场文书
道路运输企业安全生产责任书
2014/07/28 职场文书
2014领导班子“四风问题”对照检查材料思想汇报(执法局)
2014/09/21 职场文书
软件研发工程师岗位职责
2014/09/30 职场文书
市贸粮局召开党的群众路线教育实践活动总结大会新闻稿
2014/10/21 职场文书
护理心得体会范文
2016/01/22 职场文书