通过python-pptx模块操作ppt文件的方法


Posted in Python onDecember 26, 2020

ppt通过其精美的可视化技巧以及良好的演示效果,成为了职场人士的必备技能。ppt的设计是一门大学问,无论是设计技巧,还是操作方法,都衍生出了专门的课程。

本文主要介绍python操作ppt的技巧,编程的优势在于处理速度,对于高大上的ppt设计,还是需要"以人为本", 所以该模块的使用场景主要是ppt基本元素的提取和添加,适合大量内容的转化,比如word转ppt, 减少大量繁琐的人工操作,尽管提供了一些基本的样式设计,但是并不能满足日常办公对ppt美观性的要求。

在该模块中,将ppt拆分为了以下多个元素

1. presentations, 表示整个ppt文档

2. sliders. 表示ppt文档的每一页

3. shapes

4. placeholders

上述分类对应的常用操作如下

1. presentations

用于打开,创建,保存ppt文档,用法如下

>>> from pptx import Presentation
# 创建新的ppt文档
>>> prs = Presentation()
# 打开一个ppt文档
>>> prs = Presentation('input.pptx')
# 保存ppt文档
>>> prs.save('test.pptx')

2. slides

在创建一页ppt时,需要指定对应的布局,在该模块中, 内置了以下9种布局

1. Title

2. Title and Content

3. Section Header

4. Two Content

5. Comparison

6. Title Only

7. Blank

8. Content with Caption

9. Picture with Caption

通过数字下标0到9来访问,指定布局添加一页ppt的用法如下

>>> title_slide_layout = prs.slide_layouts[0]
>>> slide = prs.slides.add_slide(title_slide_layout)

3. shapes

shapes表示容器,在制作ppt时,各种基本元素,比如文本框,表格,图片等都占据了ppt的一个部分,或者矩形区域,或者其他各种自定义的形状。shapes表示所有基本元素的和, 通过如下方式来访问对应的shapes

shapes = slide.shapes

对于shapes而言,我们可以获取和设置其各种属性,比如最常用的text属性,用法如下

>>> shapes.text = 'hello world'

还可以通过add系列方法来添加各种元素,添加文本框的方法如下

>>> from pptx.util import Inches, Pt
>>> left = top = width = height = Inches(1)
>>> txBox = slide.shapes.add_textbox(left, top, width, height)
>>> tf = txBox.text_frame
>>> tf.text = "first paragraph"
>>> p = tf.add_paragraph()
>>> p.text = "second paragraph"

添加表格的方法如下

>>> rows = cols = 2
>>> left = top = Inches(2.0)
>>> width = Inches(6.0)
>>> height = Inches(0.8)
>>> table = shapes.add_table(rows, cols, left, top, width, height).table
>>> table.columns[0].width = Inches(2.0)
>>> table.columns[1].width = Inches(4.0)
>>> # write column headings
>>> table.cell(0, 0).text = 'Foo'
>>> table.cell(0, 1).text = 'Bar'

4. placeholders

shapes表示所有基本元素的总和,而placeholders则表示每一个具体的元素,所以placeholders是shapes的子集, 通过数字下标来访问对应的placeholder,用法如下

>>> slide.placeholders[1]
<pptx.shapes.placeholder.SlidePlaceholder object at 0x03F73A90>
>>> slide.placeholders[1].placeholder_format.idx
1
>>> slide.placeholders[1].name
'Subtitle 2'

placeholders是页面上已有的元素,获取对应的placeholders之后,可以通过insert系列方法来向其中新添元素。

了解上述层级结构,有助于我们对ppt的读写操作。除了写操作之外,也可以通过读操作来批量提取ppt中的特定元素,以文字为例,提取方式如下

from pptx import Presentation
 
prs = Presentation(path_to_presentation)
 
text_runs = []
 
for slide in prs.slides:
 for shape in slide.shapes:
  if not shape.has_text_frame:
   continue
  for paragraph in shape.text_frame.paragraphs:
   for run in paragraph.runs:
    text_runs.append(run.text)

通过该模块,可以快速搭建ppt的基本框架,也可以批量提取ppt中的特定元素,比如提取文字转换成word, 或者提取表格转换成excel文件。总而言之,该模块适合替代大量繁琐的人工复制粘贴操作。

到此这篇关于通过python-pptx模块操作ppt文件的方法的文章就介绍到这了,更多相关python-pptx模块操作ppt文件内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木!

Python 相关文章推荐
python:socket传输大文件示例
Jan 18 Python
Python栈算法的实现与简单应用示例
Nov 01 Python
在python中利用GDAL对tif文件进行读写的方法
Nov 29 Python
Python、 Pycharm、Django安装详细教程(图文)
Apr 12 Python
Python面向对象程序设计类变量与成员变量、类方法与成员方法用法分析
Apr 12 Python
如何在VSCode上轻松舒适的配置Python的方法步骤
Oct 28 Python
django迁移文件migrations的实现
Mar 31 Python
python反爬虫方法的优缺点分析
Nov 25 Python
pycharm配置安装autopep8自动规范代码的实现
Mar 02 Python
python文件名批量重命名脚本实例代码
Apr 22 Python
Django实现WebSocket在线聊天室功能(channels库)
Sep 25 Python
Python OpenCV超详细讲解基本功能
Apr 02 Python
Python如何实现感知器的逻辑电路
Dec 25 #Python
使用Python实现音频双通道分离
Dec 25 #Python
Python用户自定义异常的实现
Dec 25 #Python
Django前后端分离csrf token获取方式
Dec 25 #Python
在vscode中启动conda虚拟环境的思路详解
Dec 25 #Python
python语言time库和datetime库基本使用详解
Dec 25 #Python
Alpine安装Python3依赖出现的问题及解决方法
Dec 25 #Python
You might like
一个简单的域名注册情况查询程序
2006/10/09 PHP
php中调用其他系统http接口的方法说明
2014/02/28 PHP
PHP判断密码强度的方法详解
2017/05/26 PHP
ThinkPHP实现转换数据库查询结果数据到对应类型的方法
2017/11/16 PHP
javascript中的对象和数组的应用技巧
2007/01/07 Javascript
JavaScript 异步调用框架 (Part 3 - 代码实现)
2009/08/04 Javascript
jquery的Theme和Theme Switcher使用小结
2010/09/08 Javascript
JS比较两个时间大小的简单示例代码
2013/12/20 Javascript
wangEditor编辑器失去焦点后仍然可以在原位置插入图片分析
2015/05/06 Javascript
javascript实现网页字符定位的方法
2015/07/14 Javascript
第四章之BootStrap表单与图片
2016/04/25 Javascript
实例讲解Jquery中隐藏hide、显示show、切换toggle的用法
2016/05/13 Javascript
Angular2学习教程之组件中的DOM操作详解
2017/05/28 Javascript
javascript回调函数详解
2018/02/06 Javascript
详解基于DllPlugin和DllReferencePlugin的webpack构建优化
2018/06/28 Javascript
vue通过过滤器实现数据格式化
2020/07/20 Javascript
[03:42]2016国际邀请赛中国区预选赛首日现场玩家采访
2016/06/26 DOTA
python获取一组汉字拼音首字母的方法
2015/07/01 Python
python 递归深度优先搜索与广度优先搜索算法模拟实现
2018/10/22 Python
Python快速转换numpy数组中Nan和Inf的方法实例说明
2019/02/21 Python
Python的赋值、深拷贝与浅拷贝的区别详解
2020/02/12 Python
Python restful框架接口开发实现
2020/04/13 Python
用python按照图像灰度值统计并筛选图片的操作(PIL,shutil,os)
2020/06/04 Python
手机端用rem+scss做适配的详解
2017/11/15 HTML / CSS
Vans英国官方网站:美国南加州的原创极限运动潮牌
2017/01/20 全球购物
FLOS美国官网:意大利高级照明工艺的传奇
2018/08/07 全球购物
美国批发供应商:Kole Imports
2019/04/10 全球购物
Linux Interview Questions For software testers
2012/06/02 面试题
承认错误的检讨书
2014/01/30 职场文书
技能比武方案
2014/05/21 职场文书
酒店爱岗敬业演讲稿
2014/09/02 职场文书
见习报告格式要求
2014/11/04 职场文书
帝企鹅日记观后感
2015/06/10 职场文书
入党自传范文2015
2015/06/26 职场文书
预备党员入党思想汇报(范文)
2019/08/14 职场文书
Python读取文件夹下的所有文件实例代码
2021/04/02 Python