浅谈Python处理PDF的方法


Posted in Python onNovember 10, 2017

处理pdf文档

第一、

从文本中提取文本

浅谈Python处理PDF的方法

第二、

创建PDF

两种方法

浅谈Python处理PDF的方法

#使用PdfFileWriter
import PyPDF2
 
pdfFiles = []
for filename in os.listdir('.'):
if filename.endswith('.pdf'):
pdfFiles.append(filename)
print(pdfFiles)
pdfWriter = PyPDF2.PdfFileWriter()
 
pdfFileObj = open(pdfFiles[0],'rb')
pdfReader = PyPDF2.PdfFileReader(pdfFileObj) # 得到PdfFileReader对象
first,end =map(int,input('从多少页到多少页(用空格隔开):').split())
for pageNum in range(first-1,end):
pageObj = pdfReader.getPage(pageNum)
pdfWriter.addPage(pageObj)
pdfOutput = open ('split_pdf.pdf','wb')
pdfWriter.write(pdfOutput)
pdfOutput.close()

浅谈Python处理PDF的方法

#使用PdfFileMerger()
import PyPDF2
merger = PyPDF2.PdfFileMerger()
a = [str(i)+'webbook.pdf'for i in range(0,124)]
for i in a:
print(i)
merger.append(open(i,'rb'))
print("合并完成第"+str(i))
with open('combintion.pdf','wb') as f:
merger.write(f)

总结

以上就是本文关于浅谈Python处理PDF的全部内容,希望对大家有所帮助。感兴趣的朋友可以继续参阅本站:python先序遍历二叉树问题、python实现人脸识别代码、python执行使用shell命令方法分享等,有什么问题可以随时留言,小编会及时回复大家的。感谢朋友们对本站的支持!

Python 相关文章推荐
Python读写Redis数据库操作示例
Mar 18 Python
python中input()与raw_input()的区别分析
Feb 27 Python
Python爬取网易云音乐热门评论
Mar 31 Python
在Python运行时动态查看进程内部信息的方法
Feb 22 Python
用sqlalchemy构建Django连接池的实例
Aug 29 Python
python自动分箱,计算woe,iv的实例代码
Nov 22 Python
python调用jenkinsAPI构建jenkins,并传递参数的示例
Dec 09 Python
python获取天气接口给指定微信好友发天气预报
Dec 28 Python
pycharm 实现调试窗口恢复
Feb 05 Python
python批量更改目录名/文件名的方法
Apr 18 Python
Anaconda安装pytorch及配置PyCharm 2021环境
Jun 04 Python
Python爬虫基础之简单说一下scrapy的框架结构
Jun 26 Python
django开发教程之利用缓存文件进行页面缓存的方法
Nov 10 #Python
python使用邻接矩阵构造图代码示例
Nov 10 #Python
python先序遍历二叉树问题
Nov 10 #Python
简单了解OpenCV是个什么东西
Nov 10 #Python
python的文件操作方法汇总
Nov 10 #Python
python使用正则表达式的search()函数实现指定位置搜索功能
Nov 10 #Python
Python3调用微信企业号API发送文本消息代码示例
Nov 10 #Python
You might like
php 高效率写法 推荐
2010/02/21 PHP
php设计模式 Strategy(策略模式)
2011/06/26 PHP
Laravel框架源码解析之反射的使用详解
2020/05/14 PHP
csdn 批量接受好友邀请
2009/02/19 Javascript
jquery tools之tooltip
2009/07/25 Javascript
javascript 循环读取JSON数据的代码
2010/07/17 Javascript
jquery 单击li防止重复加载的实现代码
2010/12/24 Javascript
jQuery.validate 常用方法及需要注意的问题
2013/03/20 Javascript
javascript查找字符串中出现最多的字符和次数的小例子
2013/10/29 Javascript
用javascript读取xml文件读取节点数据
2014/08/12 Javascript
JavaScript创建一个object对象并操作对象属性的用法
2015/03/23 Javascript
JS打字效果的动态菜单代码分享
2015/08/21 Javascript
分享javascript实现的冒泡排序代码并优化
2016/06/05 Javascript
JavaScript组合模式学习要点
2016/08/26 Javascript
Bootstrap模态框使用详解
2017/02/15 Javascript
详解用Node.js实现Restful风格webservice
2017/09/29 Javascript
vue里面使用mui的弹出日期选择插件实例
2018/09/16 Javascript
Element中的Cascader(级联列表)动态加载省\市\区数据的方法
2019/03/27 Javascript
回顾Javascript React基础
2019/06/15 Javascript
微信小程序使用车牌号输入法的示例代码
2019/08/20 Javascript
Vue Render函数原理及代码实例解析
2020/07/30 Javascript
[19:26]TNC vs EG (BO3)
2018/06/07 DOTA
python读写LMDB文件的方法
2018/07/02 Python
python如何创建TCP服务端和客户端
2018/08/26 Python
Python图像读写方法对比
2020/11/16 Python
用python计算文件的MD5值
2020/12/23 Python
Python扫描端口的实现
2021/01/25 Python
利用Python批量识别电子账单数据的方法
2021/02/08 Python
CSS3实现伪类hover离开时平滑过渡效果示例
2017/08/10 HTML / CSS
Skyscanner台湾:全球知名的旅行比价引擎
2018/07/01 全球购物
Interflora澳大利亚:同日鲜花速递
2019/06/25 全球购物
LN-CC中国:高端男装和女装的奢侈时尚目的地
2019/09/14 全球购物
会议邀请书范文
2014/02/02 职场文书
三月学雷锋月活动总结
2014/04/28 职场文书
法人单位授权委托书范文
2014/10/06 职场文书
初一数学教学反思
2016/02/17 职场文书