利用python对Excel中的特定数据提取并写入新表的方法


Posted in Python onJune 14, 2018

最近刚开始学python,正好实习工作中遇到对excel中的数据进行处理的问题,就想到利用python来解决,也恰好练手。

实际的问题是要从excel表中提取日期、邮件地址和时间,然后统计在一定时间段内某个人在某个项目上用了多少时间,最后做成一张数据透视表(这是问题的大致意思)。

首先要做的就是数据提取了,excel中本身有一个text to column的功能,但是对列中规律性不好的数据处理效果很差,不能分割出想要的数据,所以我果断选择用python来完成。

要用的库一个是对excel读写处理的,一个事正则表达式的库。

因为xlwt和xlrd只能对03版以前的excel处理,所以我选择了openpyxl。

以下代码就是自己敲的,写了对日期和邮件地址的提取,最后出来效果不错,仅供大家参考,欢迎交流与改进。

import openpyxl
import re

def Exceldivide(file_dir):
 wb=openpyxl.load_workbook(file_dir)   #打开原有的excel表
 sheet=wb.get_sheet_by_name('Sheet1')
 tuple(sheet['A1':'C3'])

 wb.create_sheet('Sheet2')     #新建一个表
 sheet2=wb.get_sheet_by_name('Sheet2')
 tuple(sheet2['A1':'C3'])

 L1=re.compile(r'\d\d/\d\d/\d\d\d\d')  #日期格式
 L2=re.compile(r'[a-zA-Z0-9_]+@[a-zA-Z0-9-]+.com') #邮件格式
 l1=[]
 l2=[]
 for rows in sheet['A1':'C3']:   #提取日期和邮件数据
  for cell in rows:
   A=L1.search(cell.value)
   a=A.group()
   B=L2.search(cell.value)
   b=B.group()
 for rows in sheet2['A1':'A9']:   #把日期数据写入新表
 for cell in rows:
  cell.value=a
  print(cell.coordinate,cell.value)
 for rows in sheet2['B1':'B9']:  #把邮件数据写入新表  
 for cell in rows:
  cell.value=b
  print(cell.coordinate,cell.value)
 return wb

g=Exceldivide('C:\\Users\\Desktop\\111_copy.xlsx')
g.save('C:\\Users\\Desktop\\111_copy.xlsx') #保存

以上这篇利用python对Excel中的特定数据提取并写入新表的方法就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
用Python脚本来删除指定容量以上的文件的教程
May 04 Python
Python中 Lambda表达式全面解析
Nov 28 Python
python 统计代码行数简单实例
May 04 Python
Python如何生成树形图案
Jan 03 Python
利用Python+Java调用Shell脚本时的死锁陷阱详解
Jan 24 Python
详解Django中六个常用的自定义装饰器
Jul 04 Python
Python判断对象是否相等及eq函数的讲解
Feb 25 Python
将pip源更换到国内镜像的详细步骤
Apr 07 Python
用Python实现将一张图片分成9宫格的示例
Jul 05 Python
pycharm 安装JPype的教程
Aug 08 Python
Python接口自动化判断元素原理解析
Feb 24 Python
详解向scrapy中的spider传递参数的几种方法(2种)
Sep 28 Python
Python基于最小二乘法实现曲线拟合示例
Jun 14 #Python
详解python之协程gevent模块
Jun 14 #Python
python 筛选数据集中列中value长度大于20的数据集方法
Jun 14 #Python
浅谈Tensorflow由于版本问题出现的几种错误及解决方法
Jun 13 #Python
tensorflow: 查看 tensor详细数值方法
Jun 13 #Python
终端命令查看TensorFlow版本号及路径的方法
Jun 13 #Python
解决Tensorflow使用pip安装后没有model目录的问题
Jun 13 #Python
You might like
PHP 危险函数解释 分析
2009/04/22 PHP
php的memcached客户端memcached
2011/06/14 PHP
基于curl数据采集之正则处理函数get_matches的使用
2013/04/28 PHP
php实现Mongodb自定义方式生成自增ID的方法
2015/03/23 PHP
PHP+mysql实现从数据库获取下拉树功能示例
2017/01/06 PHP
php中preg_replace正则替换用法分析【一次替换多个值】
2017/01/17 PHP
Kindeditor编辑器添加图片上传水印功能(php代码)
2017/08/03 PHP
Javascript中暂停功能的实现代码
2007/03/04 Javascript
JavaScript 学习小结(适合新手参考)
2009/07/30 Javascript
输入框的字数时时统计—关于 onpropertychange 和 oninput 使用
2011/10/21 Javascript
jquery子元素过滤选择器使用示例
2013/06/24 Javascript
js单词形式的运算符
2014/05/06 Javascript
jQuery实现平滑滚动页面到指定锚点链接的方法
2015/07/15 Javascript
深入理解jQuery 事件处理
2016/06/14 Javascript
AngularJS实践之使用ng-repeat中$index的注意点
2016/12/22 Javascript
AngularJs篇:使用AngularJs打造一个简易权限系统的实现代码
2016/12/26 Javascript
微信小程序实现星级评分和展示
2018/07/05 Javascript
vue 解决form表单提交但不跳转页面的问题
2019/10/30 Javascript
基于Vue3.0开发轻量级手机端弹框组件V3Popup的场景分析
2020/12/30 Vue.js
[46:20]DOTA2-DPC中国联赛 正赛 PSG.LGD vs LBZS BO3 第二场 1月22日
2021/03/11 DOTA
Python脚本实现12306火车票查询系统
2016/09/30 Python
python代码实现ID3决策树算法
2017/12/20 Python
Python网络编程使用select实现socket全双工异步通信功能示例
2018/04/09 Python
Django logging配置及使用详解
2019/07/23 Python
python如何解析复杂sql,实现数据库和表的提取的实例剖析
2020/05/15 Python
python中类与对象之间的关系详解
2020/12/16 Python
俄罗斯在线手表和珠宝商店:AllTime
2019/09/28 全球购物
经典c++面试题二
2015/08/14 面试题
财务方面个人工作的自我评价
2013/12/28 职场文书
《兰亭集序》教学反思
2014/02/11 职场文书
2014年五四青年节活动方案
2014/03/29 职场文书
会计稽核岗位职责
2015/04/13 职场文书
小学英语教学随笔
2015/08/14 职场文书
创业计划书之外语培训班
2019/11/02 职场文书
python glom模块的使用简介
2021/04/13 Python
Redis性能监控的实现
2021/07/09 Redis