python 判断txt每行内容中是否包含子串并重新写入保存的实例


Posted in Python onMarch 12, 2020

假设需要批量处理多个txt文件,然后将包含子串的内容写入一个txt文件中,这里假设我的子串为"_9"和“_10”

python 判断txt每行内容中是否包含子串并重新写入保存的实例

下面就是我想要得到的其中两行内容(实际上还有很多行哈哈):

python 判断txt每行内容中是否包含子串并重新写入保存的实例

直接上代码:

#! /usr/bin/python
# -*- coding:UTF-8 -*-
 
import os
import os.path
import string

txt文件所在的路径和需要保存的目标路径(根据自己的实际目录进行更改即可):

Crop-Ocr_txt文件夹内放置了我需要批量处理的所有txt,我在同级目录下新建一个文件夹名为1000_simple_Ocrtxts,这里目标路径随意就好,能方便找到就行

txt_path = 'D:/youxinProjections/trafic-youxin/MobileNet_v1/obtain_qq_json_new/Crop_Ocr_txt/'
des_txt_path = 'D:/youxinProjections/trafic-youxin/MobileNet_v1/obtain_qq_json_new/1000_simple_OCRtxts/'
 
txt_files = os.listdir(txt_path) #txt_files能得到该目录下的所有txt文件的文件名

定义一个函数专门用来取包含子串的内容并写入到新的txt文件中,在后边的主函数中直接调用这个函数就行就行:

def select_simples():
  for txtfile in txt_files:
    if not os.path.isdir(txtfile):
      in_file = open(txt_path + txtfile, 'r')
      out_file = open(des_txt_path + txtfile, 'a') # 此处自动新建一个文件夹和txtfile的文件名相同,'a'为自动换行写入
      lines = in_file.readlines()
      for line in lines:
        str_name = line.split(" ")[0] # 这里获取的是txt文件中每行内容以空格隔开的第一个元素,也就是我自己txt文件中的*.jpg那一块内容
str1 = '_9' # 这就是我要判断的子串
        str2 = '_10' # 这也是子串
 
        #if (string.find(str_name, str1)!=-1) or (string.find(str_name, str2)):
        if (str1 in str_name) or (str2 in str_name): # in 可以判断在str_name中是否包含有两个子串,
          out_file.write(line) # 若包含子串,则将该行内容全部重新写入新的txt文件
          print(str_name)
      out_file.close()

主函数到了!:

if __name__ == '__main__':
select_simples()

晒一下最后的结果:

python 判断txt每行内容中是否包含子串并重新写入保存的实例

完美有没有!!!

补充知识:python判断文件中有否重复行,逐行读文件检测另一文件中是否存在所读内容

我就废话不多说了,还是直接看代码吧!

#!/bin/env python
# coding:utf-8
#程序功能是为了完成判断文件中是否有重复句子
#并将重复句子打印出来

res_list = []
f = open('./downloadmd5.txt','r')
res_dup = []
index = 0
file_dul = open('./r_d.txt', 'w')
file_last = open('./r_nd.txt','w')
for line in f.readlines():
  index = index + 1
  if line in res_list:
    temp_str = ""
    #temp_str = temp_str + str(index) + ','  #要变为str才行
    temp_line = ''.join(line)
    temp_str = temp_str+temp_line
    #最终要变为str类型
    file_dul.write(temp_str);         #将重复的存入到文件中
  else:
    res_list.append(line)
    file_last.write(line)
#!/bin/env python
# coding:utf-8
import re

res_list = []
f = open('./md5.txt','r')
f2 = open('./virus.conf','r')

index = 0
#没重复的文件名
file_dul = open('./m_nd.txt', 'w')
#重复的文件名
file_ex = open('./m_d.txt', 'w')

virstr = f2.read();
for line in f.readlines():
  line=line.strip('\n')
  if(re.search(line, virstr)):
    line = line + '\n'
    file_ex.write(line);
    #调用删除rm -rf filename
  else:
    line = line+'\n'
    file_dul.write(line);

以上这篇python 判断txt每行内容中是否包含子串并重新写入保存的实例就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
Pyramid添加Middleware的方法实例
Nov 27 Python
Python使用QQ邮箱发送Email的方法实例
Feb 09 Python
Python 中的lambda函数介绍
Oct 10 Python
对python3 中方法各种参数和返回值详解
Dec 15 Python
python实现的MySQL增删改查操作实例小结
Dec 19 Python
FFrpc python客户端lib使用解析
Aug 24 Python
pygame实现五子棋游戏
Oct 29 Python
基于Django实现日志记录报错信息
Dec 17 Python
Pytorch中Tensor与各种图像格式的相互转化详解
Dec 26 Python
tensorflow之获取tensor的shape作为max_pool的ksize实例
Jan 04 Python
python使用布隆过滤器的实现示例
Aug 20 Python
python 发送邮件的四种方法汇总
Dec 02 Python
python 两个一样的字符串用==结果为false问题的解决
Mar 12 #Python
python不相等的两个字符串的 if 条件判断为True详解
Mar 12 #Python
Python 实现使用空值进行赋值 None
Mar 12 #Python
PyCharm永久激活方式(推荐)
Sep 22 #Python
Pycharm激活码激活两种快速方式(附最新激活码和插件)
Mar 12 #Python
pycharm激活码快速激活及使用步骤
Mar 12 #Python
Python自动化测试笔试面试题精选
Mar 12 #Python
You might like
德生PL550的电路分析
2021/03/02 无线电
PHP面向对象法则
2012/02/23 PHP
在wamp集成环境下升级php版本(实现方法)
2013/07/01 PHP
php中解析带中文字符的url函数分享
2015/01/20 PHP
PHP针对字符串开头和结尾的判断方法
2016/07/11 PHP
jQuery中文入门指南,翻译加实例,jQuery的起点教程
2007/01/13 Javascript
javascript 获取表单file全路径
2009/12/31 Javascript
Javascript Request获取请求参数如何实现
2012/11/28 Javascript
jquery 实现窗口的最大化不论什么情况
2013/09/03 Javascript
javascript生成json数据简单示例分享
2014/02/14 Javascript
Bootstrap编写导航栏和登陆框
2016/05/30 Javascript
JavaScript定时器制作弹窗小广告
2017/02/05 Javascript
JS实现分页浏览横向图片(类轮播)实例代码
2017/11/06 Javascript
浅谈从React渲染流程分析Diff算法
2018/09/08 Javascript
vscode下vue项目中eslint的使用方法
2019/01/13 Javascript
vue-quill-editor 自定义工具栏和自定义图片上传路径操作
2020/08/03 Javascript
python处理文本文件实现生成指定格式文件的方法
2014/07/31 Python
Python入门之三角函数atan2()函数详解
2017/11/08 Python
Python学习小技巧总结
2018/06/10 Python
python 利用文件锁单例执行脚本的方法
2019/02/19 Python
python中upper是做什么用的
2020/07/20 Python
css3和jquery实现自定义checkbox和radiobox组件
2014/04/22 HTML / CSS
澳大利亚在线家具店:Luxo Living
2019/03/24 全球购物
XD健身器材:Kevlar球、Crossfit健身球
2019/03/26 全球购物
欧舒丹俄罗斯官方网站:L’OCCITANE俄罗斯
2019/11/22 全球购物
迪卡侬(Decathlon)加拿大官网:源自法国的运动专业超市
2020/11/22 全球购物
初中地理教学反思
2014/01/11 职场文书
小学生感恩演讲稿
2014/04/25 职场文书
党的群众路线教育实践活动个人自我剖析材料
2014/10/07 职场文书
迟到检讨书范文
2015/01/27 职场文书
刑事起诉书范文
2015/05/19 职场文书
检察院起诉意见书
2015/05/20 职场文书
乱世佳人观后感
2015/06/08 职场文书
一文帮你理解PReact10.5.13源码
2021/04/03 Javascript
科普 | 业余无线电知识-波段篇
2022/02/18 无线电
python实现会员管理系统
2022/03/18 Python