Python中过滤字符串列表的方法


Posted in Python onDecember 22, 2020

Python使用列表数据类型在顺序索引中存储多个数据。它的工作方式类似于其他编程语言的数字数组。filter()方法是Python的一种非常有用的方法。可以使用filter()方法从Python中的任何字符串、列表或字典中过滤一个或多个数值。它根据任何特定条件过滤数据。当条件返回true时,它将存储数据,而返回false时将丢弃数据。本文通过使用不同的示例展示了如何在Python中过滤列表中的字符串数据。您必须使用Python 3+来测试本文的示例。

使用另一个列表过滤字符串列表

本示例说明了如何在不使用任何方法的情况下过滤字符串列表中的数据。 字符串列表在此使用另一个列表进行过滤。 在此,声明了两个列表变量,名称分别为list1和list2。 使用list1的值过滤list2的值。 该脚本会将list2的每个值的第一个单词与list1的值进行匹配,并打印list1中不存在的那些值。

#coding=utf-8
# 声明两个列表变量
list1 = ['Python', 'PHP', 'Java', 'Bash']
list2 = ['JavaScript是客户端脚本语言',
    'PHP是服务器端脚本语言',
     'Java是一种编程语言',
    'Kotlin是一种静态编程语言']

# 根据第一个列表过滤第二个列表
filter_data = [x for x in list2 if
       all(y not in x for y in list1)]

# 在过滤前和过滤后打印列表数据
print("第一个列表的内容:", list1)
print("第二个列表的内容:", list2)
print("过滤后的第二个列表的内容:", filter_data)

运行脚本。 在此,list1不包含单词“Kotlin”。 输出将仅包含list2中的一个值,即 ['Kotlin是一种静态编程语言']。

如何在Python中过滤字符串列表

输出如下:

第一个列表的内容: ['Python', 'PHP', 'Java', 'Bash']
第二个列表的内容: ['JavaScript是客户端脚本语言', 'PHP是服务器端脚本语言', 'Java是一种编程语言', 'Kotlin是一种静态编程语言']
过滤后的第二个列表的内容: ['Kotlin是一种静态编程语言']

使用另一个列表和自定义函数过滤字符串列表

本示例说明如何使用另一个列表和自定义过滤器功能过滤字符串列表。 该脚本包含两个名为list1和list2的列表变量。 自定义过滤器功能将找出两个列表变量的公共值。

# 声明两个列表变量
list1 = ['100', '67', '39', '505', '122', '287', '399']
list2 = ['70', '100', '308', '415', '362', '230']

# 声明一个函数来过滤第一个列表中的数据
def Filter(list1, list2):
  return [n for n in list1 if
      any(m in n for m in list2)]

# 在过滤器之前和之后打印列表数据
print("list1的的内容:", list1)
print("list2的的内容:", list2)
print("过滤后的数据",Filter(list1, list2))

运行脚本。 两个列表变量中都存在100的值。 运行脚本后,将生成以下输出。

list1的的内容: ['100', '67', '39', '505', '122', '287', '399']
list2的的内容: ['70', '100', '308', '415', '362', '230']
过滤后的数据 ['100']

使用正则表达式过滤字符串列表

通过使用前两个示例中的all()和any()方法来过滤列表。 在此示例中,使用正则表达式从列表中过滤数据。 正则表达式是一种模式,通过该模式可以搜索或匹配任何数据。 Python中使用're'模块在脚本中应用正则表达式。 在此,使用主题代码声明列表。 正则表达式用于过滤以“ CSE”开头的主题代码。 正则表达式模式中使用'^'符号在文本的开头进行搜索。

# 导入re模块以使用正则表达式
import re

# 声明列表包含科目编号
sublist = ['IDC-108', 'OKY-309', 'IDC-709', 'PHP-102', 'MIO-801']

# 声明过滤功能
def Filter(datalist):
  # 根据列表中的正则表达式搜索数据
  return [val for val in datalist
    if re.search(r'^IDC', val)]

# 打印过滤器数据
print(Filter(sublist))

运行脚本。 子列表变量包含两个以“IDC”开头的值。 运行脚本后,将显示以下输出。

['IDC-108', 'IDC-709']

使用lamda表达式过滤字符串列表

本示例说明了使用lamda表达式从字符串列表中过滤数据。 在这里,名为search_word的列表变量用于从名为text的文本变量中过滤内容。 通过使用split()方法,基于空间将文本内容转换为名为text_word的列表。 lamda表达式将忽略text_word中存在于search_word中的那些值,并通过添加空格将过滤后的值存储在变量中。

# 声明一个包含linuxidc_word中关键词的列表
linuxidc_word = ["系统", "linuxidc", "Python", "Kotlin"]

# 定义文本,从列表中搜索单词
text = "Linux公社 linuxidc 是专业的 Linux 系统 门户网站,实时发布 最新 Kotlin 资讯!"

# 根据空格分割文本并将单词存储在列表中
text_word = text.split()

# 使用lambda表达式过滤数据
filter_text = ' '.join((filter(lambda val: val not in linuxidc_word, text_word)))

# 在过滤前和过滤后打印文本
print("\n过滤前的文本:\n", text)
print("过滤后的文本:\n", filter_text)

运行脚本。 运行脚本后,将显示以下输出。

过滤前的文本:
Linux公社 linuxidc 是专业的 Linux 系统 门户网站,实时发布 最新 Kotlin 资讯!
过滤后的文本:
Linux公社 是专业的 Linux 门户网站,实时发布 最新 资讯!

使用filter()方法过滤字符串列表

filter()方法接受两个参数。 第一个参数采用函数名称或“ None”,第二个参数采用列表变量的名称作为值。 filter()方法如果返回true,则从列表中存储这些数据,否则将丢弃该数据。 在此,第一个参数值不指定任何值。 所有不为false的值将从列表中检索为已过滤数据。

#声明混合数据列表
listData = ['linuxidc', 90, 9, 'com', 100, False, 22, True, '1']

# 使用None和列表调用filter()方法
filteredData = filter(None, listData)

#过滤数据后打印列表
print('过滤后的列表:')
for val in filteredData:
  print(val)

运行脚本。该列表只包含一个false值,在过滤后的数据中将省略该false值。

总结:

当您需要从列表中搜索和检索特定值时, 过滤非常有用。我希望上面的例子能帮助读者理解从字符串列表中过滤数据的方法。

作者: wyh草样

出处:https://www.cnblogs.com/wyh0923/p/14166552.html

以上就是Python中过滤字符串列表的方法的详细内容,更多关于Python中过滤字符串列表的资料请关注三水点靠木其它相关文章!

Python 相关文章推荐
wxPython窗口中文乱码解决方法
Oct 11 Python
Python中使用装饰器来优化尾递归的示例
Jun 18 Python
Python简单格式化时间的方法【strftime函数】
Sep 18 Python
Python面向对象特殊成员
Apr 24 Python
Django之模型层多表操作的实现
Jan 08 Python
使用Python批量修改文件名的代码实例
Jan 24 Python
python爬取cnvd漏洞库信息的实例
Feb 14 Python
python 并发编程 阻塞IO模型原理解析
Aug 20 Python
python对接ihuyi实现短信验证码发送
May 10 Python
简单的Python人脸识别系统
Jul 14 Python
如何基于python把文字图片写入word文档
Jul 31 Python
如何用Python 加密文件
Sep 10 Python
python中@property的作用和getter setter的解释
Dec 22 #Python
地图可视化神器kepler.gl python接口的使用方法
Dec 22 #Python
Python实现Word文档转换Markdown的示例
Dec 22 #Python
python爬虫利用selenium实现自动翻页爬取某鱼数据的思路详解
Dec 22 #Python
Django中ORM的基本使用教程
Dec 22 #Python
python通用数据库操作工具 pydbclib的使用简介
Dec 21 #Python
Python 多进程原理及实现
Dec 21 #Python
You might like
php 代码优化的42条建议 推荐
2009/09/25 PHP
使用Sphinx对索引进行搜索
2013/06/25 PHP
基于jQuery的可以控制左右滚动及自动滚动效果的代码
2010/07/25 Javascript
jquery 动态创建元素的方式介绍及应用
2013/04/21 Javascript
javascript使用call调用微信API
2014/12/15 Javascript
jQuery 获取多选框的值及多选框中文的函数
2016/05/16 Javascript
JS实现将Asp.Net的DateTime Json类型转换为标准时间的方法
2016/08/02 Javascript
浅谈Three.js截图并下载的大坑
2019/11/01 Javascript
vue更改数组中的值实例代码详解
2020/02/07 Javascript
js实现登录时记住密码的方法分析
2020/04/05 Javascript
python基础教程之实现石头剪刀布游戏示例
2014/02/11 Python
Python实现拷贝多个文件到同一目录的方法
2016/09/19 Python
Python scikit-learn 做线性回归的示例代码
2017/11/01 Python
在Python中实现替换字符串中的子串的示例
2018/10/31 Python
Python小游戏之300行代码实现俄罗斯方块
2019/01/04 Python
Python把对应格式的csv文件转换成字典类型存储脚本的方法
2019/02/12 Python
python flask中动态URL规则详解
2019/11/22 Python
python的faker库用法
2019/11/28 Python
python输出数组中指定元素的所有索引示例
2019/12/06 Python
Tensorflow实现部分参数梯度更新操作
2020/01/23 Python
python获取栅格点和面值的实现
2020/03/10 Python
Python基于Tkinter编写crc校验工具
2020/05/06 Python
PyCharm 2020.2 安装详细教程
2020/09/25 Python
python使用ctypes库调用DLL动态链接库
2020/10/22 Python
曼联官方网上商店:Manchester United Direct
2017/07/28 全球购物
享誉全球的多元化时尚精品购物平台:Farfetch发发奇(支持中文)
2017/08/08 全球购物
皮姆斯勒语言学习:Pimsleur Language Programs
2018/06/30 全球购物
Dogeared官网:在美国手工制作的珠宝
2019/08/24 全球购物
在什么时候需要使用"常引用"
2015/12/31 面试题
运动会稿件100字
2014/02/21 职场文书
建房协议书
2014/04/11 职场文书
法制宣传标语集锦
2014/06/25 职场文书
银行转正自我鉴定
2014/09/29 职场文书
python中如何对多变量连续赋值
2021/06/03 Python
python 管理系统实现mysql交互的示例代码
2021/12/06 Python
HTML常用标签超详细整理
2022/03/19 HTML / CSS