python 判断字符串当中是否包含字符(str.contain)


Posted in Python onJune 01, 2022

有一个ssqdatav2数据,要找到其中的深圳,并且替换成圳。

因为收集到的数据出现了错误,本来只有省份简写的地方却出现了深圳。

python 判断字符串当中是否包含字符(str.contain)

如何找到DF中包含深圳的数据?

cond=ssqdatav2['first'].str.contains('深圳')
ssqdatav2.loc[cond]

python 判断字符串当中是否包含字符(str.contain)

此时就找到first当中包含深圳的数据。

1、在first当中找到汉字

# 为分解firstprize定义函数
def fpp(x):
    if len(x)<=2:  # 判断是否只有汉字,还是也有数字
        return "待定" # 没有汉字的用待定表示
    else: # 使用正则表达式获取中文
        pattern="[\u4e00-\u9fa5]"  # 汉字专用字符ASCII区间
        pat=re.compile(pattern)
        return ','.join(pat.findall(x)) # 使用逗号作为每个省份的分隔符
#使用fp() 
ssqdatav2['fpprovince']=ssqdatav2['first'].apply(lambda x:fpp(x))
ssqdatav2.head()

python 判断字符串当中是否包含字符(str.contain)

将每个省份单独形成1列:

fpnames=['p01','p02','p03','p04','p05'] 
ssqdatav3[fpnames]=ssqdatav3['fpprovince'].str.split(',',expand=True)
ssqdatav3

python 判断字符串当中是否包含字符(str.contain)

去除掉None值,是None的地方变成空值:

# 逐个分割
ssqdatav3['p001']=ssqdatav3['fpprovince'].apply(lambda x:x if x.count(',')==0 else x.split(',')[0])
ssqdatav3['p002']=ssqdatav3['fpprovince'].apply(lambda x:x.split(',')[1] if x.count(',')>=1 else '')
ssqdatav3['p003']=ssqdatav3['fpprovince'].apply(lambda x:x.split(',')[2] if x.count(',')>=2 else '')
ssqdatav3['p004']=ssqdatav3['fpprovince'].apply(lambda x:x.split(',')[3] if x.count(',')>=3 else '')
ssqdatav3['p005']=ssqdatav3['fpprovince'].apply(lambda x:x.split(',')[4] if x.count(',')>=4 else '')

ssqdatav3.to_excel('ssqdatav3p05.xlsx',index=False)
ssqdatav3.head()

python 判断字符串当中是否包含字符(str.contain)

# 让双色球的期号ID成为订单号,7个号码都有对应的订单号,即每个期号都有7个订单号且分成不同的行
import numpy as np 
ssqdatav3['province2']=ssqdatav3['fpprovince'].apply(lambda x:x.split(','))
ssqdatav3

province2=ssqdatav3['province2'].to_list()
province2
rs=[len(r) for r in province2]
rs 
a=np.repeat(ssqdatav3['id'],rs)
a 
ssqdataprov=pd.DataFrame(np.column_stack((a,np.concatenate(province2))),columns=['ID','PROVINCE'])


# ssqdataprov=ssqdataprov[(ssqdataprov['PROVINCE']!='深')] # 等价
# ssqdataprov=ssqdataprov[~(ssqdataprov['PROVINCE']=='深')] # 等价
ssqdataprov=ssqdataprov[~(ssqdataprov['PROVINCE'].str.contains('深'))]

ssqdataprov

python 判断字符串当中是否包含字符(str.contain)

按照每个字段来划分,并且删去含有深的字段,这样就只保留圳字了

到此这篇关于python 判断字符串当中是否包含字符(str.contain)的文章就介绍到这了,更多相关python 判断字符串当中是否包含字符内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木!


Tags in this post...

Python 相关文章推荐
玩转python爬虫之爬取糗事百科段子
Feb 17 Python
Python中asyncore异步模块的用法及实现httpclient的实例
Jun 28 Python
Python random模块用法解析及简单示例
Dec 18 Python
TensorFlow实现随机训练和批量训练的方法
Apr 28 Python
Python 中导入csv数据的三种方法
Nov 01 Python
Python爬虫:url中带字典列表参数的编码转换方法
Aug 21 Python
python对常见数据类型的遍历解析
Aug 27 Python
一行Python代码制作动态二维码的实现
Sep 09 Python
tensorflow 模型权重导出实例
Jan 24 Python
PyTorch在Windows环境搭建的方法步骤
May 12 Python
python中uuid模块实例浅析
Dec 29 Python
解决Python import .pyd 可能遇到路径的问题
Mar 04 Python
Python测试框架pytest高阶用法全面详解
Python使用Web框架Flask开发项目
Jun 01 #Python
numpy array找出符合条件的数并赋值的示例代码
Jun 01 #Python
 python中的元类metaclass详情
May 30 #Python
Python自动化实战之接口请求的实现
Python中的 enumerate和zip详情
May 30 #Python
python如何为list实现find方法
May 30 #Python
You might like
一个基于PDO的数据库操作类
2011/03/24 PHP
php版本的cron定时任务执行器使用实例
2014/08/19 PHP
ThinkPHP路由详解
2015/07/27 PHP
php如何获取文件的扩展名
2015/10/28 PHP
在Yii2中使用Pjax导致Yii2内联脚本载入失败的原因分析
2016/03/06 PHP
如何重写Laravel异常处理类详解
2020/12/20 PHP
对联广告js flash激活
2006/10/19 Javascript
jquery 可排列的表实现代码
2009/11/13 Javascript
js trim函数 去空格函数与正则集锦
2009/11/20 Javascript
javascript document.compatMode兼容性
2010/02/23 Javascript
使用JS进行目录上传(相当于批量上传)
2010/12/05 Javascript
jQuery easyui datagrid动态查询数据实例讲解
2013/02/26 Javascript
JavaScript实现QueryString获取GET参数的方法
2013/07/02 Javascript
JQuery为页面Dom元素绑定事件及解除绑定方法
2014/04/23 Javascript
Window.Open如何在同一个标签页打开
2014/06/20 Javascript
jquery彩色投票进度条简单实例演示
2020/07/23 Javascript
js实现延时加载Flash的方法
2015/11/26 Javascript
Angularjs 实现一个幻灯片示例代码
2016/09/08 Javascript
详解javascript获取url信息的常见方法
2016/12/19 Javascript
详解angular2封装material2对话框组件
2017/03/03 Javascript
jQuery获取单选按钮radio选中值与去除所有radio选中状态的方法
2017/05/20 jQuery
jQuery实现菜单栏导航效果
2017/08/15 jQuery
基于vue-simple-uploader封装文件分片上传、秒传及断点续传的全局上传插件功能
2021/02/23 Vue.js
[52:20]VP vs VG Supermajor小组赛 B组胜者组决赛 BO3 第一场 6.2
2018/06/03 DOTA
[02:51]2018年度DOTA2最佳中单位选手-完美盛典
2018/12/17 DOTA
利用 python 对目录下的文件进行过滤删除
2017/12/27 Python
解决win7操作系统Python3.7.1安装后启动提示缺少.dll文件问题
2019/07/15 Python
Python实现AI自动抠图实例解析
2020/03/05 Python
Python字符串格式化f-string多种功能实现
2020/05/07 Python
Python制作数据预测集成工具(值得收藏)
2020/08/21 Python
在vscode中启动conda虚拟环境的思路详解
2020/12/25 Python
美丽乡村建设实施方案
2014/03/23 职场文书
四风对照检查剖析材料
2014/10/07 职场文书
太行山上观后感
2015/06/05 职场文书
银行柜员优质服务心得体会
2016/01/22 职场文书
详解SpringBoot异常处理流程及原理
2021/06/21 Java/Android