python处理csv中的空值方法


Posted in Python onJune 22, 2018

如下所示:

# -*- coding: UTF-8 -*-
import jieba.posseg
import tensorflow as tf
import pandas as pd
import csv
import math
"""
1.必??取CSV文件?A(ID:文本)
2.返回(ID:分词后的文本)
"""
flags = tf.app.flags
flags.DEFINE_string("train_file_address","D:/NLPWORD/cut_word_test/hzytest.csv","添加训练数据文件")
flags.DEFINE_string("result_file_address","D:/NLPWORD/cut_word_test/hzytest_result.csv","生成结果数据文件")
FLAGS = tf.app.flags.FLAGS
def cut_word(train_data):
 """
 把数据按照行进行遍历,然后把结果按照行写在csv中
 :return:分词结果list
 """
 jieba.load_userdict("newdict.txt")
 with open(FLAGS.result_file_address, "w", encoding='utf8') as csvfile:
 writer = csv.writer(csvfile)
 for row in train_data.index:
  datas = train_data.loc[row].values[1]
  if isinstance(datas,str) or not math.isnan(datas):
  words = jieba.posseg.cut(datas)
  line = ''
  for word in words:
   line = line + word.word + " "
  writer.writerow([train_data.loc[row].values[0], line])
def main(_):
 data = pd.read_csv(FLAGS.train_file_address)
 cut_word(data)

if __name__ == "__main__":
 tf.app.run(main)

以上这篇python处理csv中的空值方法就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
跟老齐学Python之编写类之三子类
Oct 11 Python
python 写的一个爬虫程序源码
Feb 28 Python
python基于隐马尔可夫模型实现中文拼音输入
Apr 01 Python
python利用Guetzli批量压缩图片
Mar 23 Python
Python3使用SMTP发送带附件邮件
Jun 16 Python
python实现一个简单的udp通信的示例代码
Feb 01 Python
python3利用Socket实现通信的方法示例
May 06 Python
python自制包并用pip免提交到pypi仅安装到本机【推荐】
Jun 03 Python
python算法题 链表反转详解
Jul 02 Python
python cumsum函数的具体使用
Jul 29 Python
python实现根据给定坐标点生成多边形mask的例子
Feb 18 Python
Django-celery-beat动态添加周期性任务实现过程解析
Nov 26 Python
Python实现base64编码的图片保存到本地功能示例
Jun 22 #Python
关于python2 csv写入空白行的问题
Jun 22 #Python
浅谈Python2、Python3相对路径、绝对路径导入方法
Jun 22 #Python
Python基于pandas实现json格式转换成dataframe的方法
Jun 22 #Python
深入浅析Python的类
Jun 22 #Python
基于python绘制科赫雪花
Jun 22 #Python
python3读取csv和xlsx文件的实例
Jun 22 #Python
You might like
PHP的FTP学习(三)
2006/10/09 PHP
Banner程序
2006/10/09 PHP
C#静态方法与非静态方法实例分析
2014/09/22 PHP
weiphp微信公众平台授权设置
2016/01/04 PHP
php利用array_search与array_column实现二维数组查找
2019/07/08 PHP
php 命名空间(namespace)原理与用法实例小结
2019/11/13 PHP
javascript 特性检测并非浏览器检测
2010/01/15 Javascript
Javascript 类型转换方法
2010/10/24 Javascript
固定背景实现的背景滚动特效示例分享
2013/05/19 Javascript
Jquery遍历节点的方法小集
2014/01/22 Javascript
Jquery异步提交表单代码分享
2015/03/26 Javascript
JavaScript——DOM操作——Window.document对象详解
2016/07/14 Javascript
jQuery表单元素选择器代码实例
2017/02/06 Javascript
jQuery EasyUI Accordion可伸缩面板组件使用详解
2017/02/28 Javascript
JS如何判断浏览器类型和详细区分IE各版本浏览器
2017/03/04 Javascript
Bootstrap模态对话框中显示动态内容的方法
2018/08/10 Javascript
如何用webpack4.0撸单页/多页脚手架 (jquery, react, vue, typescript)
2019/06/18 jQuery
jQuery实现消息弹出框效果
2019/12/10 jQuery
详解Vue串联过滤器的使用场景
2020/04/30 Javascript
Nuxt配置Element-UI按需引入的操作方法
2020/07/06 Javascript
[03:02]2014DOTA2西雅图邀请赛 让队员自己告诉你DK NAVI备战情况
2014/07/08 DOTA
如何处理Python3.4 使用pymssql 乱码问题
2016/01/08 Python
Django框架封装外部函数示例
2019/05/28 Python
使用python获取(宜宾市地震信息)地震信息
2019/06/20 Python
python tkinter组件使用详解
2019/09/16 Python
pytorch实现对输入超过三通道的数据进行训练
2020/01/15 Python
python pymysql库的常用操作
2020/10/16 Python
HTML5验证以及日期显示的实现详解
2013/07/05 HTML / CSS
英国皇室御用百货:福南梅森(Fortnum & Mason)
2017/12/03 全球购物
为您搜罗全球潮流時尚品牌:HBX
2019/12/04 全球购物
面向游戏玩家和书呆子的极客订阅盒:Loot Crate
2020/11/25 全球购物
毕业设计计划书
2014/01/09 职场文书
政治学求职信
2014/06/03 职场文书
村当支部个人对照检查材料思想汇报
2014/10/06 职场文书
2016重阳节红领巾广播稿
2015/12/18 职场文书
Python matplotlib绘制雷达图
2022/04/13 Python