用Python脚本来删除指定容量以上的文件的教程


Posted in Python onMay 04, 2015

文件多了乱放, 突然有一天发现硬盘空间不够了, 于是写了个python脚本搜索所有大于10MB的文件,看看这些大文件有没有重复的副本,如果有,全部列出,以便手工删除

使用方式 加一个指定目录的参数

比如python redundant_remover.py /tmp

主要用到了stat模块,os、sys系统模块

import os, sys
#引入统计模块
from stat import *
BIG_FILE_THRESHOLD = 10000000L
dict1 = {}  # filesize 做 key, filename 做 value
dict2 = {}   # filename 做 key, filesize 做 value
def treewalk(path):
  try:
    for i in os.listdir(path):
      mode = os.stat(path+"/"+i).st_mode
      if S_ISDIR(mode) <> True:
        filename = path+"/"+i
        filesize = os.stat(filename).st_size
        if filesize > BIG_FILE_THRESHOLD:
          if filesize in dict1:           
            dict2[filename] = filesize
            dict2[dict1[filesize]]=filesize
          else:
            dict1[filesize] = filename         
      else:
        treewalk(path+"/"+i)
  except WindowsError:
    pass
def printdict(finaldict):
  for i_size in finaldict.values():
    print i_size
    for j_name in finaldict.keys():
      if finaldict[j_name] == i_size:
        print j_name
    print "\n"
if __name__=="__main__":
  treewalk(sys.argv[1])
  printdict(dict2)
Python 相关文章推荐
python获取本机外网ip的方法
Apr 15 Python
python获取当前计算机cpu数量的方法
Apr 18 Python
在Python中使用swapCase()方法转换大小写的教程
May 20 Python
Python3中使用urllib的方法详解(header,代理,超时,认证,异常处理)
Sep 21 Python
Pycharm学习教程(7)虚拟机VM的配置教程
May 04 Python
Python基于whois模块简单识别网站域名及所有者的方法
Apr 23 Python
用pandas中的DataFrame时选取行或列的方法
Jul 11 Python
Python3.4学习笔记之 idle 清屏扩展插件用法分析
Mar 01 Python
Flask-WTF表单的使用方法
Jul 12 Python
解决启动django,浏览器显示“服务器拒绝访问”的问题
May 13 Python
Django-imagekit的使用详解
Jul 06 Python
pandas提升计算效率的一些方法汇总
May 30 Python
编写Python脚本来获取Google搜索结果的示例
May 04 #Python
编写Python脚本来实现最简单的FTP下载的教程
May 04 #Python
Python下线程之间的共享和释放示例
May 04 #Python
简单介绍Python中利用生成器实现的并发编程
May 04 #Python
简单分析Python中用fork()函数生成的子进程
May 04 #Python
python实现从字典中删除元素的方法
May 04 #Python
Python中利用原始套接字进行网络编程的示例
May 04 #Python
You might like
PHP 遍历XP文件夹下所有文件
2008/11/27 PHP
php下连接mssql2005的代码
2011/01/17 PHP
php实现分页工具类分享
2014/01/09 PHP
PHP内核探索之解释器的执行过程
2015/12/22 PHP
PHP程序员简单的开展服务治理架构操作详解(三)
2020/05/14 PHP
JavaScript判断访问的来源是手机还是电脑,用的哪种浏览器
2013/12/12 Javascript
javascript制作坦克大战全纪录(2)
2014/11/27 Javascript
JavaScript中的值是按值传递还是按引用传递问题探讨
2015/01/30 Javascript
JavaSciprt中处理字符串之sup()方法的使用教程
2015/06/08 Javascript
jQuery实现下滑菜单导航效果代码
2015/08/25 Javascript
解决同一页面中两个iframe互相调用jquery,js函数的方法
2016/12/12 Javascript
简单的jQuery拖拽排序效果的实现(增强动态)
2017/02/09 Javascript
NodeJS父进程与子进程资源共享原理与实现方法
2018/03/16 NodeJs
js时间戳转yyyy-MM-dd HH-mm-ss工具类详解
2019/04/30 Javascript
Vue开发环境中修改端口号的实现方法
2019/08/15 Javascript
vue 实现走马灯效果
2019/10/28 Javascript
angular inputNumber指令输入框只能输入数字的实现
2019/12/03 Javascript
vue+openlayers绘制省市边界线
2020/12/24 Vue.js
python实现划词翻译
2020/04/23 Python
python中os模块详解
2016/10/14 Python
python 捕获 shell/bash 脚本的输出结果实例
2017/01/04 Python
利用Python+Java调用Shell脚本时的死锁陷阱详解
2018/01/24 Python
Python函数的参数常见分类与用法实例详解
2019/03/30 Python
Python 单例设计模式用法实例分析
2019/09/23 Python
python将时分秒转换成秒的实例
2019/12/07 Python
tensorflow保持每次训练结果一致的简单实现
2020/02/17 Python
Mavi牛仔裤美国官网:土耳其著名牛仔品牌
2016/09/24 全球购物
viagogo英国票务平台:演唱会、体育比赛、戏剧门票
2017/03/24 全球购物
前台文员的岗位职责
2013/11/14 职场文书
党校学习自我鉴定
2014/02/24 职场文书
护士岗前培训自我评鉴
2014/02/28 职场文书
市场营销专业毕业生求职信
2014/03/26 职场文书
总经理任命书范本
2014/06/05 职场文书
捐助感谢信
2015/01/22 职场文书
导游词之上海豫园
2019/10/24 职场文书
解析redis hash应用场景和常用命令
2021/08/04 Redis