1.文章背景

近期,笔者所在公司的某业务系统的存储临近极限,服务器马上就要跑不动了,由于该业务系统A包含多个子系统A1、A2、A3 ... An,这些子系统的中间存储文件由于设计原因,都存储在同一个父级目录之内,唯一不同的是,不同子系统产生的文件和文件夹的名字都以该子系统名开始。如A1子系统产生的文件命名方式均为A1xxxxxx, A2子系统产生的文件名均为A2xxxxx。现在要删除其中一些子系统的历史文件,以释放服务器空间,几十T的数据,存放在一起,手动删除肯定不显示,只能借助程序自动化实现了,使用什么呢?自然想到了python。其实单纯删文件这一个需求我认为不值得长篇阔论,但是其中遇到了一些特殊有趣的问题和一些有意思的解决方案,所以想与诸位分享一下,比如windows系统下的超长文件删除, 如从阅读官方英文文档寻找解决方案等等,下面进入正题。

2.使用 python 删除文件

使用python删除文件有很多方式,最直接也是最方便的方式就是调用内建函数:

  • os.remove()  删除文件
  • os.rmdir() 删除一个空文件夹
  • shutil.rmtree() 删除一个文件夹及该文件夹下所有内容(包括子目录及文件)

也就是,此问题的的解决方案,核心就是围绕上述三个函数打交道。转到我们遇到的问题,业务系统A包含多个子系统A1、A2、A3 ... An,这些子系统的中间存储文件由于设计原因,都存储在同一个父级目录之内,唯一不同的是,不同子系统产生的文件和文件夹的名字都以该子系统名开始。如A1子系统产生的文件命名方式均为A1xxxxxx, A2子系统产生的文件名均为A2xxxxx,现在的目的就是要在该删除指定子系统所产生的文件,保留其他子系统的文件。

将需求拆解下,实际上就是解决下列4个问题:1、怎么删除一个文件?2、怎样识别一个文件或文件夹是某个子系统产生的?3、如何判断一个路径是文件还是目录?4、如何定位所有指定的子系统产生的文件和文件夹?

对于问题1, 在本节开始就阐述过,使用 python 的内建函数进行删除即可:

os.remove("path") # 删除指定文件
os.rmdir("path") # 删除一个空文件夹
shutil.rmtree("path") #  删除一个文件夹及该文件夹下所有内容(包括子目录及文件)

对于问题2,由于特定子系统产生的文件和文件夹的命名方式都是固定的模式,如A1子系统产生的文件名均为A1xxxxx,故可通过关键字匹配的方式进行识别。一种可能的方式为:

if keywords in filepath: # 如果文件名包含关键字keywords
    os.remove(filepath) # 删除文件
else:
    pass

对于问题3,由于删除目录和删除文件的方式不一致,故需要在删除前判断一个路径是目录还是文件,根据其类型选择合适的删除方式,这个在 python 中可以使用 **os.path.isdir()**之类的函数进行判断,主要是下列函数:

os.path.isdir("path") # 返回true则为目录,false则为文件
os.path.isfile("path") # 返回true则为文件,false则为目录

对于问题4,如何定位所有要删除的文件,这个问题实际上就是一个指定目录文件遍历的问题,即如何遍历一个指定目录的所有文件夹及文件。对于这个问题,一般有两种解决方案,一是深度优先遍历方式,一是广度优先遍历方式,两种方式在本例中效率是一致的,因为我们最终都要遍历所有的文件。另外,幸运的是,python实在是过于强大,其内建的函数已经帮助我们实现了一个广度优先目录遍历方法,及 os.walk("path") 方法,该方法就是遍历 path 目录下的所有文件及文件夹,一个典型的用法如下:

import os

path = "C:\\A\\"

for root, dirs, files in os.walk(path):
    print(root)
    print(dirs)
    print(files)

上例中,root 代表当前遍历到的路径,dirs 表示当前路径下所有的子目录, files 表示当前路径下的所有子文件。通过这种方式就能全部遍历指定目录了。

问题都分解开了,下面将问题组合一下就完成代码实现.

最终的代码实现为:

import os
import shutil

path = "C:\\A\\"
keyword = "A1"

for root, dirs, files in os.walk(path):
    for dir in dirs:
        if keyword in dir:
            rmpath = os.path.join(root, dir)
            print("删除文件夹: %s" % rmpath)
            shutil.rmtree(rmpath)
    for file in files:
        if keyword in file:
            rmpath = os.path.join(root, file)
            print("删除文件: %s" % rmpath)
            os.remove(rmpath)

即通过广度优先方式(os.walk())遍历指定目录,逐个判断该目录下所有子目录和文件是否满足关键字条件,满足就删除。

运行效果为:

看似需求到此基本上就很好的解决了,但是实际测试中发现有的很深的目录却没有删除,删除该目录时报了一个错,错误描述如下:

Unexpected error: (< type 'exceptions.WindowsError'>, WindowsError(3, 'The system cannot find the path specified'), < traceback object at 0x0000000002714F88>)

大致意思就是python找不到这个路径,可是为什么呢?为此,我继续进行一番资料查询,后来大致定位了是由于文件路径过长导致的,是由于windows系统用户态的默认路径长度不能超过256个字节导致的。但是官方说256个字节是最长,但为何能创建超过256的呢,所以既然能创建,那就一定能删除,但是需要一些方法,经过一番学习,找到了好几种方法,下面介绍其中一种最为实用的方法,另外几个比如使用压缩软件压缩后删除(百度知道的结果)适合手动但不适合编程解决。这个方法在下一节中继续讲述。

3.文件系统关于长路径文件的相关定义

为解决windows下的长文件删除的问题,最为权威的资料莫过于windows官方的描述,我阅读了微软关于文件名长度的这一块的定义及说明,找到解决方案,微软的原文如下:

关键意思如下:1、Windows API 提供的文件路径理论上最长是 32767 个字节,普通状态下给用户使用是不超过256个字符,说是为了使用户操作更加方便。这里不得不吐槽一下了,确实操作方便了,但是方便的同时也可能带来不便,明明定义了32767这么长的字节,只给用256,未免太抠搜了一点

2、用户如果想要打破这个长度限制,可以通过一个特殊方式告诉windows系统自己想要使用超长文件,这个特殊的方式就是在绝对路径前加上** "\?" **字符串。

3、这篇文档后面还有描述在windows10以后如何通过注册表的方式接触文件名长度限制,这里就没有截图了,因为不通用,win7怎么办呢?有兴趣的同学可以查看其原文链接阅读

好了,看到这,解决方法呼之欲出,其实简单得不能太简单,直接在绝对路径前加上一个"\?"即可:

# 获取目标路径的绝对路径,并在路径前加上\\?\,
# 以解除windows的文件长度限制
path = '\\\\?\\'   os.path.abspath(path)

4.改造 python 程序,删除长路径文件

根据上一节,对python程序进一步进行改造,加入windows长文件名限制解除,最后的完美删除工具就成型了:

import os
import shutil

path = "C:\\A\\"
keyword = "A1"

# 获取目标路径的绝对路径,并在路径前加上\\?\,
# 以解除windows的文件长度限制
path = '\\\\?\\'   os.path.abspath(path)

for root, dirs, files in os.walk(path):
    for dir in dirs:
        if keyword in dir:
            rmpath = os.path.join(root, dir)
            print("删除文件夹: %s" % rmpath)
            shutil.rmtree(rmpath)
    for file in files:
        if keyword in file:
            rmpath = os.path.join(root, file)
            print("删除文件: %s" % rmpath)
            os.remove(rmpath)

虽然代码很短,只添加了一行,但是这一行,却完成了一个超级核心的任务,真可谓是灵魂一行啊,最后该工具中如在生产环境中发挥了其出色的作用,使服务器继续运转如飞了。

5.总结思考

啰嗦的话就不多说了,说几点思考 

1、遇到问题将问题进行分解,拆分成一个个小问题逐步击破 

2、要善于阅读官方技术文档,有时候解决一个问题的核心可能很简单,代码可能也就一行两行,但是就是藏在某个角落,不仔细去阅读还真不一定找得出来 

3、python是个好东西,要有将问题转化成使用python去解决的习惯,习惯成自然,python可能在工作中就发挥大作用了呢。

到此这篇关于Python实现删除windows下的长路径文件的文章就介绍到这了,更多相关Python删除长路径文件内容请搜索Devmax以前的文章或继续浏览下面的相关文章希望大家以后多多支持Devmax!

Python实现删除windows下的长路径文件的更多相关文章

  1. XCode 3.2 Ruby和Python模板

    在xcode3.2下,我的ObjectiveCPython/Ruby项目仍然可以打开更新和编译,但是你无法创建新项目.鉴于xcode3.2中缺少ruby和python的所有痕迹(即创建项目并添加新的ruby/python文件),是否有一种简单的方法可以再次安装模板?我发现了一些关于将它们复制到某个文件夹的信息,但我似乎无法让它工作,我怀疑文件夹的位置已经改变为3.2.解决方法3.2中的应用程序模板

  2. Swift基本使用-函数和闭包(三)

    声明函数和其他脚本语言有相似的地方,比较明显的地方是声明函数的关键字swift也出现了Python中的组元,可以通过一个组元返回多个值。传递可变参数,函数以数组的形式获取参数swift中函数可以嵌套,被嵌套的函数可以访问外部函数的变量。可以通过函数的潜逃来重构过长或者太复杂的函数。

  3. 10 个Python中Pip的使用技巧分享

    众所周知,pip 可以安装、更新、卸载 Python 的第三方库,非常方便。本文小编为大家总结了Python中Pip的使用技巧,需要的可以参考一下

  4. Swift、Go、Julia与R能否挑战 Python 的王者地位

    本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容,请发送邮件至dio@foxmail.com举报,一经查实,本站将立刻删除。

  5. 红薯因 Swift 重写开源中国失败,貌似欲改用 Python

    本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容,请发送邮件至dio@foxmail.com举报,一经查实,本站将立刻删除。

  6. 你没看错:Swift可以直接调用Python函数库

    上周Perfect又推出了新一轮服务器端Swift增强函数库:Perfect-Python。对,你没看错,在服务器端Swift其实可以轻松从其他语种的函数库中直接拿来调用,不需要修改任何内容。以如下python脚本为例:Perfect-Python可以用下列方法封装并调用以上函数,您所需要注意的仅仅是其函数名称以及参数。

  7. Swift中的列表解析

    在Swift中完成这个的最简单的方法是什么?我在寻找类似的东西:从Swift2.x开始,有一些与你的Python样式列表解析相当的东西。(在这个意义上,它更像是Python的xrange。如果你想保持集合懒惰一路通过,只是这样说:与Python中的列表解析语法不同,Swift中的这些操作遵循与其他操作相同的语法。

  8. swift抛出终端的python错误

    每当我尝试启动与python相关的swift时,我都会收到错误.我该如何解决?

  9. 在Android上用Java嵌入Python

    解决方法看看this,它适用于J2SE,你可以尝试在Android上运行.

  10. 在android studio中使用python代码构建android应用程序

    我有一些python代码和它的机器人,我正在寻找一种方法来使用android项目中的那些python代码.有没有办法做到这一点!?解决方法有两种主要工具可供使用,它们彼此不同:>QPython>Kivy使用Kivy,大致相同的代码也可以部署到IOS.

随机推荐

  1. 10 个Python中Pip的使用技巧分享

    众所周知,pip 可以安装、更新、卸载 Python 的第三方库,非常方便。本文小编为大家总结了Python中Pip的使用技巧,需要的可以参考一下

  2. python数学建模之三大模型与十大常用算法详情

    这篇文章主要介绍了python数学建模之三大模型与十大常用算法详情,文章围绕主题展开详细的内容介绍,具有一定的参考价值,感想取得小伙伴可以参考一下

  3. Python爬取奶茶店数据分析哪家最好喝以及性价比

    这篇文章主要介绍了用Python告诉你奶茶哪家最好喝性价比最高,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习吧

  4. 使用pyinstaller打包.exe文件的详细教程

    PyInstaller是一个跨平台的Python应用打包工具,能够把 Python 脚本及其所在的 Python 解释器打包成可执行文件,下面这篇文章主要给大家介绍了关于使用pyinstaller打包.exe文件的相关资料,需要的朋友可以参考下

  5. 基于Python实现射击小游戏的制作

    这篇文章主要介绍了如何利用Python制作一个自己专属的第一人称射击小游戏,文中的示例代码讲解详细,感兴趣的小伙伴可以跟随小编一起动手试一试

  6. Python list append方法之给列表追加元素

    这篇文章主要介绍了Python list append方法如何给列表追加元素,具有很好的参考价值,希望对大家有所帮助。如有错误或未考虑完全的地方,望不吝赐教

  7. Pytest+Request+Allure+Jenkins实现接口自动化

    这篇文章介绍了Pytest+Request+Allure+Jenkins实现接口自动化的方法,文中通过示例代码介绍的非常详细。对大家的学习或工作具有一定的参考借鉴价值,需要的朋友可以参考下

  8. 利用python实现简单的情感分析实例教程

    商品评论挖掘、电影推荐、股市预测……情感分析大有用武之地,下面这篇文章主要给大家介绍了关于利用python实现简单的情感分析的相关资料,文中通过示例代码介绍的非常详细,需要的朋友可以参考下

  9. 利用Python上传日志并监控告警的方法详解

    这篇文章将详细为大家介绍如何通过阿里云日志服务搭建一套通过Python上传日志、配置日志告警的监控服务,感兴趣的小伙伴可以了解一下

  10. Pycharm中运行程序在Python console中执行,不是直接Run问题

    这篇文章主要介绍了Pycharm中运行程序在Python console中执行,不是直接Run问题,具有很好的参考价值,希望对大家有所帮助。如有错误或未考虑完全的地方,望不吝赐教

返回
顶部