百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 编程文章 > 正文

Python代码解压的中文文件名是乱码,怎么解决?

qiyuwang 2024-10-16 14:02 8 浏览 0 评论

大家好,我是Python进阶者。

一、前言

前几天在Python白银交流群【fashjon】问了一个Python自动化办公的问题,问题如下:

import zipfile

def unzip_file(zip_file_path, output_folder_path):
    with zipfile.ZipFile(zip_file_path, 'r') as zip_ref:
        zip_ref.extractall(output_folder_path)

# 使用示例
zip_file_path = 'example.zip'
output_folder_path = 'output_folder'
unzip_file(zip_file_path, output_folder_path)

以上代码解压的中文文件名是乱码,怎么解决?

二、实现过程

这里【瑜亮老师】给了个思路如下:乱码是什么样子的?最好能传上来一个压缩包,我们好试验。

过了几分钟,【瑜亮老师】补充道:@fashjon?我查看了一下zipfile的源码,发现是使用了'cp437'编码了文件名才导致的文件名错误。既然知道了错误的编码,那么方法就很简单了,1修改源码,2自己写代码读取解压缩路径中的文件名,重新使用'cp437'编码然后用gbk解码,重命名文件名,问题解决。修改后的代码如下:

import zipfile
import os
def unzip_file(zip_file_path, output_folder_path, encoding='gbk'):
    with zipfile.ZipFile(zip_file_path, 'r') as zip_ref:
        zip_ref.extractall(output_folder_path)
    # 遍历解压后的目录,检查并修正文件名
    for root, dirs, files in os.walk(output_folder_path):
        for bad_name in files:
            # 假设这里我们知道ZIP文件使用的是'gbk'编码(但实际情况可能不同)
            if not bad_name.isascii():  # 如果文件名包含非ASCII字符
                true_name = bad_name.encode('cp437').decode(encoding)
                os.rename(os.path.join(root, bad_name), os.path.join(root, true_name))
# 使用示例
zip_file_path = 'example.zip'
output_folder_path = 'output_folder'
unzip_file(zip_file_path, output_folder_path)

不确定你的电脑里是否安装pathlib,因此使用了os,顺利地解决了粉丝的疑问。

粉丝追问:解压文件用什么库比较好?

回答1:这方面我只知道zipfile和代码调用winrar。平时很少接触匹量处理压缩包。

回答2:批量处理压缩包,直接wps批量解压就可以了;

回答3:何须wps,只要电脑上装的有任意解压软件,全选压缩包,右键,可以解压到一个文件夹,也可以每个压缩包单独生成一个文件夹。代码只不过方便遍历多层文件夹目录,如果都在一个文件夹中,还不如右键点选更方便。

如果你也有类似这种Python相关的小问题,欢迎随时来交流群学习交流哦,有问必答!

三、总结

大家好,我是Python进阶者。这篇文章主要盘点了一个Python自动化办公的问题,文中针对该问题,给出了具体的解析和代码实现,帮助粉丝顺利解决了问题。

最后感谢粉丝【fashjon】提出的问题,感谢【瑜亮老师】给出的思路,感谢【莫生气】等人参与学习交流。

【提问补充】温馨提示,大家在群里提问的时候。可以注意下面几点:如果涉及到大文件数据,可以数据脱敏后,发点demo数据来(小文件的意思),然后贴点代码(可以复制的那种),记得发报错截图(截全)。代码不多的话,直接发代码文字即可,代码超过50行这样的话,发个.py文件就行。

相关推荐

你们想要的Python爬虫教程来了:从原理到实践

概述:网络世界的智能采集者Python爬虫是通过自动化程序模拟人类浏览网页行为的技术工具,其核心价值在于高效获取并解析网络数据。得益于Python丰富的第三方库(如requests、Beautiful...

你需要知道的 19 个 console 实用调试技巧

大家好,我是Echa。之前给大家介绍了《...

CSS布局必备技能

Flex是一种用于布局的CSS属性,它使得在容器中的子元素能够灵活地伸缩和排列,从而实现更加自适应和响应式的布局。使用Flex布局可以轻松地创建各种复杂的布局,而无需使用复杂的CSS或者...

我是如何使用ChatGPT和CoPilot作为编码助手的

...

jsoup Selector类学习笔记,快速提升你的HTML处理能力!

Selector类是jsoup库中的一个核心类,用于通过CSS选择器语法来查找HTML文档中的元素。选择器语法通用选择器*:匹配任何元素。标签选择器tag:匹配指定标签名的元素。...

CSS伪类选择器大全:提升网页交互与样式的神奇工具

CSS伪类选择器是前端开发中不可或缺的强大工具,它们允许我们根据元素的状态、位置或用户行为动态地应用样式。本文将全面介绍常用的伪类选择器,并通过代码示例展示其实际应用场景。一、基础交互伪类1.超链接...

简析JS中Document与CSS

如果你是一名前端人员,你单单的使用jq插件显然不够,js在大多时候比较搁置,但你如果前端技术想要提升,那么js的精通对你显得很重要,本文只是他到js的document与css。1.Document与E...

网页世界隐藏的神秘代码语言,竟能这样改变布局

CSS基础:选择器与属性CSS(CascadingStyleSheets)是用于控制网页外观的一门样式表语言。它通过定义HTML元素的显示方式来增强网页的表现力。CSS的选择器允许开发者精确地定位...

Thymeleaf 语法全面详解(史上最全)

Thymeleaf是一个现代化的服务器端Java模板引擎,支持HTML、XML、JavaScript、CSS甚至纯文本。以下是Thymeleaf语法的全面详解,包含所有属性和复杂用法。...

零基础学习HTML之CSS篇内联内部外部样式表和类型选择符

CSS简介CSS(CascadingStyleSheets)层叠样式表。CSS能做些什么?1.使用CSS样式可以有效地对页面进行布局。2.使用CSS样式可以对页面字体、颜色、背景和其他效果实现...

css 设置盒子阴影,阴影和背景图保持一致

预览图首先查看预览图:原理采用了background属性...

CSS中的定位(postion)详解

定义CSSposition属性用于指定一个元素在文档中的定位方式。top,right,bottom和left属性则决定了该元素的最终位置,z-index属性则决定了该元素所在的层级。定位类型1...

CSS selector 小知识学习分享

在设计器中,大家拾取网页元素后,在右侧的属性栏里都会有一个叫“查找路径”的选择框,一般也很少有人用到,打开后里面显示了一堆‘@#yen#%#yen@*T&’的玩意,那么这个“查找路径”到底是个什...

从网站检查中复制CSS代码的最简单方法

在处理网站项目时,您是否曾经对使用开发工具感到沮丧?必须在您正在处理的网页和检查器之间来回切换以查看CSS并进行调整通常可能是一个挑战。值得庆幸的是,有一个浏览器扩展程序可以简化该过程:CSSSca...

XPath 选择器

上篇《Selenium入门(基于Python)...

取消回复欢迎 发表评论: