一文搞懂Python读取text,CSV,JSON文件的方法

2023-06-07 原文

前言

文件是无处不在的，无论我们使用哪种编程语言，处理文件对于每个程序员都是必不可少的

文件处理是一种用于创建文件、写入数据和从中读取数据的过程，Python 拥有丰富的用于处理不同文件类型的包，从而使得我们可以更加轻松方便的完成文件处理的工作

本文大纲：

使用上下文管理器打开文件
Python 中的文件读取模式
读取 text 文件
读取 CSV 文件
读取 JSON 文件

打开文件

在访问文件的内容之前，我们需要打开文件。Python 提供了一个内置函数可以帮助我们以不同的模式打开文件。open() 函数接受两个基本参数：文件名和模式

默认模式是“r”，它以只读方式打开文件。这些模式定义了我们如何访问文件以及我们如何操作其内容。open() 函数提供了几种不同的模式，我们将在后面逐一讨论

下面我们通过 ’Python 之禅‘ 文件来进行后面的讨论学习

f = open('zen_of_python.txt', 'r')
print(f.read())
f.close()

Output:

The Zen of Python, by Tim Peters

Beautiful is better than ugly.
Explicit is better than implicit.
Simple is better than complex.
Complex is better than complicated.
Flat is better than nested.
Sparse is better than dense.
Readability counts.
...

在上面的代码中，open() 函数以只读模式打开文本文件，这允许我们从文件中获取信息而不能更改它。在第一行，open() 函数的输出被赋值给一个代表文本文件的对象 f，在第二行中，我们使用 read() 方法读取整个文件并打印其内容，close() 方法在最后一行关闭文件。需要注意，我们必须始终在处理完打开的文件后关闭它们以释放我们的计算机资源并避免引发异常

在 Python 中，我们可以使用 with 上下文管理器来确保程序在文件关闭后释放使用的资源，即使发生异常也是如此

with open('zen_of_python.txt') as f:
    print(f.read())

Output:

The Zen of Python, by Tim Peters

Beautiful is better than ugly.
Explicit is better than implicit.
Simple is better than complex.
Complex is better than complicated.
Flat is better than nested.
Sparse is better than dense.
Readability counts.
...

上面的代码使用 with 语句创建了一个上下文，并绑定到变量 f ，所有文件对象方法都可以通过该变量访问文件对象。read() 方法在第二行读取整个文件，然后使用 print() 函数输出文件内容

当程序到达 with 语句块上下文的末尾时，它会关闭文件以释放资源并确保其他程序可以正常调用它们。通常当我们处理不再需要使用的，需要立即关闭的对象（例如文件、数据库和网络连接）时，强烈推荐使用 with 语句

这里需要注意的是，即使在退出 with 上下文管理器块之后，我们也可以访问 f 变量，但是该文件是已关闭状态。让我们尝试一些文件对象属性，看看变量是否仍然存在并且可以访问：

print("Filename is '{}'.".format(f.name))
if f.closed:
    print("File is closed.")
else:
    print("File isn't closed.")

Output:

Filename is 'zen_of_python.txt'.
File is closed.

但是此时是不可能从文件中读取内容或写入文件的，关闭文件时，任何访问其内容的尝试都会导致以下错误：

f.read()

Output:

---------------------------------------------------------------------------

ValueError Traceback (most recent call last)

~\AppData\Local\Temp/ipykernel_9828/3059900045.py in <module>
----> 1 f.read()

ValueError: I/O operation on closed file.

Python 中的文件读取模式

正如我们在前面提到的，我们需要在打开文件时指定模式。下表是 Python 中的不同的文件模式：

模式说明

'r' 打开一个只读文件
'w' 打开一个文件进行写入。如果文件存在，会覆盖它，否则会创建一个新文件
'a' 打开一个仅用于追加的文件。如果该文件不存在，会创建该文件
'x' 创建一个新文件。如果文件存在，则失败
' ' 打开一个文件进行更新

我们还可以指定以文本模式“t”、默认模式或二进制模式“b”打开文件。让我们看看如何使用简单的语句复制图像文件 dataquest_logo.png：

with open('dataquest_logo.png', 'rb') as rf:
    with open('data_quest_logo_copy.png', 'wb') as wf:
        for b in rf:
            wf.write(b)

上面的代码复制 Dataquest 徽标图像并将其存储在同一路径中。'rb' 模式以二进制模式打开文件并进行读取，而 'wb' 模式以文本模式打开文件以并行写入

读取文本文件

在 Python 中有多种读取文本文件的方法，下面我们介绍一些读取文本文件内容的有用方法

到目前为止，我们已经了解到可以使用 read() 方法读取文件的全部内容。如果我们只想从文本文件中读取几个字节怎么办，可以在 read() 方法中指定字节数。让我们尝试一下：

with open('zen_of_python.txt') as f:
    print(f.read(17))

Output:

The Zen of Python

上面的简单代码读取 zen_of_python.txt 文件的前 17 个字节并将它们打印出来

有时一次读取一行文本文件的内容更有意义，在这种情况下，我们可以使用 readline() 方法

with open('zen_of_python.txt') as f:
    print(f.readline())

Output:

The Zen of Python, by Tim Peters

上面的代码返回文件的第一行，如果我们再次调用该方法，它将返回文件中的第二行等，如下：

with open('zen_of_python.txt') as f:
    print(f.readline())
    print(f.readline())
    print(f.readline())
    print(f.readline())

Output:

The Zen of Python, by Tim Peters

Beautiful is better than ugly.

Explicit is better than implicit.

这种有用的方法可以帮助我们以增量方式读取整个文件。

以下代码通过逐行迭代来输出整个文件，直到跟踪我们正在读取或写入文件的位置的文件指针到达文件末尾。当 readline() 方法到达文件末尾时，它返回一个空字符串

with open('zen_of_python.txt') as f:
    line = f.readline()
    while line:
        print(line, end='')
        line = f.readline()

Output:

The Zen of Python, by Tim Peters

Beautiful is better than ugly.
Explicit is better than implicit.
Simple is better than complex.
Complex is better than complicated.
Flat is better than nested.
Sparse is better than dense.
Readability counts.
Special cases aren't special enough to break the rules.
Although practicality beats purity.
Errors should never pass silently.
Unless explicitly silenced.
In the face of ambiguity, refuse the temptation to guess.
There should be one-- and preferably only one --obvious way to do it.
Although that way may not be obvious at first unless you're Dutch.
Now is better than never.
Although never is often better than *right* now.
If the implementation is hard to explain, it's a bad idea.
If the implementation is easy to explain, it may be a good idea.
Namespaces are one honking great idea -- let's do more of those!

上面的代码在 while 循环之外读取文件的第一行并将其分配给 line 变量。在 while 循环中，它打印存储在 line 变量中的字符串，然后读取文件的下一行。while 循环迭代该过程，直到 readline() 方法返回一个空字符串。空字符串在 while 循环中的计算结果为 False，因此迭代过程终止

读取文本文件的另一个有用方法是 readlines() 方法，将此方法应用于文件对象会返回包含文件每一行的字符串列表

with open('zen_of_python.txt') as f:
    lines = f.readlines()

让我们检查 lines 变量的数据类型，然后打印它：

print(type(lines))
print(lines)

Output:

<class 'list'>
['The Zen of Python, by Tim Peters\n', '\n', 'Beaut...]

它是一个字符串列表，其中列表中的每个项目都是文本文件的一行，``\n` 转义字符表示文件中的新行。此外，我们可以通过索引或切片操作访问列表中的每个项目：

print(lines)
print(lines[3:5])
print(lines[-1])

Output:

['The Zen of Python, by Tim Peters\n', '\n', 'Beautiful is better than ugly.\n', ... -- let's do more of those!"]
['Explicit is better than implicit.\n', 'Simple is better than complex.\n']
Namespaces are one honking great idea -- let's do more of those!

读取 CSV 文件

到目前为止，我们已经学会了如何使用常规文本文件。但是有时数据采用 CSV 格式，数据专业人员通常会检索所需信息并操作 CSV 文件的内容

接下来我们将使用 CSV 模块，CSV 模块提供了有用的方法来读取存储在 CSV 文件中的逗号分隔值。我们现在就尝试一下

import csv
with open('chocolate.csv') as f:
    reader = csv.reader(f, delimiter=',')
    for row in reader:
        print(row)

Output:

['Company', 'Bean Origin or Bar Name', 'REF', 'Review Date', 'Cocoa Percent', 'Company Location', 'Rating', 'Bean Type', 'Country of Origin']
['A. Morin', 'Agua Grande', '1876', '2016', '63%', 'France', '3.75', 'Â\xa0', 'Sao Tome']
['A. Morin', 'Kpime', '1676', '2015', '70%', 'France', '2.75', 'Â\xa0', 'Togo']
['A. Morin', 'Atsane', '1676', '2015', '70%', 'France', '3', 'Â\xa0', 'Togo']
['A. Morin', 'Akata', '1680', '2015', '70%', 'France', '3.5', 'Â\xa0', 'Togo']
...

CSV 文件的每一行形成一个列表，其中每个项目都可以轻松的被访问，如下所示：

import csv
with open('chocolate.csv') as f:
    reader = csv.reader(f, delimiter=',')
    for row in reader:
        print("The {} company is located in {}.".format(row[0], row[5]))

Output:

The Company company is located in Company Location.
The A. Morin company is located in France.
The A. Morin company is located in France.
The A. Morin company is located in France.
The A. Morin company is located in France.
The Acalli company is located in U.S.A..
The Acalli company is located in U.S.A..
The Adi company is located in Fiji.
...

很多时候，使用列的名称而不是使用它们的索引，这通常对专业人员来说更方便。在这种情况下，我们不使用 reader() 方法，而是使用返回字典对象集合的 DictReader() 方法

import csv
with open('chocolate.csv') as f:
    dict_reader = csv.DictReader(f, delimiter=',')
    for row in dict_reader:
        print("The {} company is located in {}.".format(row['Company'], row['Company Location']))

Output:

The A. Morin company is located in France.
The A. Morin company is located in France.
The A. Morin company is located in France.
The A. Morin company is located in France.
The Acalli company is located in U.S.A..
The Acalli company is located in U.S.A..
The Adi company is located in Fiji.
...

读取 JSON 文件

我们主要用于存储和交换数据的另一种流行文件格式是 JSON，JSON 代表 JavaScript Object Notation，允许我们使用逗号分隔的键值对存储数据

接下来我们将加载一个 JSON 文件并将其作为 JSON 对象使用，而不是作为文本文件，为此我们需要导入 JSON 模块。然后在 with 上下文管理器中，我们使用了属于 json 对象的 load() 方法，它加载文件的内容并将其作为字典存储在上下文变量中。

import json
with open('movie.json') as f:
    content = json.load(f)
    print(content)

Output:

{'Title': 'Bicentennial Man', 'Release Date': 'Dec 17 1999', 'MPAA Rating': 'PG', 'Running Time min': 132, 'Distributor': 'Walt Disney Pictures', 'Source': 'Based on Book/Short Story', 'Major Genre': 'Drama', 'Creative Type': 'Science Fiction', 'Director': 'Chris Columbus', 'Rotten Tomatoes Rating': 38, 'IMDB Rating': 6.4, 'IMDB Votes': 28827}

让我们检查内容变量的数据类型：

print(type(content))

Output:

<class 'dict'>

它的数据类型是字典，因此我们可以方便的从中提取数据

print('{} directed by {}'.format(content['Title'], content['Director']))

Output:

Bicentennial Man directed by Chris Columbus

总结

今天我们讨论了 Python 中的文件处理，重点是读取文件的内容。我们了解了 open() 内置函数、with 上下文管理器，以及如何读取文本、CSV 和 JSON 等常见文件类型。

以上就是一文搞懂Python读取text,CSV,JSON文件的方法的详细内容，更多关于Python读取文件的资料请关注Devmax其它相关文章！

一文搞懂Python读取text,CSV,JSON文件的方法的更多相关文章

XCode 3.2 Ruby和Python模板

在xcode3.2下,我的ObjectiveCPython/Ruby项目仍然可以打开更新和编译,但是你无法创建新项目.鉴于xcode3.2中缺少ruby和python的所有痕迹(即创建项目并添加新的ruby/python文件),是否有一种简单的方法可以再次安装模板？我发现了一些关于将它们复制到某个文件夹的信息,但我似乎无法让它工作,我怀疑文件夹的位置已经改变为3.2.解决方法3.2中的应用程序模板
ios – 如何从Core Data创建CSV文件(swift)

我正在构建一个带有核心数据的应用程序,它们显示在tableView中.现在我想将这些数据导出到CSV文件,这样我就可以在windows上的excel中打开它.我搜索了很多,但没有找到正确的答案.有人可以帮助我或给我一个良好的解释或教程的链接？
Swift基本使用-函数和闭包(三)

声明函数和其他脚本语言有相似的地方，比较明显的地方是声明函数的关键字swift也出现了Python中的组元，可以通过一个组元返回多个值。传递可变参数，函数以数组的形式获取参数swift中函数可以嵌套，被嵌套的函数可以访问外部函数的变量。可以通过函数的潜逃来重构过长或者太复杂的函数。
10 个Python中Pip的使用技巧分享

众所周知，pip 可以安装、更新、卸载 Python 的第三方库，非常方便。本文小编为大家总结了Python中Pip的使用技巧，需要的可以参考一下
Swift、Go、Julia与R能否挑战 Python 的王者地位

本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容，请发送邮件至dio@foxmail.com举报，一经查实，本站将立刻删除。
红薯因 Swift 重写开源中国失败，貌似欲改用 Python

本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容，请发送邮件至dio@foxmail.com举报，一经查实，本站将立刻删除。
你没看错：Swift可以直接调用Python函数库

上周Perfect又推出了新一轮服务器端Swift增强函数库：Perfect-Python。对，你没看错，在服务器端Swift其实可以轻松从其他语种的函数库中直接拿来调用，不需要修改任何内容。以如下python脚本为例：Perfect-Python可以用下列方法封装并调用以上函数，您所需要注意的仅仅是其函数名称以及参数。
Swift中的列表解析

在Swift中完成这个的最简单的方法是什么？我在寻找类似的东西：从Swift2.x开始，有一些与你的Python样式列表解析相当的东西。(在这个意义上，它更像是Python的xrange。如果你想保持集合懒惰一路通过，只是这样说：与Python中的列表解析语法不同，Swift中的这些操作遵循与其他操作相同的语法。
swift 3.1如何从CSV获取数组或字典

我怎样才能在这种CSV文件中使用数据？或者我如何打印“内部”列的第2行值并将其分配给属性/实体？我有这种从excel文件转换为Numbers的文件,我想抓取每列的数据并使用它们.原始CSV文件以数字打开：我得到的控制台输出：使用这种方法：解决方案感谢JensMeder运用在viewDidLoad中你想要做的是将字符串分成行然后分成列.Swift已经为String结构提供了components方法.然后您可以通过以下方式访问任何值
数组 – 将.csv数据导入数组

我在过去几年使用Objective-C.现在我正在尝试Xcode6beta4与迅速.我想导入一个.csv表单我的webserver到一个数组.我在Objective-C中的旧代码是：我怎么可以在Swift这样做？有最佳做法–推荐吗？有多个swift库可用：CSVImporter,它是一个适用于处理大型csv文件的异步解析器.SwiftCSV,它是一个用于OSX和iOS的简单CSV解析库.和CSwiftV,它是符合rfc4180规范的csv解析器,但根据作者,它全部在内存中,因此不适合大文件.

随机推荐

10 个Python中Pip的使用技巧分享

众所周知，pip 可以安装、更新、卸载 Python 的第三方库，非常方便。本文小编为大家总结了Python中Pip的使用技巧，需要的可以参考一下
python数学建模之三大模型与十大常用算法详情

这篇文章主要介绍了python数学建模之三大模型与十大常用算法详情，文章围绕主题展开详细的内容介绍，具有一定的参考价值，感想取得小伙伴可以参考一下
Python爬取奶茶店数据分析哪家最好喝以及性价比

这篇文章主要介绍了用Python告诉你奶茶哪家最好喝性价比最高，文中通过示例代码介绍的非常详细，对大家的学习或者工作具有一定的参考学习价值，需要的朋友们下面随着小编来一起学习吧
使用pyinstaller打包.exe文件的详细教程

PyInstaller是一个跨平台的Python应用打包工具，能够把 Python 脚本及其所在的 Python 解释器打包成可执行文件,下面这篇文章主要给大家介绍了关于使用pyinstaller打包.exe文件的相关资料,需要的朋友可以参考下
基于Python实现射击小游戏的制作

这篇文章主要介绍了如何利用Python制作一个自己专属的第一人称射击小游戏，文中的示例代码讲解详细，感兴趣的小伙伴可以跟随小编一起动手试一试
Python list append方法之给列表追加元素

这篇文章主要介绍了Python list append方法如何给列表追加元素，具有很好的参考价值，希望对大家有所帮助。如有错误或未考虑完全的地方，望不吝赐教
Pytest+Request+Allure+Jenkins实现接口自动化

这篇文章介绍了Pytest+Request+Allure+Jenkins实现接口自动化的方法，文中通过示例代码介绍的非常详细。对大家的学习或工作具有一定的参考借鉴价值，需要的朋友可以参考下
利用python实现简单的情感分析实例教程

商品评论挖掘、电影推荐、股市预测……情感分析大有用武之地,下面这篇文章主要给大家介绍了关于利用python实现简单的情感分析的相关资料,文中通过示例代码介绍的非常详细,需要的朋友可以参考下
利用Python上传日志并监控告警的方法详解

这篇文章将详细为大家介绍如何通过阿里云日志服务搭建一套通过Python上传日志、配置日志告警的监控服务，感兴趣的小伙伴可以了解一下
Pycharm中运行程序在Python console中执行,不是直接Run问题

这篇文章主要介绍了Pycharm中运行程序在Python console中执行,不是直接Run问题，具有很好的参考价值，希望对大家有所帮助。如有错误或未考虑完全的地方，望不吝赐教