Python文件读取方法与操作步骤详解

2025年12月10日/ 浏览 22

1. Python文件读取的基本概念

Python中的文件操作是程序设计中非常基础但重要的功能之一。Python为文件操作提供了丰富的库，如pandas、numpy和os等，使得文件读取变得简单高效。本文将介绍如何使用Python来读取文件，包括不同文件类型（如文本文件、Excel文件、CSV文件等）的处理方法。

2. 读取不同文件类型的Python代码示例

例子1：读取Excel文件

python

读取Excel文件

import pandas as pd

filepath = “C:/path/to/file.xlsx”
df = pd.readexcel(file_path)

输出数据前几行

print(df.head())

例子2：读取CSV文件

python

读取CSV文件

import csv

filepath = “C:/path/to/file.csv”
with open(filepath, ‘r’, buffering=1) as f:
reader = csv.reader(f, delimiter=’,’)
for row in reader:
print(“{}, {}”.format(row[0], row[1]))

例子3：读取文本文件

python

读取文本文件

filepath = “C:/path/to/file.txt”
with open(filepath, ‘r’, encoding=’utf-8′) as f:
content = f.read()
print(content)

3. 读取文件的文件类型识别

文件类型识别是读取文件前必须完成的一步，以确保后续的操作正确无误。Python的os库提供了丰富的文件操作功能，包括文件类型识别。

python
import os

filepath = “C:/path/to/file.txt”
os.path.isfile(filepath) # 返回True（文件存在）
os.path.isdir(filepath) # 返回False（文件不存在）
os.path.getsize(filepath) # 返回文件的大小

4. 读取文件的编码处理

文件的编码是文件读取和写入的关键步骤。不同的文件格式可能使用不同的编码，因此需要确保文件在读取时使用正确的编码。

python

读取文件并指定编码

filepath = “C:/path/to/file.txt”
with open(filepath, ‘r’, encoding=’utf-8′) as f:
content = f.read()

写入文件并指定编码

with open(file_path, ‘w’, encoding=’utf-8′) as f:
f.write(“hello world”)

5. 读取文件中的数据结构

Python支持多种数据结构，包括列表、元组、字典、字数组、 pandas DataFrame 等。读取文件时，可以根据文件类型选择合适的结构解析方法。

示例：读取Excel文件中的数据

python

读取Excel文件并解析数据

import pandas as pd

filepath = “C:/path/to/file.xlsx”
df = pd.readexcel(file_path)
print(df)

6. 读取文件中的数据解析

除了使用库函数，也可以手动解析文件中的数据结构。例如，读取CSV文件时，可以手动创建一个数据结构并填充数据。

python

读取CSV文件并解析数据

filepath = “C:/path/to/file.csv”
with open(filepath, ‘r’, encoding=’utf-8′) as f:
reader = csv.reader(f, delimiter=’,’)
try:
data = []
for row in reader:
data.append(row)
print(data)
except Exception as e:
print(“异常:”, e)

7. 读取文件中的数据并写入文件

读取文件后，可以将数据写入文件中。这可以用于数据的存储、分享或其他用途。

python

读取文件并写入一个新的文件

filepath = “C:/path/to/file.txt”
with open(filepath, ‘r’, encoding=’utf-8′) as f:
content = f.read()

写入新的内容

with open(file_path, ‘w’, encoding=’utf-8′) as f:
f.write(“new content”)

读取文件并写入同一个文件

with open(filepath, ‘r’, encoding=’utf-8′) as f:
content = f.read()
with open(filepath, ‘w’, encoding=’utf-8′) as f:
f.write(“new content”)

8. 读取文件中的数据并处理缺失值

在某些情况下，文件中的数据可能包含缺失值。Python的pandas库提供了处理缺失值的方法。

python

读取Excel文件并处理缺失值

import pandas as pd

filepath = “C:/path/to/file.xlsx”
df = pd.readexcel(file_path)
print(df)

填充缺失值

df.fillna(0, inplace=True)
print(df)

9. 读取文件中的数据并进行数据转换

Python的pandas库还提供了将数据转换为其他格式的能力，例如将Excel文件转换为CSV文件。

python

读取Excel文件并转换为CSV文件

import pandas as pd

filepath = “C:/path/to/file.xlsx”
df = pd.readexcel(filepath)
dfcsv = df.tocsv(‘file.csv’, index=False)
print(dfcsv)

10. 读取文件中的数据并进行数据统计

Python的pandas库还提供了对数据进行统计的能力，例如计算数据的平均值、标准差等。

python

读取Excel文件并计算平均值

import pandas as pd

filepath = “C:/path/to/file.xlsx”
df = pd.readexcel(file_path)
print(“平均值:”, df[‘数值’].mean())

11. 读取文件中的数据并进行数据可视化

Python的matplotlib和seaborn库可以用于对数据进行可视化，例如绘制柱状图、折线图等。

python

读取Excel文件并进行可视化

import pandas as pd
import matplotlib.pyplot as plt

filepath = “C:/path/to/file.xlsx”
df = pd.readexcel(file_path)
print(“数据前几行:”, df.head())

绘制柱状图

df[‘数值’].plot.bar()
plt.show()

12. 读取文件中的数据并进行数据处理

Python的pandas库提供了对文件数据进行处理的能力，例如分割文本、提取特定列等。

python

读取Excel文件并提取特定列

import pandas as pd

filepath = “C:/path/to/file.xlsx”
df = pd.readexcel(file_path)
print(“数据前几行:”, df)

提取特定列

selectedcolumns = [‘数值’, ‘日期’]
print(“提取的列:”, selectedcolumns)

分割文本

text = “这是一个文本，我们可以进行分割。”
parts = text.split()
print(“分割后的列表:”, parts)

13. 读取文件中的数据并进行数据清洗

数据清洗是数据处理的一个重要步骤，用于去除或修正数据中的错误或不完整信息。

python

读取Excel文件并清洗数据

import pandas as pd

filepath = “C:/path/to/file.xlsx”
df = pd.readexcel(file_path)
print(“数据前几行:”, df)

去除特殊字符

newdf = df.replace(‘特殊字符’, ”, inplace=True)
print(“去特殊字符后的数据:”, newdf)

去除重复行

uniquedf = df.dropduplicates(subset=[‘列名’], inplace=True)
print(“去除重复行后的数据:”, unique_df)

14. 读取文件中的数据并进行数据转换

Python的pandas库还提供了将数据转换为其他格式的能力，例如将Excel文件转换为CSV文件。

python

读取Excel文件并转换为CSV文件

import pandas as pd

filepath = “C:/path/to/file.xlsx”
df = pd.readexcel(filepath)
dfcsv = df.tocsv(‘file.csv’, index=False)
print(dfcsv)

15. 读取文件中的数据并进行数据处理

Python的pandas库提供了对文件数据进行处理的能力，例如分割文本、提取特定列等。

python

读取Excel文件并提取特定列

import pandas as pd

filepath = “C:/path/to/file.xlsx”
df = pd.readexcel(file_path)
print(“数据前几行:”, df)

提取特定列

selectedcolumns = [‘数值’, ‘日期’]
print(“提取的列:”, selectedcolumns)

分割文本

text = “这是一个文本，我们可以进行分割。”
parts = text.split()
print(“分割后的列表:”, parts)

16. 读取文件中的数据并进行数据统计

Python的pandas库还提供了对数据进行统计的能力，例如计算数据的平均值、标准差等。

python

读取Excel文件并计算平均值

import pandas as pd

filepath = “C:/path/to/file.xlsx”
df = pd.readexcel(file_path)
print(“平均值:”, df[‘数值’].mean())

17. 读取文件中的数据并进行数据可视化

Python的matplotlib和seaborn库可以用于对数据进行可视化，例如绘制柱状图、折线图等。

python

读取Excel文件并进行可视化

import pandas as pd
import matplotlib.pyplot as plt

filepath = “C:/path/to/file.xlsx”
df = pd.readexcel(file_path)
print(“数据前几行:”, df)

绘制柱状图

df[‘数值’].plot.bar()
plt.show()

18. 读取文件中的数据并进行数据处理

Python的pandas库提供了对文件数据进行处理的能力，例如分割文本、提取特定列等。

python

读取Excel文件并提取特定列

import pandas as pd

filepath = “C:/path/to/file.xlsx”
df = pd.readexcel(file_path)
print(“数据前几行:”, df)

提取特定列

selectedcolumns = [‘数值’, ‘日期’]
print(“提取的列:”, selectedcolumns)

分割文本

text = “这是一个文本，我们可以进行分割。”
parts = text.split()
print(“分割后的列表:”, parts)

19. 读取文件中的数据并进行数据统计

Python的pandas库还提供了对数据进行统计的能力，例如计算数据的方差、标准差等。

python

读取Excel文件并计算方差

import pandas as pd

filepath = “C:/path/to/file.xlsx”
df = pd.readexcel(file_path)
print(“方差:”, df[‘数值’].var())

20. 读取文件中的数据并进行数据处理

Python的pandas库提供了对文件数据进行处理的能力，例如分割文本、提取特定列等。

python

读取Excel文件并提取特定列

import pandas as pd

filepath = “C:/path/to/file.xlsx”
df = pd.readexcel(file_path)
print(“数据前几行:”, df)

提取特定列

selectedcolumns = [‘数值’, ‘日期’]
print(“提取的列:”, selectedcolumns)

分割文本

text = “这是一个文本，我们可以进行分割。”
parts = text.split()
print(“分割后的列表:”, parts)

Python文件读取方法与操作步骤详解

1. Python文件读取的基本概念

2. 读取不同文件类型的Python代码示例

读取Excel文件

输出数据前几行

读取CSV文件

读取文本文件

3. 读取文件的文件类型识别

4. 读取文件的编码处理

读取文件并指定编码

写入文件并指定编码

5. 读取文件中的数据结构

读取Excel文件并解析数据

6. 读取文件中的数据解析

读取CSV文件并解析数据

7. 读取文件中的数据并写入文件

读取文件并写入一个新的文件

写入新的内容

读取文件并写入同一个文件

8. 读取文件中的数据并处理缺失值

读取Excel文件并处理缺失值

填充缺失值

9. 读取文件中的数据并进行数据转换

读取Excel文件并转换为CSV文件

10. 读取文件中的数据并进行数据统计

读取Excel文件并计算平均值

11. 读取文件中的数据并进行数据可视化

读取Excel文件并进行可视化

绘制柱状图

12. 读取文件中的数据并进行数据处理

读取Excel文件并提取特定列

提取特定列

分割文本

13. 读取文件中的数据并进行数据清洗

读取Excel文件并清洗数据

去除特殊字符

去除重复行

14. 读取文件中的数据并进行数据转换

读取Excel文件并转换为CSV文件

15. 读取文件中的数据并进行数据处理

读取Excel文件并提取特定列

提取特定列

分割文本

16. 读取文件中的数据并进行数据统计

读取Excel文件并计算平均值

17. 读取文件中的数据并进行数据可视化

读取Excel文件并进行可视化

绘制柱状图

18. 读取文件中的数据并进行数据处理

读取Excel文件并提取特定列

提取特定列

分割文本

19. 读取文件中的数据并进行数据统计

读取Excel文件并计算方差

20. 读取文件中的数据并进行数据处理

读取Excel文件并提取特定列

提取特定列

分割文本

总结：