资讯

精准传达 • 有效沟通

从品牌网站建设到网络营销策划,从策略到执行的一站式服务

csv库函数python csv库的作用

说说如何利用 Python 处理 CSV 文件

CSV 表示 “Comma-Separated Values (逗号分隔的值) ” , CSV 文件是简化的电子表格,实际为纯文本文件。

创新互联公司技术团队10余年来致力于为客户提供成都网站建设、成都网站制作、高端网站设计成都营销网站建设、搜索引擎SEO优化等服务。经过多年发展,公司拥有经验丰富的技术团队,先后服务、推广了上千多家网站,包括各类中小企业、企事单位、高校等机构单位。

一个 CSV 文件,格式是这样的:

因为 CSV 文件中的每个单元格都是以逗号分割,所以也许有人会对每行文本调用 split() 方法,来解析 CSV 文件。但 CSV 文件也有自己的转义字符,通过转义字符,允许逗号和其他字符作为值的一部分,但单纯使用 split() 方法不能处理这些转义字符。因为这些潜在的缺陷,所以建议总是使用 csv 模块来读写 CSV 文件。

csv 模块是 Python 自带的,所以可以直接导入。

要使用 csv 模块从 CSV 文件中读取数据,我们需要创建一个 Reader 对象。 通过 Reader 对象,我们可以迭代遍历 CSV 文件中的每一行内容。

运行结果:

要用 csv 模块读取 CSV 文件,首先先使用 open() 函数打开它 ,就像打开任何其他文本文件一样。然后将它传递给 csv .reader() 函数。 这个函数将返回一个 Reader 对象。注意,csv .reader() 函数不接受文件名作为入参。

要访问 Reader 对象中的值,最直接的方法,就是利用 list() 将它转换成一个普通 Python 列表。它实际为一个包含列表的列表,用于表示二维数据。

我们还可以使用表达式 data [ row ][ col ] 来访问 CSV 中特定行和列的值。其中, row 是 data 中一个列表的下标, col 是该列表中,我们想访问的项的下标:

运行结果:

运行结果:

Writer 对象可以让我们把数据写入 CSV 文件。

运行结果:

在 Windows 上,需要为 open() 函数的 newline 关键字参数传入一个空字符串。如果没有设置 newline 参数, output.csv 中的行距将变为两倍,如下图所示。

如果写入的内容包含逗号,那么 csv 模块会自动加上双引号,对其进行转义,如下例所示。

运行结果:

我们也可以利用 delimiter ,来制作 TSV 文件,TSV 是Tab-separated values的缩写,即以制表符作为分隔符的文件;利用 lineterminator 参数来设定行距。

运行结果:

这里利用 lineterminator='\n\n\n' 将行与行之间的字符变为三个换行符,效果就是实现了 3 倍行距。

csv文件怎么打开 使用Python读取和写入CSV文件

csv文件本质上是一个文本文件,具体的读取和写入方法有两种:

直接对csv文件进行文件读写操作,每一行是一条记录,按行读取即可,简单代码如下:

with open("XXX.csv","wr") as f:

f.readline()

f.write()

2.使用第三方库中的csv文件读写函数(本质上还是使用python的文件读写方法),如科学计算包pandas包中就有read_csv() to_csv()等函数,其他的一些第三方包里也有,可以自行查询。

两种方法各有优劣,第一种方法的优点就是可控性强,但是代码相对较多,对于python2编码处理很麻烦;第二种方法的优点是代码量小,调用方便,处理编码问题相对容易(在函数中加一个encoding参数即可),但是代码内部比较复杂,可控性较差

用python处理csv文件,最好可以将里面的文本信息转成一个二维数组的形式,具体如下

思路如下:

导入csv库;

打开文件,并用csv库函数reader读入数据;

csv读入的数据是一行一行的,所以通过循环语句把读到的数据放入到数组里

import csv # 必要库导入

filepath = 'test.csv' # 定义文件名称,本文件要与当前的.py文件要在同一文件夹下,不然要用绝对路径

with open(filepath,'r') as csvfile: # 打开数据文件

reader = csv.reader(csvfile) # 用csv的reader函数读取数据文件

header = next(reader) # 读取数据文件的表头

data = [] # 定义一个空数组用于保存文件的数据

for line in reader: # 循环读取数据文件并保存到数组data中

data.append(line) # line是个一维数组,是数据文件中的一行数据

print(header) # 表头

print(data) # 读取的二维数组

Python csv库整理(部分)

近期,笔者到一些数据竞赛网站进行观察学习,发现很多数据是以csv文件处理的(废话).因而,磨刀不误砍柴工,笔者先对Python的csv库进行学习.

csv模块实现了CSV格式表单数据的读写.这可以以一个兼容Excel的方式读写其数据文件,csv模块中的reader和writer类被用来读写序列化的数据.也可以使用DictReader类和DictWriter类以字典的方式读取数据.

返回一个reader对象,该对象逐行遍历csvfile(文件和列表均适用,但是文件的话应该newline=''.

默认每一行读取一个字符串组成的列表(而非数值,除非修改QUOTE_NONUMERIC).

返回一个writer对象,负责将数据在给定的文件类对象上转换成带分隔符的字符串.csvfile(只要该对象有write()方法,文件的话应该newline=''.)

这两个方法可以把name字符串和dialect关联/脱钩.dialect可以是Dialect的子类,或者fmtparams的关键字参数.

返回一个Dialect对象为name的变种,若其未注册,抛出Error.

返回已经注册的所有变种的 名称

返回当前解析器允许的最大字段大小,如果制定了参数,参数将成为新的最大字段大小.

该对象操作上类似reader,但是把每行中的信息映射到一个字典,字典的键由fieldnames给出

fieldname的参数是一个序列sequence [1] ,如果参数缺省,默认第一行的值作为字段名.

如果某一行中的字段多于字段名(比如说约定有5项属性,但是这一行却出现了6个数据),则其余字段将放入列表中,字段名由 restkey 指定(默认为 None)。如果非空白行的字段少于字段名,则缺少的值将用 None 填充。

#其实这玩意应该就跟各种填表里面的备注用法差不多.

3.8中返回的行是dict类型.

该对象操作上类似reader,但是把每行中的信息映射到一个字典,字典的键由fieldnames给出,fieldname参数是不可缺省的.restval用来指定字典缺少键的时候要写入的值.extrasaction用于指定关键键在fieldname中找不到的情况的处理机制.'raise'引发ValueError,而'ignore'则会被忽略.

这个类被用来瑞段csv文件的格式

以下诸类均在括号中标注了在其变种注册表中的名称

定义了Excel生成的csv文件的常规属性.('excel')

定义了Excel生成的,tab分割的csv文件的常规属

性.('excel-tab')

定义了UNIX系统上生成的csv文件的常规属性('unix'):

任意可能发生的csv库函数错误.

参考链接

Python3.8.2文档中关于csv库的相关文档

python读取文本(txt,csv)及相关操作会用到哪些函数?

import csv

with open('my.csv') as f:

fcsv = csv.reader(f) # 标题行

for row in fcsv:

# row[0] row[1]

# txt

with open('my.txt') as f:

for line in f: #按行读取

#f.read() # 读取所有

pass


网页名称:csv库函数python csv库的作用
本文来源:http://cdkjz.cn/article/doopjph.html
多年建站经验

多一份参考,总有益处

联系快上网,免费获得专属《策划方案》及报价

咨询相关问题或预约面谈,可以通过以下方式与我们联系

大客户专线   成都:13518219792   座机:028-86922220