网站建设 >

查看其它板块

python求频数的函数 python计算频数

python pandas 统计某一数据出现多少次

输入：

成都创新互联专注于峄城网站建设服务及定制，我们拥有丰富的企业做网站经验。热诚为您提供峄城营销型网站建设，峄城网站制作、峄城网页设计、峄城网站官网定制、成都小程序开发服务，打造峄城网络公司原创品牌,更为您提供峄城网站排名全网营销落地服务。

import pandas as pd

data0 = [0,1,2,0,1,0,2,0]

pd.value_counts(data0)

输出每个数出现的频数：

0 4

2 2

1 2

（0出现4次，2出现2次，1出现两次）

如何高效地使用Python统计数据的频率

之前用 Python 写过一个脚本，用来处理上千万用户的一些数据，其中有一个需求是统计用户的某一数据的去重数量。为了加快程序的速度，我启用了多进程。但不幸的是，程序跑了近一个星期，还没处理完。这时，我感觉到了不对，于是开始查看程序的性能瓶颈。

对于统计去重数，我是将用户的数据放到一个列表中，然后用 len(set(data)) 去统计去重数量。刚开始我以为这的数据量并不大，每个用户的数据不会过百，我并没有注意到有的用户会有上万条的数据，因此消耗了大量的时间（其实我的脚本消耗时间最大的地方是因为从远程 redis 中取大量数据时发生长时间的阻塞，甚至连接超时，最后我采用的方式分而治之，每次取少量的数据，这样大大的提高了性能）。

为了做优化，我开始寻求高效的方法。我发现，有大量的人认为采用字典效率会更高，即：

data_unique = {}.fromkeys(data).keys() len(data_unique)

于是，我做了下测试：

In [1]: import random In [2]: data = [random.randint(0, 1000) for _ in xrange(1000000)] In [3]: %timeit len(set(data)) 10 loops, best of 3: 39.7 ms per loop In [4]: %timeit len({}.fromkeys(data).keys()) 10 loops, best of 3: 43.5 ms per loop

由此可见，采用字典和采用集合的性能是差不多的，甚至可能还要慢些。

在 Python 中其实有很多高效的库，例如用 numpy、pandas 来处理数据，其性能接近于 C 语言。那么，我们就用 numpy 和 pandas 来解决这个问题，这里我还比较了获取去重数据的性能，代码如下：

import collections import random as py_random import timeit import numpy.random as np_random import pandas as pd DATA_SIZE = 10000000 def py_cal_len(): data = [py_random.randint(0, 1000) for _ in xrange(DATA_SIZE)] len(set(data)) def pd_cal_len(): data = np_random.randint(1000, size=DATA_SIZE) data = pd.Series(data) data_unique = data.value_counts() data_unique.size def py_count(): data = [py_random.randint(0, 1000) for _ in xrange(DATA_SIZE)] collections.Counter(data) def pd_count(): data = np_random.randint(1000, size=DATA_SIZE) data = pd.Series(data) data.value_counts() # Script starts from here if __name__ == "__main__": t1 = timeit.Timer("py_cal_len()", setup="from __main__ import py_cal_len") t2 = timeit.Timer("pd_cal_len()", setup="from __main__ import pd_cal_len") t3 = timeit.Timer("py_count()", setup="from __main__ import py_count") t4 = timeit.Timer("pd_count()", setup="from __main__ import pd_count") print t1.timeit(number=1) print t2.timeit(number=1) print t3.timeit(number=1) print t4.timeit(number=1)

运行结果：

12.438587904 0.435907125473 14.6431810856 0.258564949036

利用 pandas 统计数据的去重数和去重数据，其性能是 Python 原生函数的 10 倍以上。

python想统计数据框中指定一列的频数,要使用以下哪个函数？

Python想统计数据框中指定的一列数，那么再说函数的时候，你可以使用if函数或者是其他的函数都可以。

Python常用函数三有哪些？这7个函数使用频率最高，总算搞明白了

1.1 例如：print(hex(2))案例

1.2 输出函数：print(hex(2))

1.3 输出结果：0x2

1.4 解析说明：返回16进制的数。

2.1 例如：print(chr(10))案例

2.2 输出函数：print(chr(10))

2.3 输出结果：0o12

2.4 解析说明：返回当前整数对应的ASCll码

3.1 例如：print(ord("b"))案例

3.2 输出函数：print(ord("b"))

3.3 输出结果：98

3.4 解析说明：返回当前ASCll码的10进制数

4.1 例如：print(chr(97))

4.2 输出函数：print(chr(97))

4.3 输出结果：b

4.4 解析说明：返回当前ASCll码的10进制数。

案例一：给你一个字符串,s = 'hello kitty'

1.1 输出函数：print(s.capitalize())

1.2 输出结果：0x2

1.3 解析说明：返回16进制的数。

2.1输出函数：print(s.replace('kitty','kuang'))

2.2 输出结果：hello kuang

2.3 解析说明：替换功能，将kitty换成kuang。

2.4 输出函数：print(s.replace('4','KK'))

2.5 输出结果：12KK12KK

2.6 解析说明：所有的4都替换成KK

2.7 输出函数：print(s.replace('4','KK'))

2.8 输出结果：12KK12KK124

2.9 解析说明：将前两个的4替换成go

案例一：给你一个字符串，ip = '192.168.1.1'

3.1 输出函数：print(ip.split(','))

3.2 输出结果：['192.168.1.1']

3.3 解析说明：将字符串分割成列表

案例一：给你一个字符串，ip = '192.168.1.1'

3.3 输出函数：print(ip.split(',',2))

3.4 输出结果：['192.168.1.1']

3.5 解析说明：从第二个开始分割成列表

新闻名称：python求频数的函数 python计算频数
文章来源：http://cdkjz.cn/article/hpjehd.html

返回首页了解更多建站资讯

多年建站经验

多一份参考，总有益处

联系快上网，免费获得专属《策划方案》及报价

咨询相关问题或预约面谈，可以通过以下方式与我们联系

大客户专线成都：13518219792 座机：028-86922220

在线咨询提交需求

友情链接交换友情链接

遂宁网站建设手机网站成都柴油发电机组维修彭州做网站奢侈品网站建设方案尊格展览珉田数据中心雪茄烟品牌成都网站建设成都众诚伟业

成都网站建设公司地址：成都市青羊区太升南路288号锦天国际A座10层建设咨询028-86922220

专家团队为您提供成都网站建设,成都网站设计,成都品牌网站设计,成都营销型网站制作等服务,成都建网站就找快上网！ | 成都网站建设哪家好？ | 网站建设地图

网站建设

网站推广

案例

方案

电商网站开发

微信小程序

我们

联系

精准传达 • 有效沟通

查看其它板块

python求频数的函数 python计算频数

python pandas 统计某一数据出现多少次

如何高效地使用Python统计数据的频率

python想统计数据框中指定一列的频数,要使用以下哪个函数？

Python常用函数三有哪些？这7个函数使用频率最高，总算搞明白了

多一份参考，总有益处

联系快上网，免费获得专属《策划方案》及报价

大客户专线成都：13518219792 座机：028-86922220

友情链接交换友情链接

网络推广

Network promotion

网站方案

Solution

电商网站开发

E-commerce & System

我们

About Us

联系

Contact Us

精准传达 • 有效沟通

查看其它板块

python求频数的函数 python计算频数

python pandas 统计某一数据出现多少次

如何高效地使用Python统计数据的频率

python想统计数据框中指定一列的频数,要使用以下哪个函数？

Python常用函数三有哪些？这7个函数使用频率最高，总算搞明白了

相关资讯

jquery数据字典 jquery属性值获取

css中的波浪线样式 css 波浪线选择器

mysql怎么用外连接 mysql外连接语句

linux系统在哪里命令 linux系统在哪个目录

html5单选按钮男女 html表单单选按钮

jquery时间间歇 jquery时间插件

重庆html5市场前景 重庆web前端招聘

css样式如何让图片缩小 css怎么缩小图片尺寸

多一份参考，总有益处

联系快上网，免费获得专属《策划方案》及报价

大客户专线 成都：13518219792 座机：028-86922220

友情链接 交换友情链接

重庆html5市场前景重庆web前端招聘

大客户专线成都：13518219792 座机：028-86922220

友情链接交换友情链接