df.drop_duplicates('item_name')
站在用户的角度思考问题,与客户深入沟通,找到淮阳网站设计与淮阳网站推广的解决方案,凭借多年的经验,让设计与互联网技术结合,创造个性化、用户体验好的作品,建站类型包括:网站制作、成都网站建设、企业官网、英文网站、手机端网站、网站推广、域名注册、网络空间、企业邮箱。业务覆盖淮阳地区。
方法一:
df.drop_duplicates('item_name').count()
方法二:
df['item_name'].nunique()
结果:50
附:nunique()和unique()的区别:
unique()是以 数组形式(numpy.ndarray)返回列的所有唯一值(特征的所有唯一值)
nunique()即返回的是唯一值的个数
比如:df['item_name'].unique()
要求:将下表中经验列将按周统计的转换为经验不限,保留学历
df1['经验'] = df1['经验'].apply(lambda x: '经验不限'+ x[-2:] if '周' in x else x)
#解释:将‘5天/周6个月’变成‘经验不限’,然后保留学历‘本科’
方法二:定义函数
def dataInterval(ss):
if '周' in ss:
return '经验不限'+ ss[-2:]
return ss
df1['经验'] = df1['经验'].apply(dataInterval)
方法一:
mylist = set(say) #say为所要统计的列表
for item in mylist: #将列表中的元素无重复的抽取出来,赋值给另一个列表
print item + str( say.count(item)) #list.count(item) 输出item在list中出现的次数
方法二:
counts = { } #字典
for x in time_zones: #time_zones 为列表
if x in counts:
counts[x] += 1
else:
counts[x] = 1
print counts
方法三:
(Series与Datafram用法相同)
import numpy as np
import pandas as pd
from pandas import DataFrame
from pandas import Series
ss = Series(['Tokyo', 'Nagoya', 'Nagoya', 'Osaka', 'Tokyo', 'Tokyo'])
ss.value_counts() #value_counts 直接用来计算series里面相同数据出现的频率
扩展资料:
python函数的其他高级用法
1.使用函数变量:
Python 的函数也是一种值:所有函数都是 function 对象,这意味着可以把函数本身赋值给变量,就像把整数、浮点数、列表、元组赋值给变量一样。
2.使用函数作为函数形参:
有时候需要定义一个函数,该函数的大部分计算逻辑都能确定,但某些处理逻辑暂时无法确定,这意昧着某些程序代码需要动态改变,如果希望调用函数时能动态传入这些代码,那么就需要在函数中定义函数形参,这样即可在调用该函数时传入不同的函数作为参数,从而动态改变这段代码。
3.使用函数作为返回值:
程序中,定义了一个 get_math_func() 函数,该函数将返回另一个函数。接下来在 get_math_func() 函数体内的 ①、②、③ 号粗体字代码分别定义了三个局部函数,最后 get_math_func() 函数会根据所传入的参数,使用这三个局部函数之一作为返回值。
在定义了会返回函数的 get_math_func() 函数之后,接下来程序调用 get_math_func() 函数时即可返回所需的函数。
有阶乘函数,Numpy中,mat必须是2维的,但是array可以是多维的(1D,2D,3D····ND). Matrix是Array的一个小的分支,包含于Array。所以matrix 拥有array的所有特性。
在numpy中matrix的主要优势是:相对简单的乘法运算符号。例如,a和b是两个matrices,那么a*b,就是矩阵积。
若a=mat([1,2,3]) 是矩阵,则 a.A 则转换成了数组,反之,a.M则转换成了矩阵。
扩展资料:
常用的Numpy运算:
取矩阵中的某一行 ss[1,:] 或该行的某两列 ss[1,0:2]
将数组转换成矩阵 randMat=mat(random.rand(4,4))
矩阵求逆 randMat.I
单位阵 eye(4)
零矩阵 zeros((x,y)) 建立x行y列的零矩阵。
最大值和最小值 a.max(),a.min() ,而a.max(0) 表示按列选取每列的最大值。最大/小元素的下标 a.argmax(),a.argmin()
#作为方法x.sum() #所有元素相加x.sum(axis=0) #按列相加x.sum(axis=1) #按行相加#作为函数sum(a,axis=0)ss.mean()
mean(a,axis=0(或1)) #按列或行求均值var(a)var(a,axis=0(或1)) #按列或行求方差。
std(a)std(a,axis=0(或1)) #按列或行求标准差ss.T或ss.transpose() #转置。
函数缺少返回值。print(ss,hub(ss, 3)) 对于组合数据类型的全局变量,如果在函数内部没有被真实创建的同名变量,则函数内部不可以直接使用并修改全局变量的值 .Python由荷兰数学和计算机科学研究学会的吉多·范罗苏姆于1990 年代初设计,作为一门叫做ABC语言的替代品。Python提供了高效的高级数据结构,还能简单有效地面向对象编程。Python语法和动态类型,以及解释型语言的本质,使它成为多数平台上写脚本和快速开发应用的编程语言,[2]随着版本的不断更新和语言新功能的添加,逐渐被用于独立的、大型项目的开发。