pythonpandas学习笔记-快上网网站建设公司

pythonpandas学习笔记

Pandas使用一个二维的数据结构DataFrame来表示表格式的数据
DataFrame有四个重要的属性：
index：行索引。
columns：列索引。
values：值的二维数组。
name：名字
data = pd.DataFrame(rec, columns = [u"姓名",u"业绩" ])
DataFrame方法函数的第一个参数是数据源，第二个参数columns是输出数据表的表头，或者说是表格的字段名
DataFrame(sequence)，通过序列构建，序列中的每个元素是一个字典
data.groupby([u'业绩']).sum() 以业务为分组统计某一列的总和size()：就是count sum()：分组求和
导出数据csvdata.to_csv(u"D:\scripts\learn\Result.csv", index= True, header=[u'雇员', u'销售业绩'], encoding="utf_8_sig")
解决保存csv文件后，中文乱码问题。encoding="utf_8_sig"
Sorted = data.sort_values([u"业绩"], ascending=False) 以某列进行排序，然后取前几的值 Sorted.head(3)
pd.read_csv('f:\1024.csv') 读取CSV文件
print df.head() 读取前几行数据,默认5
print df.dtypes 读物数据类型
print df.describe(include='all') 读取统计信息
print df.columns 打印出列的信息
print df.index 打印出行的索引信息
print df.T 行列互置
print df.ix[:, 0].head() ix[行,列] 读取指定的行列数据, head() 默认读取前5行
df.drop(df.columns[[1, 2]], axis = 1).head() 删除指定的列
bric = pd.read_excel('/usr/test.xlsx') 处理xlsx文件
print bric.loc['Br'] #读取行用函数.loc,但显示是以列显示的
#显示'Br'这行的'language'的值有下面几种方法：
1.一起选择
print bric.loc['Br','language']
2.取列再取行
print bric['language'].loc['Br']
3.取行再取列
print bric.loc['Br']['language']
4.值就直接['列名']
print bric['language']
插入列：直接bric['要插入的列名']=[要插入的列表数据] ric['aa']=['123','kk','123','mm']
#插入行：bric.loc['Afric']=[25,20,'english','aa']
数据清洗
loandata=pd.DataFrame(pd.read_excel('loandata.xlsx'))
1.数据表中的重复值
loandata.duplicated() 判断重复值
loandata.drop_duplicates() 删除重复值
2.数据表中的空值/缺失值
loandata.isnull() 空值 loandata['列名'].isnull().value_counts() #统计某个列的非空值数量
loandata.notnull() 非空值
空值有两种处理的方法，第一种是使用fillna函数对空值进行填充，可以选择填充0值或者其他任意值。第二种方法是使用dropna函数直接将包含空值的数据删除
loandata.fillna(0) 填充空值
loandata.dropna() 删除空值
3.数据间的空格
loandata['term']=loandata['term'].map(str.strip) 利用strip 进行清查数据间的空格
loandata['term']=loandata['term'].map(str.upper) 大写
loandata['term']=loandata['term'].map(str.lower) 小写
loandata['term']=loandata['term'].map(str.title) 首字母大写
loandata['emp_length'].apply(lambda x: x. isalnum ())判断是否是数字
loandata['emp_length'].apply(lambda x: x. isdigit ())
loandata['emp_length'].apply(lambda x: x.isalpha())
4更改数据格式
loandata['loan_amnt']=loandata['loan_amnt'].astype(np.int64)
6.数据分组
bins = [0, 5, 10, 15, 20]
group_names = ['A', 'B', 'C', 'D']
loandata['categories'] = pd.cut(loandata['open_acc'], bins, labels=group_names)
对某一列的值进行等级分类
7.数据分列
grade_split = pd.DataFrame((x.split('-') for x in loandata.grade),index=loandata.index,columns=['grade','sub_grade']) 指定分列的数据行所有保持不变
loandata=pd.merge(loandata,grade_split,right_index=True, left_index=True) 合并数据

为西湖等地区用户提供了全套网页设计制作服务，及西湖网站建设行业解决方案。主营业务为成都网站设计、成都网站制作、西湖网站设计，以传统方式定制建设网站，并提供域名空间备案等一条龙服务，秉承以专业、用心的态度为用户提供真诚的服务。我们深信只要达到每一位用户的要求，就会得到认可，从而选择与我们长期合作。这样，我们也可以走得更远！

本文题目：pythonpandas学习笔记
网站路径：http://cdkjz.cn/article/jjijed.html

多年建站经验

多一份参考，总有益处

联系快上网，免费获得专属《策划方案》及报价

咨询相关问题或预约面谈，可以通过以下方式与我们联系

网站建设

网站推广

案例

方案

电商网站开发

微信小程序

我们

联系

精准传达 • 有效沟通

查看其它板块

pythonpandas学习笔记

多一份参考，总有益处

联系快上网，免费获得专属《策划方案》及报价

大客户专线成都：13518219792 座机：028-86922220

友情链接交换友情链接

网络推广

Network promotion

网站方案

Solution

电商网站开发

E-commerce & System

我们

About Us

联系

Contact Us

精准传达 • 有效沟通

查看其它板块

pythonpandas学习笔记

相关资讯

山东企业微信怎么注销 企业版微信怎么注销

鼠标手掌css样式 css鼠标样式大全

山姆企业微信怎么加人 山姆企业微信怎么加人进去

企业微信怎么打开乐享 企业微信乐享平台怎么用

jsp页面没有css样式 jsp页面设计css

去掉全部css样式 去掉全部css样式的方法

微信收款小程序在哪 微信收款小程序怎么找

电商小程序卡片 小程序卡券功能

多一份参考，总有益处

联系快上网，免费获得专属《策划方案》及报价

大客户专线 成都：13518219792 座机：028-86922220

友情链接 交换友情链接

山东企业微信怎么注销企业版微信怎么注销

山姆企业微信怎么加人山姆企业微信怎么加人进去

企业微信怎么打开乐享企业微信乐享平台怎么用

去掉全部css样式去掉全部css样式的方法

微信收款小程序在哪微信收款小程序怎么找

电商小程序卡片小程序卡券功能

大客户专线成都：13518219792 座机：028-86922220

友情链接交换友情链接