python3 整数类型PyLongObject 和PyObject源码分析
一 测试环境介绍和准备
测试环境:
操作系统:windows10
Python版本:3.7.0 下载地址
VS版本:vs2015社区版(免费) 下载地址
win10SDK(安装vs2015是可以选择,如果没有安装则需要独立安装)
http://ffmpeg.club/python
二 如何查看源码
1 下载python源码
https://www.python.org/ftp/python/3.7.0/Python-3.7.0.tar.xz
http://www.ffmpeg.club/python
下载后解压缩
使用vs2015或者vs2017打开
Python-3.7.0\PCbuild\pcbuild.sln 解决方案文件
打开pythoncore项目可以找到\include\object.h文件
创新互联是一家业务范围包括IDC托管业务,雅安服务器托管、主机租用、主机托管,四川、重庆、广东电信服务器租用,内蒙古服务器托管,成都网通服务器托管,成都服务器租用,业务范围遍及中国大陆、港澳台以及欧美等多个国家及地区的互联网数据服务公司。
三 源码分析
python源码版本 python3.7.0
在python中所有的类型都可以转为PyObject类型,单python用的是c语言,并没有继承机制,我们可以通过源码看它试如何实现的,我们先看PyObject源码
1 PyObject 源码
typedef struct _object {
_PyObject_HEAD_EXTRA
Py_ssize_t ob_refcnt;
struct _typeobject *ob_type;
} PyObject;
1-1 _PyObject_HEAD_EXTRA 源码
我们先看第一个成员是一个宏 _PyObject_HEAD_EXTRA,这个宏是如下定义
#ifdef Py_TRACE_REFS
/ Define pointers to support a doubly-linked list of all live heap objects. /
#define _PyObject_HEAD_EXTRA \
struct _object _ob_next; \
struct _object _ob_prev;
#define _PyObject_EXTRA_INIT 0, 0,
#else
#define _PyObject_HEAD_EXTRA
#define _PyObject_EXTRA_INIT
#endif
通过代码我们可以看出,它根据环境给_PyObject_HEAD_EXTRA设置的值有可能是空的,或者是一个双向链表。通过编译代码我们知道,他在debug版本的python中是用的双向链表,而在release版本中是空。
1-2 Py_ssize_t ob_refcnt 引用计数
Py_ssize_t 类型在32位程序中就是int,在64位win程序中是__int64
引用计数的策略后面我们专门写文章分析
1-3 struct _typeobject ob_type;
源码比较长,就不全部列出来,这个结构体中包含了一个PyObject对象的所有相关操作函数和属性,比如对象创建和销毁函数,print对象的序列化函数等,存储方式都是通过函数指针。所以每种python类型都会对各类操作函数指针做赋值设定。
其中的PyObject_VAR_HEAD宏内容如下
typedef struct {
PyObject ob_base;
Py_ssize_t ob_size; / Number of items in variable part */
} PyVarObject;
2 PyLongObject 整数对象
digit
struct _longobject {
PyObject_VAR_HEAD
digit ob_digit[1];
};
2-1 小数预处理
对于比较小的数(-5到257 )直接返回初始化好的值,所以说大量的小整数时,不会新增额外的空间
do if (-NSMALLNEGINTS <= ival && ival < NSMALLPOSINTS) { \
return get_small_int((sdigit)ival); \
} while(0)
2-2 按照数字的发小分配空间,以unsigned short为单位
数字少于16位也就是2个字节的,用一个digit (unsigned short) 存放
数字少于32位也就是4个字节的,用两个个digit (unsigned short) 存放
2-3 大数处理
如果是超大数,就用多个字节存放,由于变量就是一个 unsigned long,先看一下源码:
对于不同的系统,大数能表示的范围不一致,因为数字采用的是unsigned long存放,在不同的系统大小不一致,可以见如下表
其中 windows 64位使用的是 LLP64所以 在window中python数字的最大值也就是4个字节,如果用它来存放64位指针的地址,就会丢失数据。
在linux(ubuntu16.04 64)使用的是LP64,,所以数字最大值就是8个字节。
相关视频可以观看
http://edu.51cto.com/course/15278.html