深入分析python中整型不会溢出问题


Posted in Python onJune 18, 2018

本次分析基于 CPython 解释器,python3.x版本

在python2时代,整型有 int 类型和 long 长整型,长整型不存在溢出问题,即可以存放任意大小的整数。在python3后,统一使用了长整型。这也是吸引科研人员的一部分了,适合大数据运算,不会溢出,也不会有其他语言那样还分短整型,整型,长整型...因此python就降低其他行业的学习门槛了。

那么,不溢出的整型实现上是否可行呢?

不溢出的整型的可行性

尽管在 C 语言中,整型所表示的大小是有范围的,但是 python 代码是保存到文本文件中的,也就是说,python代码中并不是一下子就转化成 C 语言的整型的,我们需要重新定义一种数据结构来表示和存储我们新的“整型”。

怎么来存储呢,既然我们要表示任意大小,那就得用动态的可变长的结构,显然,数组的形式能够胜任:

[longintrepr.h]
struct _longobject {
PyObject_VAR_HEAD
int *ob_digit;
};

长整型的保存形式

长整型在python内部是用一个 int 数组( ob_digit[n] )保存值的. 待存储的数值的低位信息放于低位下标, 高位信息放于高下标.比如要保存 123456789 较大的数字,但我们的int只能保存3位(假设):

ob_digit[0] = 789;
ob_digit[1] = 456;
ob_digit[2] = 123;

低索引保存的是地位,那么每个 int 元素保存多大的数合适?有同学会认为数组中每个int存放它的上限(2^31 - 1),这样表示大数时,数组长度更短,更省空间。但是,空间确实是更省了,但操作会代码麻烦,比方大数做乘积操作,由于元素之间存在乘法溢出问题,又得多考虑一种溢出的情况。

怎么来改进呢?在长整型的 ob_digit 中元素理论上可以保存的int类型有 32 位,但是我们只保存 15 位,这样元素之间的乘积就可以只用 int 类型保存即可, 结果做位移操作就能得到尾部和进位 carry 了,定义位移长度为 15:

#define PyLong_SHIFT 15
#define PyLong_BASE ((digit)1 << PyLong_SHIFT)
#define PyLong_MASK ((digit)(PyLong_BASE - 1))

PyLong_MASK 也就是 0b111111111111111 ,通过与它做位运算 与 的操作就能得到低位数。

有了这种存放方式,在内存空间允许的情况下,我们就可以存放任意大小的数字了。

长整型的运算

加法与乘法运算都可以使用我们小学的竖式计算方法,例如对于加法运算:

ob_digit[2] ob_digit[1] ob_digit[0]
加数a 23 934 543
加数b + 454 632
结果z 24 389 175

为方便理解,表格展示的是数组中每个元素保存的是 3 位十进制数,计算结果保存在变量z中,那么 z 的数组最多只要 size_a + 1 的空间(两个加数中数组较大的元素个数 + 1),因此对于加法运算,可以这样来处理:

[longobject.c]
static PyLongObject * x_add(PyLongObject *a, PyLongObject *b) {
  int size_a = len(a), size_b = len(b);
  PyLongObject *z;
  int i;
  int carry = 0; // 进位
  
  // 确保a是两个加数中较大的一个
  if (size_a < size_b) {
    // 交换两个加数
    swap(a, b);
    swap(&size_a, &size_b);
  }
  
  z = _PyLong_New(size_a + 1); // 申请一个能容纳size_a+1个元素的长整型对象
  for (i = 0; i < size_b; ++i) {
    carry += a->ob_digit[i] + b->ob_digit[i];
    z->ob_digit[i] = carry & PyLong_MASK;  // 掩码
    carry >>= PyLong_SHIFT;         // 移除低15位, 得到进位
  }
  for (; i < size_a; ++i) {          // 单独处理a中高位数字
    carry += a->ob_digit[i];
    z->ob_digit[i] = carry & PyLong_MASK;
    carry >>= PyLong_SHIFT;
  }
  z->ob_digit[i] = carry;
  return long_normalize(z);          // 整理元素个数
  
}

这部分的过程就是,先将两个加数中长度较长的作为第一个加数,再为用于保存结果的 z 申请空间,两个加数从数组从低位向高位计算,处理结果的进位,将结果的低 15 位赋值给 z 相应的位置。最后的 long_normalize(z) 是一个整理函数,因为我们 z 申请了 a_size + 1 的空间,但不意味着 z 会全部用到,因此这个函数会做一些调整,去掉多余的空间,数组长度调整至正确的数量,若不方便理解,附录将给出更利于理解的python代码。

竖式计算不是按个位十位来计算的吗,为什么这边用整个元素?

竖式计算方法适用与任何进制的数字,我们可以这样来理解,这是一个 32768 (2的15次方) 进制的,那么就可以把数组索引为 0 的元素当做是 “个位”,索引 1 的元素当做是 “十位”。

乘法运算

乘法运算一样可以用竖式的计算方式,两个乘数相乘,存放结果的 z 的元素个数为 size_a + size_b 即可:

操作 ob_digit[2] ob_digit[1] ob_digit[0]
乘数a 23 934 543
乘数b * 454 632
结果z 15 126 631 176
10 866 282 522
结果z 10 881 409 153 176

这里需要主意的是,当乘数 b 用索引 i 的元素进行计算时,结果 z 也是从 i 索引开始保存。先创建 z 并初始化为 0,这 z 上做累加操作,加法运算则可以利用前面的 x_add 函数:

// 为方便理解,会与cpython中源码部分稍有不同
static PyLongObject * x_mul(PyLongObject *a, PyLongObject *b)
{
  int size_a = len(a), size_b = len(b);
  PyLongObject *z = _PyLong_New(size_a + size_b);
  memset(z->ob_digit, 0, len(z) * sizeof(int)); // z 的数组清 0
  
  for (i = 0; i < size_b; ++i) {
    int carry = 0;     // 用一个int保存元素之间的乘法结果
    int f = b->ob_digit[i]; // 当前乘数b的元素
    
    // 创建一个临时变量,保存当前元素的计算结果,用于累加
    PyLongObject *temp = _PyLong_New(size_a + size_b);
    memset(temp->ob_digit, 0, len(temp) * sizeof(int)); // temp 的数组清 0
    
    int pz = i; // 存放到临时变量的低位
    
    for (j = 0; j < size_a; ++j) {
      carry = f * a[j] + carry;
      temp[pz] = carry & PyLong_MASK; // 取低15位
      carry = carry >> PyLong_SHIFT; // 保留进位
      pz ++;
    }
    if (carry){   // 处理进位
      carry += temp[pz];
      temp[pz] = carry & PyLong_MASK;
      carry = carry >> PyLong_SHIFT;
    }
    if (carry){
      temp[pz] += carry & PyLong_MASK;
    }
    temp = long_normalize(temp);
    z = x_add(z, temp);
  }
  
  return z
  
}

这大致就是乘法的处理过程,竖式乘法的复杂度是n^2,当数字非常大的时候(数组元素个数超过 70 个)时,python会选择性能更好,更高效的 Karatsuba multiplication 乘法运算方式,这种的算法复杂度是 3nlog3≈3n1.585,当然这种计算方法已经不是今天讨论的内容了。有兴趣的小伙伴可以去了解下。

总结

要想支持任意大小的整数运算,首先要找到适合存放整数的方式,本篇介绍了用 int 数组来存放,当然也可以用字符串来存储。找到合适的数据结构后,要重新定义整型的所有运算操作,本篇虽然只介绍了加法和乘法的处理过程,但其实还需要做很多的工作诸如减法,除法,位运算,取模,取余等。

python代码以文本形式存放,因此最后,还需要一个将字符串形式的数字转换成这种整型结构:

[longobject.c]
PyObject * PyLong_FromString(const char *str, char **pend, int base)
{
}

这部分不是本篇的重点,有兴趣的同学可以看看这个转换的过程。

参考:https://github.com/python/cpython/blob/master/Objects/longobject.c

附录

# 例子中的表格中,数组元素最多存放3位整数,因此这边设置1000
# 对应的取低位与取高位也就变成对 1000 取模和取余操作
PyLong_SHIFT = 1000
PyLong_MASK = 999

# 以15位长度的二进制
# PyLong_SHIFT = 15
# PyLong_MASK = (1 << 15) - 1

def long_normalize(num):
  """
  去掉多余的空间,调整数组的到正确的长度
  eg: [176, 631, 0, 0] ==> [176, 631]
  :param num:
  :return:
  """
  end = len(num)
  while end >= 1:
    if num[end - 1] != 0:
      break
    end -= 1

  num = num[:end]
  return num

def x_add(a, b):
  size_a = len(a)
  size_b = len(b)
  carry = 0

  # 确保 a 是两个加数较大的,较大指的是元素的个数
  if size_a < size_b:
    size_a, size_b = size_b, size_a
    a, b = b, a

  z = [0] * (size_a + 1)
  i = 0
  while i < size_b:
    carry += a[i] + b[i]
    z[i] = carry % PyLong_SHIFT
    carry //= PyLong_SHIFT
    i += 1

  while i < size_a:
    carry += a[i]
    z[i] = carry % PyLong_SHIFT
    carry //= PyLong_SHIFT
    i += 1
  z[i] = carry

  # 去掉多余的空间,数组长度调整至正确的数量
  z = long_normalize(z)

  return z


def x_mul(a, b):
  size_a = len(a)
  size_b = len(b)
  z = [0] * (size_a + size_b)

  for i in range(size_b):
    carry = 0
    f = b[i]

    # 创建一个临时变量
    temp = [0] * (size_a + size_b)
    pz = i
    for j in range(size_a):
      carry += f * a[j]
      temp[pz] = carry % PyLong_SHIFT
      carry //= PyLong_SHIFT
      pz += 1

    if carry:  # 处理进位
      carry += temp[pz]
      temp[pz] = carry % PyLong_SHIFT
      carry //= PyLong_SHIFT
      pz += 1

    if carry:
      temp[pz] += carry % PyLong_SHIFT
    temp = long_normalize(temp)
    z = x_add(z, temp)  # 累加

  return z


a = [543, 934, 23]
b = [632, 454]
print(x_add(a, b))
print(x_mul(a, b))
Python 相关文章推荐
深入理解Python中的元类(metaclass)
Feb 14 Python
归纳整理Python中的控制流语句的知识点
Apr 14 Python
如何利用Fabric自动化你的任务
Oct 20 Python
python里使用正则表达式的组嵌套实例详解
Oct 24 Python
python爬虫自动创建文件夹的功能
Aug 01 Python
pyqt5中QThread在使用时出现重复emit的实例
Jun 21 Python
关于Tensorflow分布式并行策略
Feb 03 Python
tensorflow 环境变量设置方式
Feb 06 Python
Python BeautifulReport可视化报告代码实例
Apr 13 Python
Python Charles抓包配置实现流程图解
Sep 29 Python
python 算法题——快乐数的多种解法
May 27 Python
Python编程编写完善的命令行工具
Sep 15 Python
Python登录注册验证功能实现
Jun 18 #Python
详解python3中zipfile模块用法
Jun 18 #Python
python爬取个性签名的方法
Jun 17 #Python
Python爬虫包BeautifulSoup学习实例(五)
Jun 17 #Python
Python爬虫包BeautifulSoup实例(三)
Jun 17 #Python
Python爬虫包BeautifulSoup异常处理(二)
Jun 17 #Python
Python爬虫包BeautifulSoup简介与安装(一)
Jun 17 #Python
You might like
PHP 全角转半角实现代码
2010/05/16 PHP
解析PHP中ob_start()函数的用法
2013/06/24 PHP
php使用fsockopen函数发送post,get请求获取网页内容的方法
2014/11/15 PHP
PHP生成加减算法方式的验证码实例
2018/03/12 PHP
dojo 之基础篇(三)之向服务器发送数据
2007/03/24 Javascript
获取div编辑框,textarea,input text的光标位置 兼容IE,FF和Chrome的方法介绍
2012/11/08 Javascript
Javascript 多浏览器兼容总结(实战经验)
2013/10/30 Javascript
用正则表达式替换图片地址img标签
2013/11/22 Javascript
基于javascript实现判断移动终端浏览器版本信息
2014/12/09 Javascript
FullCalendar日历插件应用之数据展现(一)
2015/12/23 Javascript
让编辑器支持word复制黏贴、截屏的js代码
2016/10/17 Javascript
Angular.JS内置服务$http对数据库的增删改使用教程
2017/05/07 Javascript
详解vue.js的devtools安装
2017/05/26 Javascript
JavaScript阻止表单提交方法(附代码)
2017/08/15 Javascript
Vue异步组件处理路由组件加载状态的解决方案
2018/09/07 Javascript
解决Vue打包上线之后部分CSS不生效的问题
2019/11/12 Javascript
使用Python读写文本文件及编写简单的文本编辑器
2016/03/11 Python
Python实现替换文件中指定内容的方法
2018/03/19 Python
Python简单获取网卡名称及其IP地址的方法【基于psutil模块】
2018/05/24 Python
python使用正则表达式来获取文件名的前缀方法
2018/10/21 Python
Python完成哈夫曼树编码过程及原理详解
2019/07/29 Python
如何通过python实现人脸识别验证
2020/01/17 Python
TensorFlow2.0矩阵与向量的加减乘实例
2020/02/07 Python
Python实现上下文管理器的方法
2020/08/07 Python
python爬虫beautifulsoup库使用操作教程全解(python爬虫基础入门)
2021/02/19 Python
美国羊皮公司:Overland
2018/01/15 全球购物
美国潜水装备、水肺潜水和浮潜设备商店:Leisure Pro
2018/08/08 全球购物
中专生职业生涯规划书范文
2014/01/10 职场文书
送温暖献爱心活动总结
2014/07/08 职场文书
2014年食堂工作总结
2014/11/20 职场文书
节约用电倡议书
2015/04/28 职场文书
预备党员转正意见
2015/06/01 职场文书
诉讼和解协议书
2016/03/23 职场文书
话题作文之生命的旋律
2019/12/17 职场文书
《艾尔登法环》1.03.3补丁上线 碎星伤害调整
2022/04/07 其他游戏
Win11 Dev 预览版25174.1000发布 (附更新修复内容汇总)
2022/08/05 数码科技