jupyter notebook 使用过程中python莫名崩溃的原因及解决方式


Posted in Python onApril 10, 2020

最近在使用 Python notebook时老是出现python崩溃的现象,如下图,诱发的原因是“KERNELBASE.dll”,异常代码报“40000015”。

jupyter notebook 使用过程中python莫名崩溃的原因及解决方式

折腾半天,发现我启动notebook时是用自定义startup.bat方式方式启动的,bat文件的内容为

start C:\Anaconda3\python.exe "C:/Anaconda3/Scripts/jupyter-notebook-script.py"

平时双击这个bat文件就行了,如果报这个莫名的错误,是因为权限不对,需要用管理员方式运行,如图,问题解决!

jupyter notebook 使用过程中python莫名崩溃的原因及解决方式

补充知识:jupyter notebook占用内存空间过大打不开的解决办法(包括但不限于爬虫造成的)

jupyter notebook由于超过内存限制而“锁死”的解决
这两天用爬虫爬数据的时候由于print了大量的爬取内容,让notebook内存溢出停止运行,连带着localhost:8888也崩溃了。Google Chrome的处理机制应该是杀掉内存溢出的页面,所以localhost:8888刷新一下就恢复了。

jupyter notebook 使用过程中python莫名崩溃的原因及解决方式

但是!我的code找不回来了!不知道是什么机制,在文件里看到的大小只有不到45MB,但是一旦从localhost:8888里面打开,(用任务管理器看的)Chrome占用的内存就远远超过这个数字,一直飙升到3GB的时候再次弹出来内存不足的提示,同时页面被杀掉。用pycharm尝试更是失败,比Chrome还吃内存。

jupyter notebook 使用过程中python莫名崩溃的原因及解决方式

在经历了各种尝试,上网搜了也没有发现相关情况之后,自己偶然发现了解决办法:

如何打开源文件:

在ipynb文件的地方选择打开方式,用Chrome浏览器打开,页面的观感类似于网页源码,内容是json格式的。

我能想到的几种解决办法:

第一种是笨办法(核心思想:只要能够打开源文件就可以把需要的东西复制下来),把重要的代码复制出来,比如到txt文件里面,再把格式用的一些字符去掉,如果代码量不是很多可以这样做;

这是一定能成功的办法,就是麻烦了一些,就不多说了。

第二种是重新构造一个json文件(核心思想:既然我已经知道ipynb本质是json就可以仿造构建一个可以打开的ipynb),导致问题的只是一个block,所以把有问题的block之外的所有block信息复制到一个txt文件,再重命名成ipynb,用jupyter notebook解析出来即可(甚至还可以直接继续运行);

实际可行性:我是用的第二种办法,实测可行,简单快捷。要注意的是一定要把最末尾的ipynb格式信息复制上。知道ipynb构造之后,觉得自己也能写个网页打开ipynb的程序了(大误)

第三种思想是用Python直接读取ipynb文件,然后小心地把重要代码和结果还原。(核心思想:不管后缀名是什么,只要里面是json格式就可以用Python的json包load),这种方法一定要注意的一点是,要观察好json文件里面的构造,不要全部print!不要全部print!之前怎么死的还不长记性吗?只要一print之前内存溢出的block就全部玩儿完,就又有了一个被锁死的ipynb文件。

理论可行性:文件本身的大小只有几十MB,轻轻松松就能存下,内存溢出可能是因为print的内容在网页中占用的资源成倍增加。我没有尝试这么做,因为随时需要存档备份,小心脏受不了。

看到这儿基本上问题就应该解决了,下面补充一点问题来源和教训

前因后果:为什么会内存溢出

这是一个“雄心勃勃”的爬虫,要爬的东西很多,所以会长时间运行。由于微博的反爬做的很好,我不确定什么时候会被屏蔽,同时需要debug嘛,所以就隔一段时间print爬到的网页。另外为了观察进度还用了tqdm(非常好用,墙裂推荐),是为print的另一部分内容。时间积累了很久(大概两天多)就卡崩溃了。

经验教训:

1、执行正式文件的时候还是最好备份一下,这次出问题我的结果是保存在文件里面的,是code打不开了,由于是孤本所以还是有点慌的(主要是跟微博斗智斗勇那么多天不想再搞了)

2、可以试着在文件里面写入日志,简单的就print也没关系,这种长时间运行的程序还是需要考虑周全一点

附一个ipynb文件源文件格式示例:

内容是hello world!

{
“cells”: [
{
“cell_type”: “code”,
“execution_count”: 1,
“metadata”: {},
“outputs”: [
{
“name”: “stdout”,
“output_type”: “stream”,
“text”: [
“hello world!\n”
]
}
],
“source”: [
“print(‘hello world!')”
]
},
{
“cell_type”: “code”,
“execution_count”: null,
“metadata”: {},
“outputs”: [],
“source”: []
}
],
“metadata”: {
“kernelspec”: {
“display_name”: “Python 3”,
“language”: “python”,
“name”: “python3”
},
“language_info”: {
“codemirror_mode”: {
“name”: “ipython”,
“version”: 3
},
“file_extension”: “.py”,
“mimetype”: “text/x-python”,
“name”: “python”,
“nbconvert_exporter”: “python”,
“pygments_lexer”: “ipython3”,
“version”: “3.7.3”
}
},
“nbformat”: 4,
“nbformat_minor”: 2
}

以上这篇jupyter notebook 使用过程中python莫名崩溃的原因及解决方式就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
详解在Python程序中解析并修改XML内容的方法
Nov 16 Python
深入理解NumPy简明教程---数组2
Dec 17 Python
python实现Floyd算法
Jan 03 Python
Python实现修改文件内容的方法分析
Mar 25 Python
python中找出numpy array数组的最值及其索引方法
Apr 17 Python
对命令行模式与python交互模式介绍
May 12 Python
python实现NB-IoT模块远程控制
Jun 20 Python
python调用pyaudio使用麦克风录制wav声音文件的教程
Jun 26 Python
Django REST framework 视图和路由详解
Jul 19 Python
python 基于dlib库的人脸检测的实现
Nov 08 Python
python 实现图片裁剪小工具
Feb 02 Python
简单介绍Python的第三方库yaml
Jun 18 Python
jupyter lab的目录调整及设置默认浏览器为chrome的方法
Apr 10 #Python
jupyter notebook 参数传递给shell命令行实例
Apr 10 #Python
调整Jupyter notebook的启动目录操作
Apr 10 #Python
解决jupyter notebook显示不全出现框框或者乱码问题
Apr 09 #Python
jupyter 实现notebook中显示完整的行和列
Apr 09 #Python
jupyter notebook 多行输出实例
Apr 09 #Python
Python opencv相机标定实现原理及步骤详解
Apr 09 #Python
You might like
greybox——不开新窗口看新的网页
2007/02/20 Javascript
JS 建立对象的方法
2007/04/21 Javascript
JavaScript 学习笔记 Black.Caffeine 09.11.28
2009/11/30 Javascript
javascript parseInt与Number函数的区别
2010/01/21 Javascript
js使用eval解析json实例与注意事项分享
2014/01/18 Javascript
js弹出div并显示遮罩层
2014/02/12 Javascript
JavaScript中使用stopPropagation函数停止事件传播例子
2014/08/27 Javascript
JavaScript中获取高度和宽度函数总结
2014/10/08 Javascript
前端必备神器 Snap.svg 弹动效果
2014/11/10 Javascript
js实现简单随机抽奖的方法
2015/01/27 Javascript
jQuery解析XML与传统JavaScript方法的差别实例分析
2015/03/05 Javascript
D3.js中data(), enter() 和 exit()的问题详解
2015/08/17 Javascript
JQuery自适应窗口大小导航菜单附源码下载
2015/09/01 Javascript
学习使用Bootstrap栅格系统
2017/05/11 Javascript
arcgis.js控制地图地体的显示范围超出区域自动弹回(实现思路)
2021/01/28 Javascript
Python实现控制台输入密码的方法
2015/05/29 Python
Python自定义简单图轴简单实例
2018/01/08 Python
Django框架多表查询实例分析
2018/07/04 Python
Django中数据库的数据关系:一对一,一对多,多对多
2018/10/21 Python
解决安装pycharm后不能执行python脚本的问题
2019/01/19 Python
python学生管理系统学习笔记
2019/03/19 Python
python制作图片缩略图
2019/04/30 Python
解决Python3 抓取微信账单信息问题
2019/07/19 Python
python使用信号量动态更新配置文件的操作
2020/04/01 Python
PyQt中使用QtSql连接MySql数据库的方法
2020/07/28 Python
35款精致的 CSS3 和 HTML5 网页模板 推荐
2012/08/03 HTML / CSS
css3新增颜色表示方式分享
2014/04/15 HTML / CSS
HTML5的自定义属性data-*详细介绍和JS操作实例
2014/04/10 HTML / CSS
施华洛世奇韩国官网:SWAROVSKI韩国
2018/06/05 全球购物
工业学校毕业生自荐书
2014/01/03 职场文书
小学生植树节活动总结
2014/07/04 职场文书
2014年打非治违工作总结
2014/11/13 职场文书
2014年大学班级工作总结
2014/11/14 职场文书
个人创业事迹材料
2014/12/30 职场文书
违纪学生保证书
2015/02/27 职场文书
利用Pycharm连接服务器的全过程记录
2021/07/01 Python