Python爬虫学习之获取指定网页源码


Posted in Python onJuly 30, 2019

本文实例为大家分享了Python获取指定网页源码的具体代码,供大家参考,具体内容如下

1、任务简介

前段时间一直在学习Python基础知识,故未更新博客,近段时间学习了一些关于爬虫的知识,我会分为多篇博客对所学知识进行更新,今天分享的是获取指定网页源码的方法,只有将网页源码抓取下来才能从中提取我们需要的数据。

2、任务代码

Python获取指定网页源码的方法较为简单,我在Java中使用了38行代码才获取了网页源码(大概是学艺不精),而Python中只用了6行就达到了效果。

Python中获取网页源码最简单的方法就是使用urllib包,具体代码如下:

import urllib.request    #导入urllib.request库
b = str(input("请输入:"))  #提示用户输入信息,并强制类型转换为字符串型
a = urllib.request.urlopen(b)#打开指定网址
html = a.read()       #读取网页源码
html = html.decode("utf-8") #解码为unicode码
print(html)         #打印网页源码

我输入的网址是我博客主页的网址https://blog.csdn.net/lsylsy726

运行结果如下:

Python爬虫学习之获取指定网页源码

3、总结

这篇博客介绍的方法较为简单,其实有的网站会“反爬虫”,这时就需要我们使用User-Agent或者代理,这些东西都会在后面的博客中进行更新,我预计在后面博客中更新“读取CSDN博客访问量的小程序”和“有道翻译小程序”及其他更难一些的知识,由于刚开始学习爬虫,水平有限,请大家多多包涵。

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
Python的Flask框架中@app.route的用法教程
Mar 31 Python
Python计算已经过去多少个周末的方法
Jul 25 Python
python好玩的项目—色情图片识别代码分享
Nov 07 Python
Python数据结构与算法之完全树与最小堆实例
Dec 13 Python
Windows下的Jupyter Notebook 安装与自定义启动(图文详解)
Feb 21 Python
Python 正则表达式匹配字符串中的http链接方法
Dec 25 Python
python批量获取html内body内容的实例
Jan 02 Python
python3模拟实现xshell远程执行liunx命令的方法
Jul 12 Python
python 实现兔子生兔子示例
Nov 21 Python
Python如何使用OS模块调用cmd
Feb 27 Python
python 安装移动复制第三方库操作
Jul 13 Python
Python基于execjs运行js过程解析
Nov 27 Python
django-初始配置(纯手写)详解
Jul 30 #Python
django 单表操作实例详解
Jul 30 #Python
Apache部署Django项目图文详解
Jul 30 #Python
Python 使用list和tuple+条件判断详解
Jul 30 #Python
用python wxpy管理微信公众号并利用微信获取自己的开源数据
Jul 30 #Python
Python实现二叉搜索树BST的方法示例
Jul 30 #Python
django 基于中间件实现限制ip频繁访问过程详解
Jul 30 #Python
You might like
PHP中使用smarty生成静态文件的例子
2014/04/24 PHP
php中fgetcsv()函数用法实例
2014/11/28 PHP
php写入、删除与复制文件的方法
2015/06/20 PHP
又拍云异步上传实例教程详解
2016/04/19 PHP
PHP 类与构造函数解析
2017/02/06 PHP
js调试系列 断点与动态调试[基础篇]
2014/06/18 Javascript
轻松学习jQuery插件EasyUI EasyUI创建菜单与按钮
2015/11/30 Javascript
使用JavaScript解决网页图片拉伸问题(推荐)
2016/11/25 Javascript
jquery 实现复选框的全选操作实例代码
2017/01/24 Javascript
js正则表达式校验指定字符串的方法
2018/07/23 Javascript
三种Webpack打包方式(小结)
2018/09/19 Javascript
使用 electron 实现类似新版 QQ 的登录界面效果(阴影、背景动画、窗体3D翻转)
2018/10/23 Javascript
Vue v-bind动态绑定class实例方法
2020/01/15 Javascript
centos下更新Python版本的步骤
2013/02/12 Python
详解Python编程中包的概念与管理
2015/10/16 Python
Python的Flask框架中集成CKeditor富文本编辑器的教程
2016/06/13 Python
python实现rsa加密实例详解
2017/07/19 Python
windows下Python实现将pdf文件转化为png格式图片的方法
2017/07/21 Python
python opencv之分水岭算法示例
2018/02/24 Python
python 设置输出图像的像素大小方法
2019/07/04 Python
python使用gdal对shp读取,新建和更新的实例
2020/03/10 Python
Python使用tkinter实现小时钟效果
2021/02/22 Python
Html5游戏开发之乒乓Ping Pong游戏示例(二)
2013/01/21 HTML / CSS
Canvas制作旋转的太极的示例
2018/03/09 HTML / CSS
世界闻名的衬衫制造商:Savile Row Company
2018/07/30 全球购物
限量版运动鞋和街头服饰:TheDrop
2020/09/06 全球购物
商务会议邀请函
2014/01/09 职场文书
餐饮服务食品安全责任书
2014/07/25 职场文书
营销与策划实训报告
2014/11/05 职场文书
违纪检讨书
2015/01/27 职场文书
2015年万圣节活动总结
2015/03/24 职场文书
2016年六一儿童节开幕词
2016/03/04 职场文书
你喜欢篮球吗?Python实现篮球游戏
2021/06/11 Python
Python基于百度AI实现抓取表情包
2021/06/27 Python
解析探秘fescar分布式事务实现原理
2022/02/28 Java/Android
一次Mysql update sql不当引起的生产故障记录
2022/04/01 MySQL