python获取整个网页源码的方法


Posted in Python onAugust 03, 2020

1、Python中获取整个页面的代码:

import requests
res = requests.get('https://blog.csdn.net/yirexiao/article/details/79092355')
res.encoding = 'utf-8'
print(res.text)

2、运行结果

python获取整个网页源码的方法

实例扩展:

from bs4 import BeautifulSoup
import time,re,urllib2
t=time.time()
websiteurls={}
def scanpage(url):
 websiteurl=url
 t=time.time()
 n=0
 html=urllib2.urlopen(websiteurl).read()
 soup=BeautifulSoup(html)
 pageurls=[]
 Upageurls={}
 pageurls=soup.find_all("a",href=True)
 for links in pageurls:
  if websiteurl in links.get("href") and links.get("href") not in Upageurls and links.get("href") not in websiteurls:
   Upageurls[links.get("href")]=0
 for links in Upageurls.keys():
  try:
   urllib2.urlopen(links).getcode()
  except:
   print "connect failed"
  else:
   t2=time.time()
   Upageurls[links]=urllib2.urlopen(links).getcode()
   print n,
   print links,
   print Upageurls[links]
   t1=time.time()
   print t1-t2
  n+=1
 print ("total is "+repr(n)+" links")
 print time.time()-t
scanpage(http://news.163.com/)

到此这篇关于python获取整个网页源码的方法的文章就介绍到这了,更多相关python如何获取整个页面内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木!

Python 相关文章推荐
python获取android设备的GPS信息脚本分享
Mar 06 Python
举例介绍Python中的25个隐藏特性
Mar 30 Python
Python的装饰器使用详解
Jun 26 Python
python中numpy的矩阵、多维数组的用法
Feb 05 Python
在Python中pandas.DataFrame重置索引名称的实例
Nov 06 Python
解决python3中的requests解析中文页面出现乱码问题
Apr 19 Python
python字典一键多值实例代码分享
Jun 14 Python
python线程中的同步问题及解决方法
Aug 29 Python
Python3 Click模块的使用方法详解
Feb 12 Python
Django {{ MEDIA_URL }}无法显示图片的解决方式
Apr 07 Python
Python logging模块handlers用法详解
Aug 14 Python
python实现单机五子棋
Aug 28 Python
flask开启多线程的具体方法
Aug 02 #Python
基于opencv实现简单画板功能
Aug 02 #Python
django下创建多个app并设置urls方法
Aug 02 #Python
Django如何在不停机的情况下创建索引
Aug 02 #Python
如何用Anaconda搭建虚拟环境并创建Django项目
Aug 02 #Python
如何解决flask修改静态资源后缓存文件不能及时更改问题
Aug 02 #Python
Flask缓存静态文件的具体方法
Aug 02 #Python
You might like
《星际争霸II》全新指挥官斯台特曼现已上线
2020/03/08 星际争霸
社区(php&&mysql)一
2006/10/09 PHP
织梦模板标记简介
2007/03/11 PHP
php cookie使用方法学习笔记分享
2013/11/07 PHP
PHP队列用法实例
2014/11/05 PHP
PHP生成指定随机字符串的简单实现方法
2015/04/01 PHP
浅析PHP反序列化中过滤函数使用不当导致的对象注入问题
2020/02/15 PHP
基于jQuery的试卷自动排版系统实现代码
2011/01/06 Javascript
Jquery实现鼠标移上弹出提示框、移出消失思路及代码
2013/05/19 Javascript
js面向对象之静态方法和静态属性实例分析
2015/01/10 Javascript
jQuery结合AJAX之在页面滚动时从服务器加载数据
2015/06/30 Javascript
js实现圆盘记速表
2015/08/03 Javascript
浅析JavaScript Array和string的转换(推荐)
2016/05/20 Javascript
jQuery前端开发35个小技巧
2016/05/24 Javascript
微信小程序开发之视频播放器 Video 弹幕 弹幕颜色自定义实例
2016/12/08 Javascript
javascript中闭包概念与用法深入理解
2016/12/15 Javascript
详解在Vue中通过自定义指令获取dom元素
2017/03/04 Javascript
JS实现百度搜索接口及链接功能实例代码
2018/02/02 Javascript
vue 弹框产生的滚动穿透问题的解决
2018/09/21 Javascript
详解React 服务端渲染方案完美的解决方案
2018/12/14 Javascript
vue中使用带隐藏文本信息的图片、图片水印的方法
2020/04/24 Javascript
VSCode Vue开发推荐插件和VSCode快捷键(小结)
2020/08/08 Javascript
详解vue v-model
2020/08/31 Javascript
js实现石头剪刀布游戏
2020/10/11 Javascript
Python采用socket模拟TCP通讯的实现方法
2014/11/19 Python
Python实现抓取页面上链接的简单爬虫分享
2015/01/21 Python
Python使用while循环花式打印乘法表
2019/01/28 Python
html5视频播放_动力节点Java学院整理
2017/07/13 HTML / CSS
AE美国鹰美国官方网站:American Eagle Outfitters
2016/08/22 全球购物
戴尔新西兰官网:Dell New Zealand
2020/01/07 全球购物
编程输出如下图形
2013/11/24 面试题
大学自荐信
2013/12/12 职场文书
年终奖发放方案
2014/06/02 职场文书
2014年干部作风建设总结
2014/10/23 职场文书
2015中学教师个人工作总结
2015/07/22 职场文书
90后经典动画片排行:《数码宝贝》第二,《小鲤鱼历险记》在榜
2022/03/18 日漫