python3简单实现微信爬虫


Posted in Python onApril 09, 2015

使用ghost.py 通过搜搜 的微信搜索来爬取微信公共账号的信息

# -*- coding: utf-8 -*-
import sys
reload(sys)
import datetime
import time
sys.setdefaultencoding("utf-8")
 
from ghost import Ghost
ghost = Ghost(wait_timeout=20)
 
url="http://weixin.sogou.com/gzh?openid=oIWsFt8JDv7xubXz5E3U41T0eFbk"
page,resources = ghost.open(url)
result, resources = ghost.wait_for_selector("#wxmore a")
 
from bs4 import BeautifulSoup
c=0
while True:
  if c>=30:
    break
 
  soup = BeautifulSoup(ghost.content)
 
  for wx in soup.find_all("h4"):
    print wx
 
  page, resources = ghost.evaluate(
    """
    var div1 = document.getElementById("wxbox");
    div1.innerHTML = '';
    """)
  ghost.click("#wxmore a")
  result, resources = ghost.wait_for_selector(".wx-rb3")
 
  c=c+1
  pass

以上所述就是本文的全部内容了,希望对大家学习Python能够有所帮助

Python 相关文章推荐
python获得图片base64编码示例
Jan 16 Python
一个超级简单的python web程序
Sep 11 Python
使用Python3编写抓取网页和只抓网页图片的脚本
Aug 20 Python
python for循环输入一个矩阵的实例
Nov 14 Python
Python自定义一个类实现字典dict功能的方法
Jan 19 Python
Python3.5内置模块之time与datetime模块用法实例分析
Apr 27 Python
Python正则表达式匹配日期与时间的方法
Jul 07 Python
Tensorflow Summary用法学习笔记
Jan 10 Python
Python多线程获取返回值代码实例
Feb 17 Python
Python TKinter如何自动关闭主窗口
Feb 26 Python
关于keras.layers.Conv1D的kernel_size参数使用介绍
May 22 Python
理解深度学习之深度学习简介
Apr 14 Python
初步理解Python进程的信号通讯
Apr 09 #Python
详解Python中的多线程编程
Apr 09 #Python
用Python解析XML的几种常见方法的介绍
Apr 09 #Python
在Python中使用pngquant压缩png图片的教程
Apr 09 #Python
python optparse模块使用实例
Apr 09 #Python
Python中处理时间的几种方法小结
Apr 09 #Python
Python CSV模块使用实例
Apr 09 #Python
You might like
PHP输出控制功能在简繁体转换中的应用
2006/10/09 PHP
php常用Stream函数集介绍
2013/06/24 PHP
php中的动态调用实例分析
2015/01/07 PHP
WordPress中用于更新伪静态规则的PHP代码实例讲解
2015/12/18 PHP
YII2 实现多语言配置的方法分享
2017/01/11 PHP
jQuery ajax cache缓存问题
2010/07/01 Javascript
分享10篇优秀的jQuery幻灯片制作教程及应用案例
2011/04/16 Javascript
jquery.form.js用法之清空form的方法
2014/03/07 Javascript
JS跨域问题详解
2014/11/25 Javascript
javascript模拟评分控件实现方法
2015/05/13 Javascript
JS实现的倒计时效果实例(2则实例)
2015/12/23 Javascript
javascript合并表格单元格实例代码
2016/01/03 Javascript
jQuery实现的左右移动焦点图效果
2016/01/14 Javascript
基于Bootstrap3表格插件和分页插件实例详解
2016/05/17 Javascript
通过vue提供的keep-alive减少对服务器的请求次数
2018/04/01 Javascript
Vue Promise的axios请求封装详解
2018/08/13 Javascript
webpack4+react多页面架构的实现
2018/10/25 Javascript
vue 实现走马灯效果
2019/10/28 Javascript
Vue 3.0 全家桶抢先体验
2020/04/28 Javascript
vue实现折线图 可按时间查询
2020/08/21 Javascript
python基础教程之缩进介绍
2014/08/29 Python
Python实现PS图像调整之对比度调整功能示例
2018/01/26 Python
基于python实现KNN分类算法
2020/04/23 Python
Python使用reportlab模块生成PDF格式的文档
2019/03/11 Python
详解python中的hashlib模块的使用
2019/04/22 Python
用Python从0开始实现一个中文拼音输入法的思路详解
2019/07/20 Python
如何用python 操作zookeeper
2020/12/28 Python
css3实现3d旋转动画特效
2015/03/10 HTML / CSS
Perfume’s Club德国官网:在线购买香水
2019/04/08 全球购物
网络工程师面试(三木通信技术有限公司)
2013/06/05 面试题
应届生学校辅导员求职信
2013/11/07 职场文书
工作经常出错的检讨书
2014/09/13 职场文书
博士给导师的自荐信
2015/03/06 职场文书
幼儿园推普周活动总结
2015/05/07 职场文书
毕业感言怎么写
2015/07/31 职场文书
使用MybatisPlus打印sql语句
2022/04/22 SQL Server