python爬虫今日热榜数据到txt文件的源码


Posted in Python onFebruary 23, 2021

今日热榜:https://tophub.today/

python爬虫今日热榜数据到txt文件的源码

爬取数据及保存格式:

python爬虫今日热榜数据到txt文件的源码

爬取后保存为.txt文件:

python爬虫今日热榜数据到txt文件的源码

部分内容:

python爬虫今日热榜数据到txt文件的源码
python爬虫今日热榜数据到txt文件的源码

源码及注释:

import requests
from bs4 import BeautifulSoup

def download_page(url):
  headers = {"User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/79.0.3945.130 Safari/537.36"}
  try:
    r = requests.get(url,timeout = 30,headers=headers)
    return r.text
  except:
    return "please inspect your url or setup"


def get_content(html,tag):
  output = """  排名:{}\n  标题:{} \n  热度:{}\n  链接:{}\n  ------------\n"""
  output2 = """平台:{}  榜单类型:{}  最近更新:{}\n------------\n"""
  num=[]
  title=[]
  hot=[]
  href=[]
  soup = BeautifulSoup(html, 'html.parser')
  con = soup.find('div',attrs={'class':'bc-cc'})
  con_list = con.find_all('div', class_="cc-cd")
  for i in con_list: 
    author = i.find('div', class_='cc-cd-lb').get_text() # 获取平台名字
    time = i.find('div', class_='i-h').get_text() # 获取最近更新
    link = i.find('div', class_='cc-cd-cb-l').find_all('a') # 获取所有链接 
    gender = i.find('span', class_='cc-cd-sb-st').get_text() # 获取类型 
    save_txt(tag,output2.format(author, gender,time))
    for k in link:
      href.append(k['href'])
      num.append(k.find('span', class_='s').get_text())
      title.append(str(k.find('span', class_='t').get_text()))
      hot.append(str(k.find('span', class_='e').get_text()))
    for h in range(len(num)): 
      save_txt(tag,output.format(num[h], title[h], hot[h], href[h]))


def save_txt(tag,*args):
  for i in args:
    with open(tag+'.txt', 'a', encoding='utf-8') as f:
      f.write(i)


def main():
  #   综合  科技  娱乐  社区    购物   财经
  page=['news','tech','ent','community','shopping','finance']
  for tag in page:
    url = 'https://tophub.today/c/{}'.format(tag)
    html = download_page(url)
    get_content(html,tag)

if __name__ == '__main__':
  main()

到此这篇关于python爬虫今日热榜数据到txt文件的源码的文章就介绍到这了,更多相关python爬虫今日热榜数据内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木!

Python 相关文章推荐
用map函数来完成Python并行任务的简单示例
Apr 02 Python
详解Python编程中包的概念与管理
Oct 16 Python
详解duck typing鸭子类型程序设计与Python的实现示例
Jun 03 Python
Python判断列表是否已排序的各种方法及其性能分析
Jun 20 Python
对Python3中bytes和HexStr之间的转换详解
Dec 04 Python
Python利用scapy实现ARP欺骗的方法
Jul 23 Python
Python学习笔记之集合的概念和简单使用示例
Aug 22 Python
python聚类算法解决方案(rest接口/mpp数据库/json数据/下载图片及数据)
Aug 28 Python
python使用matplotlib:subplot绘制多个子图的示例
Sep 24 Python
python中编写函数并调用的知识点总结
Jan 13 Python
简单介绍Python的第三方库yaml
Jun 18 Python
Python合并pdf文件的工具
Jul 01 Python
如何用Python和JS实现的Web SSH工具
Feb 23 #Python
Python 带星号(* 或 **)的函数参数详解
Feb 23 #Python
python解决OpenCV在读取显示图片的时候闪退的问题
Feb 23 #Python
关于探究python中sys.argv时遇到的问题详解
Feb 23 #Python
python链表类中获取元素实例方法
Feb 23 #Python
Python之多进程与多线程的使用
Feb 23 #Python
Python绘制词云图之可视化神器pyecharts的方法
Feb 23 #Python
You might like
简单的PHP多图上传小程序代码
2011/07/17 PHP
PHP开发中常用的十个代码样例
2016/02/02 PHP
PHP设置Cookie的HTTPONLY属性方法
2017/02/09 PHP
PHP从零开始打造自己的MVC框架之入口文件实现方法详解
2019/06/03 PHP
php中错误处理操作实例分析
2019/08/23 PHP
Javascript代码混淆综合解决方案-Javascript在线混淆器
2006/12/18 Javascript
js或css实现滚动广告的几种方案
2010/01/28 Javascript
jQuery制作拼图小游戏
2015/01/12 Javascript
深入浅析JavaScript系列(13):This? Yes,this!
2016/01/05 Javascript
js实现动态创建的元素绑定事件
2016/07/19 Javascript
如何解决IONIC页面底部被遮住无法向上滚动问题
2016/09/06 Javascript
关于json字符串与实体之间的严格验证代码
2016/11/10 Javascript
使用vue.js写一个tab选项卡效果
2017/03/25 Javascript
Vue2递归组件实现树形菜单
2017/04/10 Javascript
JavaScript求一组数的最小公倍数和最大公约数常用算法详解【面向对象,回归迭代和循环】
2018/05/07 Javascript
教你如何编写Vue.js的单元测试的方法
2018/10/17 Javascript
详解Vue 项目中的几个实用组件(ts)
2019/10/29 Javascript
在Django框架中运行Python应用全攻略
2015/07/17 Python
解决uWSGI的编码问题详解
2017/03/24 Python
Python中的pygal安装和绘制直方图代码分享
2017/12/08 Python
python编程使用selenium模拟登陆淘宝实例代码
2018/01/25 Python
python使用rpc框架gRPC的方法
2018/08/24 Python
使用python根据端口号关闭进程的方法
2018/11/06 Python
python使用PyQt5的简单方法
2019/02/27 Python
详解python读取image
2019/04/03 Python
Python实现计算长方形面积(带参数函数demo)
2020/01/18 Python
Python中remove漏删和索引越界问题的解决
2020/03/18 Python
Keras模型转成tensorflow的.pb操作
2020/07/06 Python
CSS3实现各种图形的示例代码
2016/10/19 HTML / CSS
印度领先的在线时尚商店:Koovs
2016/08/28 全球购物
程序集与命名空间有什么不同
2014/07/25 面试题
技术副厂长岗位职责
2013/12/26 职场文书
房屋买卖委托书格式范本格式
2014/10/13 职场文书
电气工程师岗位职责
2015/02/12 职场文书
立项申请报告范本
2015/05/15 职场文书
2019银行员工个人工作自我鉴定
2019/06/27 职场文书