python使用心得之获得github代码库列表


Posted in Python onJune 25, 2014

1.背景

项目需求,要求获得github的repo的api,以便可以提取repo的数据进行分析。研究了一天,终于解决了这个问题,虽然效率还是比较低下。

因为github的那个显示repo的api,列出了每个repo的详细信息,而且是json格式的。现在貌似还没有找到可以分析多个json格式数据的方法,所以用的是比较蠢得splite加re的方法。如果大家有更好的方法,不发留言讨论!

2.代码

import re
import os

def GetUrl(num):
 str = os.popen("curl -G https://api.github.com/repositories?since=%d"%(num)).read()
 pattern = '"url"'
 pattern1='repos'
 urls=str.split(',\n')  
 for i in urls:
  if pattern in i and pattern1 in i:   
#  text1=i.splite(':')
  text=re.compile('"(.*?)"').findall(i)[1]
  print text
if __name__=='__main__':
 GetUrl(1000)

    其中num的值指的是页面的id,我们可以做一个循环,不断增大num的值,就可以无限提取repo。因为github的api对于流量是有限制的,所以这么做是一个可行的方法。

效果如下(提取下来的repo的api地址):

https://api.github.com/repos/wycats/merb-core

https://api.github.com/repos/rubinius/rubinius

https://api.github.com/repos/mojombo/god

https://api.github.com/repos/vanpelt/jsawesome

https://api.github.com/repos/wycats/jspec

https://api.github.com/repos/defunkt/exception_logger

https://api.github.com/repos/defunkt/ambition

https://api.github.com/repos/technoweenie/restful-authentication

https://api.github.com/repos/technoweenie/attachment_fu

https://api.github.com/repos/topfunky/bong

https://api.github.com/repos/Caged/microsis

https://api.github.com/repos/anotherjesse/s3

https://api.github.com/repos/anotherjesse/taboo

https://api.github.com/repos/anotherjesse/foxtracs

https://api.github.com/repos/anotherjesse/fotomatic

https://api.github.com/repos/mojombo/glowstick

https://api.github.com/repos/defunkt/starling

https://api.github.com/repos/wycats/merb-more

https://api.github.com/repos/macournoyer/thin

https://api.github.com/repos/jamesgolick/resource_controller

https://api.github.com/repos/jamesgolick/markaby

https://api.github.com/repos/jamesgolick/enum_field

https://api.github.com/repos/defunkt/subtlety

https://api.github.com/repos/defunkt/zippy

https://api.github.com/repos/defunkt/cache_fu

https://api.github.com/repos/KirinDave/phosphor

Python 相关文章推荐
Python使用Tkinter实现机器人走迷宫
Jan 22 Python
如何使用VSCode愉快的写Python于调试配置步骤
Apr 06 Python
利用Anaconda简单安装scrapy框架的方法
Jun 13 Python
python实现下载pop3邮件保存到本地
Jun 19 Python
Python 中的lambda函数介绍
Oct 10 Python
Python----数据预处理代码实例
Mar 20 Python
python中yield的用法详解——最简单,最清晰的解释
Apr 04 Python
利用selenium爬虫抓取数据的基础教程
Jun 10 Python
浅谈python 中类属性共享的问题
Jul 02 Python
Python使用Pandas对csv文件进行数据处理的方法
Aug 01 Python
Python实现的微信红包提醒功能示例
Aug 22 Python
Python实现井字棋小游戏
Mar 09 Python
在Python中使用异步Socket编程性能测试
Jun 25 #Python
Python开发的单词频率统计工具wordsworth使用方法
Jun 25 #Python
python 字典(dict)遍历的四种方法性能测试报告
Jun 25 #Python
用python登录Dr.com思路以及代码分享
Jun 25 #Python
python正则表达式re模块详解
Jun 25 #Python
Python通过websocket与js客户端通信示例分析
Jun 25 #Python
Flask框架学习笔记(一)安装篇(windows安装与centos安装)
Jun 25 #Python
You might like
PHP 5.3新特性命名空间规则解析及高级功能
2010/03/11 PHP
完美实现GIF动画缩略图的php代码
2011/01/02 PHP
php $_SERVER windows系统与linux系统下的区别说明
2014/02/14 PHP
Linux下安装PHP MSSQL扩展教程
2014/10/24 PHP
PHP上传文件参考配置大文件上传
2015/12/16 PHP
thinkphp5+layui实现的分页样式示例
2019/10/08 PHP
两个Javascript小tip资料
2010/11/23 Javascript
iframe 上下滚动条如何默认在下方实现原理
2012/12/10 Javascript
JavaScript中的标签语句用法分析
2015/02/10 Javascript
基于jquery实现的自动补全功能
2015/03/12 Javascript
jQuery基于ajax()使用serialize()提交form数据的方法
2015/12/08 Javascript
jQuery 限制输入字符串长度
2016/06/20 Javascript
jQuery Ztree行政地区树状展示(点击加载)
2016/11/09 Javascript
Vue.js图片预览插件使用详解
2018/08/27 Javascript
JAVA面试题 static关键字详解
2019/07/16 Javascript
vue集成chart.js的实现方法
2019/08/20 Javascript
Vue快速实现通用表单验证的方法
2020/02/24 Javascript
js实现带有动画的返回顶部
2020/08/09 Javascript
vue项目中微信登录的实现操作
2020/09/08 Javascript
vue实现日历表格(element-ui)
2020/09/24 Javascript
js调用网络摄像头的方法
2020/12/05 Javascript
python去除所有html标签的方法
2015/05/05 Python
Python爬虫包 BeautifulSoup  递归抓取实例详解
2017/01/28 Python
Python中 传递值 和 传递引用 的区别解析
2018/02/22 Python
python自带tkinter库实现棋盘覆盖图形界面
2019/07/17 Python
python 实现识别图片上的数字
2019/07/30 Python
使用Python求解带约束的最优化问题详解
2020/02/11 Python
python 在右键菜单中加入复制目标文件的有效存放路径(单斜杠或者双反斜杠)
2020/04/08 Python
澳大利亚最大的护发和护肤品购物网站:RY
2019/12/26 全球购物
剪彩仪式主持词
2014/03/19 职场文书
网上祭先烈心得体会
2014/09/01 职场文书
小学校园广播稿(3篇)
2014/09/19 职场文书
社区灵活就业证明
2014/11/03 职场文书
师德标兵事迹材料
2014/12/19 职场文书
绵山导游词
2015/02/05 职场文书
爱牙日宣传活动总结
2015/02/05 职场文书