利用Python抓取行政区划码的方法


Posted in Python onNovember 28, 2016

前言

国家统计局网站上有相对比较齐的行政区划码,对于一些网站来说这是非常基础的数据,所以写了个Python程序将这部分数据抓取下来。

注意:抓取下来以后还要进行简单的人工的整理

示例代码:

# -*- coding:utf-8 -*-
'''
获取国家统计局上的行政区划码
'''
import requests,re
base_url = 'http://www.stats.gov.cn/tjsj/tjbz/xzqhdm/201504/t20150415_712722.html'
 
def get_xzqh():
 html_data = requests.get(base_url).content
 pattern = re.compile('<p class="MsoNormal" style=".*?"><span lang="EN-US" style=".*?">(\d+)<span>.*?</span></span><span style=".*?">(.*?)</span></p>')
 areas = re.findall(pattern,html_data)
 print "code,name,level"
 for area in areas:
  print area[0],area[1].decode('utf-8').replace(u' ',''),area[1].decode('utf-8').count(u' ')
 
if __name__=='__main__':
 get_xzqh()

注意事项:

另外,关于国家地区表的信息,还有另外一种获取渠道,那就是QQ软件自带的国家地区信息表。(文件名为LocList.xml),一般的存储位置为:C:\Program Files\Tencent\QQ\I18N\2052

如需中文版安装中文版QQ即可获取,如需英文版则安装英文版QQ。国际版在1033目录。

code都是按照ISO3166标准写的,极易导入数据库。

总结

以上就是利用Python获取行政区划码的全部内容,希望本文的内容对大家学习或者使用python能有所帮助,如果有疑问大家可以留言交流。

Python 相关文章推荐
用Python展示动态规则法用以解决重叠子问题的示例
Apr 02 Python
进一步了解Python中的XML 工具
Apr 13 Python
python 连接各类主流数据库的实例代码
Jan 30 Python
python 中if else 语句的作用及示例代码
Mar 05 Python
matplotlib给子图添加图例的方法
Aug 03 Python
python之信息加密题目详解
Jun 26 Python
Python的Tkinter点击按钮触发事件的例子
Jul 19 Python
PyQt5基本控件使用之消息弹出、用户输入、文件对话框的使用方法
Aug 06 Python
Python实现图片批量加入水印代码实例
Nov 30 Python
pytorch进行上采样的种类实例
Feb 18 Python
使用anaconda安装pytorch的实现步骤
Sep 03 Python
Python读取和写入Excel数据
Apr 20 Python
Python抓取手机号归属地信息示例代码
Nov 28 #Python
Python文本相似性计算之编辑距离详解
Nov 28 #Python
Python实现全角半角字符互转的方法
Nov 28 #Python
Python连接PostgreSQL数据库的方法
Nov 28 #Python
windows及linux环境下永久修改pip镜像源的方法
Nov 28 #Python
Python如何为图片添加水印
Nov 25 #Python
Python pass详细介绍及实例代码
Nov 24 #Python
You might like
PHP脚本数据库功能详解(上)
2006/10/09 PHP
Windows下IIS6/Apache2.2.4+MySQL5.2+PHP5.2.1安装配置方法
2007/05/03 PHP
php 修改上传文件大小限制实例详解
2016/10/23 PHP
php 反斜杠处理函数addslashes()和stripslashes()实例详解
2016/12/25 PHP
PHP实现根据密码长度显示安全条
2017/07/04 PHP
JS类定义原型方法的两种实现的区别评论很多
2007/09/12 Javascript
Mootools 1.2教程 Fx.Tween的使用
2009/09/15 Javascript
setInterval,setTimeout与jquery混用的问题
2013/04/08 Javascript
js 遍历json返回的map内容示例代码
2013/10/29 Javascript
jquery实现标题字体变换的滑动门菜单效果
2015/09/07 Javascript
Bootstrap每天必学之附加导航(Affix)插件
2016/04/25 Javascript
微信小程序 wxapp视图容器 view详解
2016/10/31 Javascript
浅谈js停止事件冒泡 阻止浏览器的默认行为(阻止超连接 #)
2017/02/08 Javascript
微信小程序 实现点击添加移除class
2017/06/12 Javascript
JS实现多张图片预览同步上传功能
2017/06/23 Javascript
js实现移动端吸顶效果
2020/01/08 Javascript
Vue CLI3移动端适配(px2rem或postcss-plugin-px2rem)
2020/04/27 Javascript
Vue3 响应式侦听与计算的实现
2020/11/11 Javascript
python中字典dict常用操作方法实例总结
2015/04/04 Python
Python+Socket实现基于TCP协议的客户与服务端中文自动回复聊天功能示例
2017/08/31 Python
基于python中theano库的线性回归
2018/08/31 Python
Python中IP地址处理IPy模块的方法
2019/08/16 Python
Django中自定义模型管理器(Manager)及方法
2019/09/23 Python
python opencv实现信用卡的数字识别
2020/01/12 Python
python+openCV对视频进行截取的实现
2020/11/27 Python
详解如何在登录过期后跳出Ifram框架
2020/09/10 HTML / CSS
摩顿布朗英国官方网上商店:奢华沐浴、身体和头发护理
2016/10/29 全球购物
工商学院毕业生个人自我评价
2013/09/19 职场文书
优秀求职信范文分享
2013/12/19 职场文书
洗发露广告词
2014/03/14 职场文书
无偿献血倡议书
2014/04/14 职场文书
银行求职自荐信
2014/06/30 职场文书
2015年综治维稳工作总结
2015/04/07 职场文书
安全第一课观后感
2015/06/18 职场文书
浅谈JavaScript作用域
2021/12/06 Javascript
使用Python开发冰球小游戏
2022/04/30 Python