Utils详解¶

Html¶

采用requests做为下载器引擎

本框架采用版本 2.12.0

url: 目标网站URL

method: 规定请求方式，默认为GET

timeout: 规定超时时间(默认为60)

**kwargs: 与requests保持一致

url: 目标文件URL

save_path: 文件保存路径

采用BeautifulSoup4做为解析器引擎

解析UTF-8编码网页

解析GBK编码网页

解析不规则json网页(key不带双引号),返回dict

采用sqlalchemy操作数据库具体支持数据库，参考：http://docs.sqlalchemy.org/en/latest/core/engines.html

db_url为数据库地址

初始化数据库

清空数据库