第6章 爬虫
1.网络库
- urllib库:http协议常用库
1 | from urllib import request, parse |
requests库:http协议常用库
BeautifulSoup库:xml格式处理库
2.requests库
1 | # get请求 |
3.Beautiful Soup的安装和使用
安装命令:pip3 install bs4
缺失模块。
1、请确保node版本大于6.2
2、在博客根目录(注意不是yilia根目录)执行以下命令:
npm i hexo-generator-json-content --save
3、在根目录_config.yml里添加配置:
jsonContent: meta: false pages: false posts: title: true date: true path: true text: false raw: false content: false slug: false updated: false comments: false link: false permalink: false excerpt: false categories: false tags: true