python爬虫网页保存本地

2018, January 23, 3:29 PM. python学习

Submitted by admin

不会编程真的是硬伤，想学习下python，不知道能坚持多久，看手册看教程看不下去，太枯燥了，想从实例入手，看看会不会坚持的久一点，今天学了个简单爬虫的例子。 # coding:utf-8 import re import requests import urllib import sys reload(sys) sys.setdefaultencoding('utf-8') # 获取网页内容 urls = "http://top.chinaz.com" r = requests.get(urls) data = r.text # 利用正则查找所有连接 link_list =re.findall(r"(?<=href=\").+?(?=\")|(?<=href=\').+?(?=\')" ,data) for L in link_list: txt='url.txt' f = open(txt,"a+") f.write(L+'\n') f.close() print L 过程中的错误，是保存txt的时候，没保存在for循环之内。

Tags: python

久久久电脑

python爬虫网页保存本地

Trackbacks

发表评论

日志分类

热门标签

搜索文章

最新评论

博客信息

51.la

{title}