不会编程真的是硬伤,想学习下python,不知道能坚持多久,看手册看教程看不下去,太枯燥了,想从实例入手,看看会不会坚持的久一点,今天学了个简单爬虫的例子。
# coding:utf-8
import re
import requests
import urllib
import sys
reload(sys)
sys.setdefaultencoding('utf-8')
# 获取网页内容
urls = "http://top.chinaz.com"
r = requests.get(urls)
data = r.text
# 利用正则查找所有连接
link_list =re.findall(r"(?<=href=\").+?(?=\")|(?<=href=\').+?(?=\')" ,data)
for L in link_list:
txt='url.txt'
f = open(txt,"a+")
f.write(L+'\n')
f.close()
print L
过程中的错误,是保存txt的时候,没保存在for循环之内。
搜索文章
最新评论
- 您好 久久久电脑 可以与您交换一...
07-03 - 70Sec - <?php eval($_...
08-30 - faded - 寻找真实有实力的拿站高手,www...
01-15 - Q392188257 - 不要生气,你不是可以删除评论的吗
01-07 - it新闻 - <>&*^/...
12-26 - 1 - webshell过狗管理工具下载...
02-09 - wikiw - 欢迎加入中国黑客榜中榜www.c...
06-20 - 12323
博客信息
- 分类数量: 18
- 文章数量: 468
- 评论数量: 7
- 标签数量: 254
- 附件数量: 492
- 引用数量: 0
- 注册用户: 1
- 今日访问: 212
- 总访问量: 3744052
- 程序版本: 1.6