导航
导航

【秀一把敌法】 python-demo

爬了一下周杰伦贴吧里一个精品图片贴,学习中,代码比较初级啦,欢迎大拿指点
代码奉上:

  • 2016-04-05 更新帖
    之前用的是urllib库,现在发现了一个更好更高级的工具库 requests库。所以优化了下我的代码demo

#encoding=utf8
__author__ = 'lingo'
#jay图片链接
import requests
import re
from bs4 import BeautifulSoup
page=1

#总共只有5页
while page<6:

    #帖子路径(直接看楼主)
    #url= "http://tieba.baidu.com/p/3542842663?see_lz=1&pn="+str(page)

    payload = {'see_lz': '1', 'pn': page}
    r = requests.get("http://tieba.baidu.com/p/3542842663", params=payload)

    #request = urllib2.Request(r)
    #response = urllib2.urlopen(request)
    soup = BeautifulSoup(r.text)
    code_div = soup.find_all(class_="d_post_content j_d_post_content  clearfix")
    for code in code_div:
        #print code.prettify()

        #获取jpg图片
        code_img =  code.find_all("img",src=re.compile("jpg"))
        #print code_img
        for image in code_img:
            print "第"+str(page)+"页图片链接:",image["src"]

            #queue.append(image["src"])
    page = page + 1
else:
    print("完成")
    #写入记事本里
    #with open('image.txt','w') as f:
        #f.write(str(queue)+ '\n')

对了,是python2.7的