python抓取京東價(jià)格分析京東商品價(jià)格走勢(shì)

來(lái)源：懂視網(wǎng) 責(zé)編：小采時(shí)間：2020-11-27 14:38:47

python抓取京東價(jià)格分析京東商品價(jià)格走勢(shì)

python抓取京東價(jià)格分析京東商品價(jià)格走勢(shì):代碼如下:from creepy import Crawlerfrom BeautifulSoup import BeautifulSoupimport urllib2import json class MyCrawler(Crawler): def process_document(self, doc): if doc.status == 200: p

推薦度：

點(diǎn)擊下載本文 文檔為doc格式

導(dǎo)讀python抓取京東價(jià)格分析京東商品價(jià)格走勢(shì):代碼如下:from creepy import Crawlerfrom BeautifulSoup import BeautifulSoupimport urllib2import json class MyCrawler(Crawler): def process_document(self, doc): if doc.status == 200: p

代碼如下:

from creepy import Crawler
from BeautifulSoup import BeautifulSoup
import urllib2
import json

class MyCrawler(Crawler):
def process_document(self, doc):
if doc.status == 200:
print '[%d] %s' % (doc.status, doc.url)
try:
soup = BeautifulSoup(doc.text.decode('gb18030').encode('utf-8'))
except Exception as e:
print e
soup = BeautifulSoup(doc.text)
print soup.find(id="product-intro").div.h1.text
url_id=urllib2.unquote(doc.url).decode('utf8').split('/')[-1].split('.')[0]
f = urllib2.urlopen('http://p.3.cn/prices/get?skuid=J_'+url_id,timeout=5)
price=json.loads(f.read())
f.close()
print price[0]['p']
else:
pass

crawler = MyCrawler()
crawler.set_follow_mode(Crawler.F_SAME_HOST)
crawler.set_concurrency_level(16)
crawler.add_url_filter('\.(jpg|jpeg|gif|png|js|css|swf)$')
crawler.crawl('http://item.jd.com/982040.html')

聲明：本網(wǎng)頁(yè)內(nèi)容旨在傳播知識(shí)，若有侵權(quán)等問(wèn)題請(qǐng)及時(shí)與本網(wǎng)聯(lián)系，我們將在第一時(shí)間刪除處理。TEL:177 7030 7066 E-MAIL:11247931@qq.com

python抓取京東價(jià)格分析京東商品價(jià)格走勢(shì)

推薦度：

點(diǎn)擊下載本文 文檔為doc格式

標(biāo)簽：京東 jd 分析

熱門(mén)焦點(diǎn)

python抓取京東價(jià)格分析京東商品價(jià)格走勢(shì)

python抓取京東價(jià)格分析京東商品價(jià)格走勢(shì)

python抓取京東價(jià)格分析京東商品價(jià)格走勢(shì)

最新推薦

猜你喜歡

熱門(mén)推薦