api demo 京东商品详情_爬取京东商品详情页信息

阅读量：

之前写过爬取京东商品导航信息，现在献上爬取京东商品详情页信息。

#爬取京东商品详情页信息

#2017/7/30

import requests

from bs4 import BeautifulSoup

import os

import csv

import re

import json

import time

#爬取页面链接

def make_a_link(keyword,page):

try:

r = requests.get("https://search.jd.com/Search?keyword=" + keyword +'&enc=utf-8&page=' + str(2*page-1))

r.raise_for_status

print('正在爬取第{}页...'.format(page))

print('---'*45)

r.encoding = 'gbk'

return r.text

except:

print('链接错误！！！')

return ''

#爬取页面链接

def find_only_link(html):

soup = BeautifulSoup(html,'lxml')

links = soup.find_all('div',class_='gl-i-wrap')

return (link.find('div',class_='p-name p-name-type-2').a['href'] for link in links)#页面链接的生成表达式

#链接单页面

def link_to_url(link):

try:

r = requests.get(link)

r.raise_for_status

r.encoding = 'gbk'

return r.text

except:

print('此页无法链接！！！')

return ''

#爬取商品价格

def getprice(purl):

uid = re.match(r'.+?(\d+).+',purl).group(1)

content = link_to_url('https://p.3.cn/prices/mgets?skuIds=J_' + uid)

jd = json.loads(content.lstrip('[').rstrip(']\n'))#生成json数据格式

return jd['p']

#爬取商品评论

def getcomment(purl):

uid = re.match(r'.+?(\d+).+',purl).group(1)

content = link_to_url('https://club.jd.com/comment/productCommentSummaries.action?referenceIds=' + uid)

jd = json.loads(content)

comment = []

jds = jd['CommentsCount'][0]

comment.append(jds['CommentCountStr'])#评论数

comment.append(jds['GoodCountStr'])#好评数

comment.append(jds['GoodRate'])#好评率

return comment

#爬取商品名称

def getname(purl):

uid = re.match(r'.+?(\d+).+',purl).group(1)

content = link_to_url('https://c.3.cn/recommend?&methods=accessories&sku=' + uid + '&cat=9987%2C653%2C655')

try:

jd = json.loads(content)

return jd['accessories']['data']['wName']

except:

return ''

#爬取卖家

def getseller(purl):

uid = re.match(r'.+?(\d+).+',purl).group(1)

content = link_to_url('https://chat1.jd.com/api/checkChat?pid=' + uid + '&returnCharset=utf-8')

try:

jd = json.loads(content.lstrip('null(').rstrip(');'))

try:

return jd['seller']

except:

return ''

except:

#保存到csv

def save_to_csv(ulist,keyword):

path = 'D:/数据/'

if not os.path.exists(path):

os.mkdir(path)

with open(path + '京东' + keyword + '数据.csv','w+' ) as f:

writer = csv.writer(f)

writer.writerow(['商品','价格','店铺','链接','评论数','好评数','好评率'])

for i in range(len(ulist)):

if ulist[i] and ulist[i][0]:

writer.writerow([ulist[i][0],ulist[i][1],ulist[i][2],ulist[i][3],ulist[i][4],ulist[i][5],ulist[i][6]])

#主函数

def relmain(keyword):#高阶函数

def main(page):

r = re.compile(r'.*?html')

ulist = []

for p in range(page):

p += 1

text = make_a_link(keyword,p)

for url in find_only_link(text):

ul = []

if r.match(url):

if getname(url):

ul.append(getname(url))#商品名称

print(getname(url))

ul.append(getprice(url))#价格

ul.append(getseller(url))#店铺

ul.append('https:' + url)#链接

print('https:' + url)

ul.extend(getcomment(url))#评论

print('-' * 45)

ulist.append(ul)

save_to_csv(ulist,keyword)

return main

if name == 'main':

keyword = input('输入要爬取的商品：')

pages = int(input('输入要爬取的页数：'))

time_start = time.time()

relmain(keyword)(pages)

print('耗时{}秒。'.format(time.time() - time_start))#爬取所需时间

全部评论 (0)

还没有任何评论哟~

api demo 京东商品详情_爬取京东商品详情页信息

之前写过爬取京东商品导航信息，现在献上爬取京东商品详情页信息。爬取京东商品详情页信息 2017/7/30 importrequests frombs4importBeautifulSoup impo...

Python 爬虫爬取京东商品信息 ||京东商品详情API

Python爬虫爬取京东商品信息下面我将逐一解释每一部分的代码导入库 from selenium import webdriver from selenium.webdriver.edge.ser...

京东商品详情页API接口申请指南，京东商品详情页API接口、京东商品销量API接口、京东商品列表API接口、京东APP详情API接口、京东详情API接口，京东SKU信息接口

请求方式：GET 接口介绍：提供的数据：skuID、sku名称、店铺名称、标题、主图返回格式：JSON 频率限制：10次/秒请求头参数参数类型必选值示例 Authorizationstring是...

京东商品详情页API接口、京东商品销量API接口、京东商品列表API接口、京东APP详情API接口、京东详情API接口，京东SKU信息接口

京东商品详情页API接口、京东商品销量API接口、京东商品列表API接口、京东APP详情API接口、京东详情API接口，京东SKU信息接口，通过商品ID提取商品详情页各项数据，包含商品标题，skuid...

京东商品详情API、通过商品ID获得京东商品详情

除了通过商品ID获得京东商品详情以外各大平台的诸多API接口都支持调用，所有数据实时更新。如需了解更多请移步注册京东api接口，商品详情API，测试 “item”: “numiid”:“100015...

Pyppeteer+Python爬取京东商品详情demo

前言：近期总有刚接触Pyppeteer的同学提问，今日得闲索性写个demo，供大家参考。安装Pyppeteer环节省略，自行查阅相关文档。下述代码业务场景：用户输入关键字，脚本采集并存储与该关键字...

京东api获取商品详情

itemget获得JD商品详情注册获取api测试返回数据说明公共参数名称类型必须描述 keyString是调用key（必须以GET方式拼接在URL中） secretString是调用密钥 ap...

CasperJS 抓取京东商品详情页中的商品信息

一、京东商品详情页 1\.详情页截图 2\.网页结构二、实战：抓取详情页中红色方框中的信息 1\.代码 phantom.outputEncoding=GBK;//inordertodisplayCh...

京东商品详情API接口（item_get-获得京东商品详情接口），京东API接口系列

京东商品详情API接口（itemget获得京东商品详情接口），京东API接口可获取到商品链接，商品ID，商品标题，商品价格，品牌名称，店铺昵称，sku规格，sku属性，发货地，详情属性，店铺信息等参数...

python爬虫京东商品详情网页

京东商品详情数据接口允许开发者获取关于商品的各类详细信息。首先，通过使用京东商品详情数据API，开发者可以方便地获得商品的基本信息，如ID、名称、价格、图片、描述、规格和库存等。这为开发者提供了丰富...

是否确定退出登录?

api demo 京东商品详情_爬取京东商品详情页信息

全部评论 (0)

相关文章推荐

api demo 京东商品详情_爬取京东商品详情页信息

Python 爬虫爬取京东商品信息 ||京东商品详情API

京东商品详情页API接口申请指南，京东商品详情页API接口、京东商品销量API接口、京东商品列表API接口、京东APP详情API接口、京东详情API接口，京东SKU信息接口

京东商品详情页API接口、京东商品销量API接口、京东商品列表API接口、京东APP详情API接口、京东详情API接口，京东SKU信息接口

京东商品详情API、通过商品ID获得京东商品详情

Pyppeteer+Python爬取京东商品详情demo

京东api获取商品详情

CasperJS 抓取京东商品详情页中的商品信息

京东商品详情API接口（item_get-获得京东商品详情接口），京东API接口系列

python爬虫京东商品详情网页