python爬取京东商品评论（可实现翻页）

阅读量：

上一篇文章，我们已经实现抓取商品第一页的功能，下面来实现翻页的功能。

首先通过类定义三个方法：初始化方法、解析一页的方法、翻页爬取。

复制代码

    class jd_comment(object):
    	def __init__(self):
    		pass
    
    	def page(self):
    		pass
    
    	def max_page(self):
    		pass

初始化方法包括请求头、文件所在位置

复制代码

    	def __init__(self):
    		self.headers = {
    			'User-Agent': 'Mozilla/5.0 (Macintosh; Intel Mac OS X 11) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/87.0.4280.88 Safari/537.36'
    			}
    		self.fp = open('shangpingolun.text', 'w', encoding='utf-8')

解析一页的方法，即是爬取一页的方法：

复制代码

    	def page(self, url):
    		response = requests.get(url, headers=self.headers)
    		# 将json转换为字典
    		js_data = response.json()
    		# 获取评论所在地方
    		comment_list = js_data['comments']
    		# 提取需要的ID及评论
    		for comment in comment_list:
    			id = comment.get('id')
    			content = comment.get('content')
    			print(content)
    			self.fp.write(f'{id}\t{content}')

定义翻页爬取的方法：

复制代码

    	def max_page(self):
    		for page_num in range(101):
    			i = str(page_num)
    			# 生成url
    			url = f'https://club.jd.com/comment/productPageComments.action?callback=&productId=100010565952&score=0&sortType=5&page={i}&pageSize=10&isShadowSku=0&rid=0&fold=1'
    
    			# 调用函数
    			self.page(url=url)
    	
    	# 关闭文件
    	def close_files(self):
    		self.fp.close()
    		print('done!')

注意，url里面需要修改传递页码参数为page_num

定义完上述三个方法后，接下来定义实例：

复制代码

    if __name__ == '__main__':
    	jd_spider = jd_comment()
    	jd_spider.max_page()
    	jd_spider.close_files()

完整代码如下：

复制代码

    import requests
    import time
    
    class jd_comment(object):
    
    	def __init__(self):
    		self.headers = {
    			'User-Agent': 'Mozilla/5.0 (Macintosh; Intel Mac OS X 11) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/87.0.4280.88 Safari/537.36'
    			}
    		self.fp = open('shangpingolun.text', 'w', encoding='utf-8')
    
    	def page(self, url):
    		response = requests.get(url, headers=self.headers, timeout=3)
    		# 将json转换为字典
    		js_data = response.json()
    		# 获取评论所在地方
    		comment_list = js_data['comments']
    		# 提取需要的ID及评论
    		for comment in comment_list:
    			id = comment.get('id')
    			content = comment.get('content')
    			print(content)
    			self.fp.write(f'\t{id}\t{content}')
    			
    	def max_page(self):
    		for page_num in range(101):
    			i = str(page_num)
    			# 生成url
    			url = f'https://club.jd.com/comment/productPageComments.action?callback=&productId=100010565952&score=0&sortType=5&page={i}&pageSize=10&isShadowSku=0&rid=0&fold=1'
    
    			# 调用函数
    			self.page(url=url)
    	
    	# 关闭文件
    	def close_files(self):
    		self.fp.close()
    		print('done!')
    
    if __name__ == '__main__':
    	jd_spider = jd_comment()
    	jd_spider.max_page()
    	jd_spider.close_files()

此外在爬取中遇到一个问题，第一次爬取成功，第二次使用时，出现下面的错误。

网上查了一下，说是JSON格式不对造成的。后来我把url链接里面的page_num 从int 改成了str，运行一次可以成功爬取，第二次又遇到上图的错误。折腾了一会儿，也没有找到解决方法。

大家知道是什么原因么？

全部评论 (0)

还没有任何评论哟~

python爬取京东商品评论（可实现翻页）

上一篇文章，我们已经实现抓取商品第一页的功能，下面来实现翻页的功能。首先通过类定义三个方法：初始化方法、解析一页的方法、翻页爬取。 classjdcommentobject: definitself...

python爬虫爬取京东商品评价_京东商品评论爬取实战

先说说为什么写这个小demo吧，说起来还真的算不上“项目”，之前有一个朋友面试，别人出了这么一道机试题，需求大概是这样紫滴：1.给定任意京东商品链接，将该商品评论信息拿下，存入csv或者数据库 2.要...

爬取京东具体商品页面_京东商品评论爬取实战

先说说为什么写这个小demo吧，说起来还真的算不上“项目”，之前有一个朋友面试，别人出了这么一道机试题，需求大概是这样紫滴： 1.给定任意京东商品链接，将该商品评论信息拿下，存入csv或者数据库 2....

Python爬取京东商品评论

寻找数据真实接口打开京东商品网址查看商品评价。我们点击评论翻页，发现网址未发生变化，说明该网页是动态网页。 API名称：itemreview获得JD商品评论公共参数获取API测试key&secr...

python爬取京东评论怎么翻页_python爬取京东评论(一)

点击——要爬取网址作为一个爬虫小白解决问题是十分蛋疼的Φ皿Φ，就这几行代码，我折磨了一下午，然后我发现，学习代码最大的难题是学习资源获取的途径并不是代码本身，只要学，任何人都能学会 1.先到达页面打...

python爬虫（爬取京东商品评论）

前言如果只需要代码可以跳转到最后一步（记着更换商品ID和评论页的的页数）话不多说，直接开干！文章所提供的代码不能用于商业用途仅建议学习交流使用否则后果自负部分代码来源于网络如有侵权私我立删谢谢...

python爬虫爬取京东商品评价_python爬取京东商品信息及评论

''' 爬取京东商品信息: 功能:通过chromeDrive进行模拟访问需要爬取的京东商品详情页https://item.jd.com/100003196609.html并且程序支持多个页面爬取，输入...

python爬取京东评论怎么翻页_爬取京东网页评论（动态网页）

当网页打开的方式不同时，在开发者选项找到的包含评论的文件地址不同，比如第一种，当我们找到的评论界面是含有下一页选项的时候如下图。我们在左边文件界面发现包含评论的网页地址名字为‘'productPage...

Python京东商品评论爬取及可视化

目录前言环境使用模块使用数据来源分析 1.明确需求 2.抓包分析代码实现导入模块请求数据解析数据保存数据数据可视化词云图商品购买情况购买人数TOP10省份评论时间折线图总...

爬虫爬取京东商品评论（第一页）

知识点：网页分析，使用JSON提取页面内容。网页分析打开京东，并搜索进入需要爬取评论的页面。通过源代码可以发现数据在JSON之中。 Response字典部分即为JSON格式。删除fetchJS...

是否确定退出登录?

python爬取京东商品评论（可实现翻页）

全部评论 (0)

相关文章推荐

python爬取京东商品评论（可实现翻页）

python爬虫爬取京东商品评价_京东商品评论爬取实战

爬取京东具体商品页面_京东商品评论爬取实战

Python爬取京东商品评论

python爬取京东评论怎么翻页_python爬取京东评论(一)

python爬虫（爬取京东商品评论）

python爬虫爬取京东商品评价_python爬取京东商品信息及评论

python爬取京东评论怎么翻页_爬取京东网页评论（动态网页）

Python京东商品评论爬取及可视化

爬虫爬取京东商品评论（第一页）