Advertisement

Python京东商品评论爬取及可视化

阅读量:

本文介绍了如何使用Python爬取京东欧莱雅洗面奶的商品评论,并进行数据可视化分析。背景是临近毕业季,学生需要掌握爬虫和可视化技能。方法包括明确需求、抓包分析、代码实现(使用requests和csv模块)、数据保存和可视化(如词云图、购买情况分析等)。最终展示了评论数据的分析结果,并附上完整代码和教程链接。

目录

前言

环境使用

模块使用

数据来源分析

1.明确需求

2.抓包分析

代码实现

导入模块

请求数据

解析数据

保存数据

数据可视化

词云图

商品购买情况

购买人数TOP10省份

评论时间折线图

总结


2024-6-30更

2024-6-30更新

前言

临近毕业季,同学们在毕业设计前感到焦虑,主要涉及爬虫技术、数据可视化以及情感分析等内容。今天为大家分享一篇利用Python进行京东商品评论爬取与可视化的详细教程,希望这篇教程能帮助大家顺利完成毕业设计,取得理想的成绩!

环境使用

Python 3.8

Pycharm专业版

Jupyter notebook

模块使用

requests

csv

数据来源分析

1.明确需求

此次爬取的是欧莱雅洗面奶的商品评论信息

2.抓包分析

按F12,打开开发者工具,点击搜索,输入你想要的数据

找到评论数据链接

代码实现

导入模块

复制代码
    from DrissionPage import ChromiumPage

请求数据

复制代码
 page = ChromiumPage()

    
 page.listen.start('api.m.jd.com/')
    
 page.get('https://item.jd.com/100005564408.html#comment')
    
 response = page.listen.wait()
    
 json_data = response.response.body

解析数据

使用json键值对获取需要的评论信息,包括评论内容,评论时间等。

复制代码
 comments = json_data['comments']

    
 for comment in comments:
    
     content = (comment['content']).replace('\n', '')
    
     creationTime = comment['creationTime']
    
     productColor = comment['productColor']
    
     location = comment['location']
    
     referenceName = comment['referenceName']
    
     print(content, creationTime, productColor, location, referenceName)

保存数据

复制代码
 f = open(f'洗面奶.csv', mode='a', encoding='gbk', newline='')

    
 csv_write = csv.DictWriter(f, fieldnames=['评论', '评论时间', '商品', 'IP', '参考名称'])
    
 csv_write.writeheader()

数据可视化

复制代码
 import pandas as pd

    
 import numpy as np
    
 df = pd.read_csv('洗面奶.csv')
    
 df.fillna('未知', inplace=True)  # 填充空值
    
 df.head()

词云图

商品购买情况

购买人数TOP10省份

评论时间折线图

总结

本文通过收集京东官方旗舰店欧莱雅洗面奶的用户评价数据集,对数据进行多维度分析,并利用Python进行可视化展示。如需完整项目代码,可访问链接获取。

全部评论 (0)

还没有任何评论哟~