Advertisement

python-京东商品可视化

阅读量:

项目截图

开发爬虫程序用于京东商品信息的抓取。
对获取的数据进行清洗处理以确保数据质量。
提取商品名称、评价数量、店铺名称、商品详情链接以及价格信息等关键字段。
基于店铺名称与评价数量绘制柱形图展示数据特征。
对商品名称进行文本分析并筛选出6个具有代表性的样本;随后在结果集中计算其文本相似度或词频统计指标;统计这些样本所对应的销售商家数量,并根据商家分布情况生成饼状图直观展示市场占比分布情况。
完成课程设计报告并按时提交任务说明要求的内容。

文件标注

字体文件名为STSong.ttf

步骤

商品多页采集.py —> 商品评论数.py -> 京东商品数据清理.py -> 京东商品可视化.py

本项目采集的是iphone15

需要更换的是cookie

一共两个文件中用到了cookie

分别是

商品多页采集.py

商品评论数.py

商品多页采集.py

Ps补充

这个地方控制页数 i<4 页就是3页的意思

商品评论数.py

接下来讲下cookie获取地址

打开下面这个网址(一定要登入哦)

https://search.jd.com/Search?keyword=iphone15&enc=utf-8&suggest=1.his.0.0&wq=&pvid=53d83601f6f8483bad6f228dd37e07f6

搜索

https://api.m.jd.com/?appid=search-pc-java&functionId=pc_search_s_new

如果需要更换商品

商品多页采集.py

修改这个地方

全部评论 (0)

还没有任何评论哟~