python爬虫-京东商品评论

阅读量：

该文本描述了一种通过Python爬虫技术从京东某商品页面提取并保存商品评论的方法和流程：1. 使用selenium库模拟浏览器操作并打开京东商品详情页2. 初始化BeautifulSoup进行网页内容解析3. 通过JavaScript滚动至网页底部以获取所有评论4. 使用正则表达式和标签匹配提取每条评论文本5. 将爬取的评论存储在一个列表中6. 处理分页功能（如点击下一页按钮）以获取所有页数的评论7. 将所有收集到的评论数据存储为DataFrame格式后导出为CSV文件该方法可以实现从京东网站批量爬取商品评价并进行后续的数据分析或展示工作。

使用数据采集工具从京东某商品的评论中提取信息，并将其存储在一个本地数据库中

复制代码

    import random
    from selenium import webdriver
    from selenium.webdriver import ActionChains
    from selenium.webdriver.support.ui import WebDriverWait
    import time
    from bs4 import BeautifulSoup
    import pandas as pd
    from selenium.webdriver.common.keys import Keys
    
    browser = webdriver.Chrome(executable_path='C:\Program Files (x86)\Google\Chrome\Application\chromedriver.exe')
    browser.get('https://item.jd.com/100007264815.html')
    
    
    
    browser.switch_to.window(browser.window_handles[0])
    time.sleep(3)
    browser.switch_to.window(browser.window_handles[-1])
    
    comments = []
    
    for k in range (0,100):
    
    try:
        js = "var q=document.documentElement.scrollTop=1000000"
        browser.execute_script(js)  # 使用javascript命令，网页下拉到最底部
        elements = browser.find_element_by_xpath('//*[@id="comment-4"]')
        InnerElement = elements.get_attribute('innerHTML')
        soup = BeautifulSoup(InnerElement, 'lxml')
        comments_data = soup.find_all('p', {'class': 'comment-con'})
    
        if not comments_data:
            print('无评论')
            break
    
        for j in comments_data:
            comments.append(j.get_text())
            print(comments)
        time.sleep(random.random() * 5 + 1)
    
    except Exception as e:
        print(e)
    
    try:
        element = browser.find_element_by_css_selector(
            '#comment-4 > div.com-table-footer > div > div > a.ui-pager-next')
    
        browser.execute_script("arguments[0].click();",
                               element)  # comment-4 > div.com-table-footer > div > div > a.ui-pager-next
        time.sleep(1)
    except Exception as e:
        print(e)
    df = pd.DataFrame(comments)
    
    df.to_csv('狗粮好评.csv', index=False, encoding='utf_8_sig')

全部评论 (0)

还没有任何评论哟~

python爬虫-京东商品评论

对京东某商品的评论进行爬虫并保存 importrandom fromseleniumimportwebdriver fromselenium.webdriverimportActionChains f...

python爬虫（爬取京东商品评论）

前言如果只需要代码可以跳转到最后一步（记着更换商品ID和评论页的的页数）话不多说，直接开干！文章所提供的代码不能用于商业用途仅建议学习交流使用否则后果自负部分代码来源于网络如有侵权私我立删谢谢...

python爬虫爬取京东商品评价_京东商品评论爬取实战

先说说为什么写这个小demo吧，说起来还真的算不上“项目”，之前有一个朋友面试，别人出了这么一道机试题，需求大概是这样紫滴：1.给定任意京东商品链接，将该商品评论信息拿下，存入csv或者数据库 2.要...

python爬虫爬取京东商品评价_python爬取京东商品信息及评论

''' 爬取京东商品信息: 功能:通过chromeDrive进行模拟访问需要爬取的京东商品详情页https://item.jd.com/100003196609.html并且程序支持多个页面爬取，输入...

python爬京东商品评论（json）

Python网络爬虫所需要的模块本次爬虫程序需要的模块有：request、urllib、json 以下先来分别介绍这几个模块的用处 request模块利用requestrequests模块我们可以...

python json 爬京东商品评论

目标：爬京东任意商品评论一、首先打开京东任意商品的评论 1、我用的是QQ浏览器，右击检查，在Network下选择JS，在搜索框里输入productPageComments如果出不来记得F5刷新一下）...

Python爬取京东商品评论

寻找数据真实接口打开京东商品网址查看商品评价。我们点击评论翻页，发现网址未发生变化，说明该网页是动态网页。 API名称：itemreview获得JD商品评论公共参数获取API测试key&secr...

利用Python爬虫技术爬取京东商品评论

这是我第一次接触python时，我们学校做的项目实训，其实整个项目实训过程很简单，并没有什么难度，认真学学就会。首先，我们要明确我们的目标：从京东上爬取产品的评论。一般评论都是进行情感分析，但我还没...

爬虫爬取京东商品评论（第一页）

知识点：网页分析，使用JSON提取页面内容。网页分析打开京东，并搜索进入需要爬取评论的页面。通过源代码可以发现数据在JSON之中。 Response字典部分即为JSON格式。删除fetchJS...

python selenium爬虫爬京东评论_Python 不用selenium 带你高效爬取京东商品评论

代码实现导入模块和定义常量 importre importtime importcsv importos importrequests importhtml 设置请求头 headers= 'cook...

是否确定退出登录?

python爬虫-京东商品评论

全部评论 (0)

相关文章推荐

python爬虫-京东商品评论

python爬虫（爬取京东商品评论）

python爬虫爬取京东商品评价_京东商品评论爬取实战

python爬虫爬取京东商品评价_python爬取京东商品信息及评论

python爬京东商品评论（json）

python json 爬京东商品评论

Python爬取京东商品评论

利用Python爬虫技术爬取京东商品评论

爬虫爬取京东商品评论（第一页）

python selenium爬虫爬京东评论_Python 不用selenium 带你高效爬取京东商品评论