Python爬取链家二手房数据写入csv文件

阅读量：

1.我们常常找到一个网站不知道从何处下手，下面我们分析一下

首先确定该网站的URL地址。有时你所需的数据可能隐藏在网页源代码之外，并需要进行抓包操作；同时也要注意可能出现的JavaScript加密处理，请逐步完成相关操作。

2.确定url，接下来就是发送请求，得到数据

3.就是解析数据（哪种解析方式方便就用哪种）

4.保存数据

2.接下来就是代码操作

导入要用的模块

复制代码

 #链家

    
 from lxml import etree
    
 import csv
    
 import requests
    
 from tqdm import tqdm  #(这个模块只是单纯想加,也可不加,显示进度条的)

开始发送请求

复制代码

 print('信息爬取中:\n')

    
 class HouseParse(object):
    
     #初始化
    
     def __init__(self):
    
     #请求头
    
     self.headers = {
    
         'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/96.0.4664.55 Safari/537.36 Edg/96.0.1054.43'
    
     }
    
     #列表存放数据
    
     self.data_list = []
    
  
    
     def Sponsor(self):
    
     #翻页数据
    
     for i in tqdm(range(1,6)):
    
         url = f'https://cs.lianjia.com/ershoufang/rs{i}/'
    
         response = requests.get(url=url, headers=self.headers)
    
         #返回响应码
    
         # print(response.status_code)

3.开始解析数据

复制代码

         #返回响应码

    
         # print(response.status_code)
    
         html = etree.HTML(response.content.decode('utf-8'))
    
         #找到内容所在的li标签下
    
         elements = html.xpath('//div/ul[@class="sellListContent"]/li')
    
         # print(elements)
    
         for element in elements:
    
             #创建字典
    
             dict_ = {}
    
             #标题
    
             dict_['title'] = element.xpath('./div[1]/div[1]/a/text()')[0]
    
             #地址
    
             dict_['flood'] = ''.join([i.strip() for i in element.xpath('./div[1]/div[@class="flood"]//text()')])
    
             #简介
    
             dict_['introduction'] = element.xpath('./div[1]/div[@class="address"]/div/text()')[0]
    
             #价格
    
             dict_['price'] = ''.join([i.strip() for i in element.xpath('./div/div[@class="priceInfo"]/div//text()')])
    
             # print(dict_)
    
             self.data_list.append(dict_)

4.保存我们的数据

复制代码

             self.data_list.append(dict_)

    
  
    
     def save_data(self):
    
     #保存数据
    
     with open('lianjia.csv', 'w', encoding='utf-8', newline='')as f:
    
         writer = csv.DictWriter(f, fieldnames=['title', 'flood', 'introduction', 'price'])
    
         writer.writeheader()
    
         writer.writerows(self.data_list)
    
  
    
     def main(self):
    
     self.Sponsor()
    
     self.save_data()
    
  
    
 if __name__ == '__main__':
    
     house = HouseParse()
    
     house.main()
    
  
    
 print('\n爬取成功！')

爬取的内容

全部评论 (0)

还没有任何评论哟~

Python爬取链家二手房数据写入csv文件

1.我们常常找到一个网站不知道从何处下手，下面我们分析一下 1.先确定这个网站url，有时候你要的数据未必就在网页源代码里，需要抓包等等操作，也有可能js加密，不过先慢慢来 2.确定url，接下来就是...

爬取广州链家二手房并写入csv

知识点：多线程，读取csv,xpath importjson importcsv importrequests importthreading importlxml importlxml.etree ...

python爬取链家_Python爬取链家北京二手房数据

今天分享一下前段时间抓取链家上北京二手房数据的项目。本次分享分为两部分，第一部分介绍如何使用scrapy抓取二手房数据，第二部分我将抓下来的数据进行了一些简单的分析和可视化。

python链家网二手房数据爬取

python链家网二手房数据爬取由于想练习一下Python的数据清洗，并将之前学习的机器学习内容付诸以实践，发现二手房市场的数据分析报告的内容十分匮乏。

爬取链家二手房数据

爬取链家二手房数据.md 1.介绍项目 2.分析网站结构 3.说明技术选择 4.excel表格构建字段 1\.介绍项目利用python爬取链家网二手房数据 1.包括标题，位置，布局，总价，均价 2实...

Python爬虫抓取链家二手房数据

本节使用Python爬虫库完成链家二手房（<https://bj.lianjia.com/ershoufang/rs/）房源信息抓取，包括楼层、区域、总价、单价等信息。在编写此程序的过程中，您将体会到...

Python爬取广州链家二手房数据

微信公众号：数据分析与统计学习如有问题或建议，请公众号留言最近更新时间：2018728 一、前言依据网页的结构元素，网络爬虫可以分为爬取静态网页和动态网页，网络世界中大部分的网站属于静态网页，例...

爬取北京链家二手房数据

利用python爬取了北京链家主页的二手房数据，爬取时间为2020年1月8日。由于链家只显示了100页、每页30条，因此只能爬取3000条数据。后续将爬取各区的小区名，对每个小区的在售二手房数据进行...

链家二手房100页Xpath爬取保存csv

importrandom importtime importcsv importrequests fromfakeuseragentimportUserAgent fromlxmlimportetre...

python爬取链家二手房信息

爬取过程分析： 1、链家网url：<https://bj.lianjia.com/ershoufang/pg2/ 显示的二手房信息每个url递增一 2、访问时要加头信息，否则无法访问 3、用beaut...

是否确定退出登录?

Python爬取链家二手房数据写入csv文件

1.我们常常找到一个网站不知道从何处下手，下面 我们分析一下

2.接下来就是代码操作

导入要用的模块

开始发送请求

3.开始解析数据

4.保存我们的数据

爬取的内容

全部评论 (0)

相关文章推荐

Python爬取链家二手房数据写入csv文件

爬取广州链家二手房并写入csv

python爬取链家_Python爬取链家北京二手房数据

python链家网二手房数据爬取

爬取链家二手房数据

Python爬虫抓取链家二手房数据

Python爬取广州链家二手房数据

爬取北京链家二手房数据

链家二手房100页Xpath爬取保存csv

python爬取链家二手房信息

1.我们常常找到一个网站不知道从何处下手，下面我们分析一下