...

分类

杂类工具

豆瓣租房小组爬虫 v1.1.2

大小:11.33MB

语言:中文系统:

类别:杂类工具时间:2020-07-06

介绍

豆瓣租房小组爬虫是一款很可靠的房源信息采集工具,帮助那些想要租房的用户找到合适的房子。你可以设置自己的要求,比如价格或位置,它会一次性爬取多页房源信息,慢慢筛选即可。

使用方法

1、如何设置豆瓣群组链接?

首先搜索某个地区租房,例如:北京租房

点进去要爬取的某个小组,例如第一个:北京租房

将页面拉到最下面有个> 更多小组讨论超链接,点进去

复制地址栏中地址(从/group开始复制到结尾),粘贴到软件设置豆瓣群组链接

有时候粘贴进软件会崩溃,不知道什么原因,建议把软件中原来的链接删除再粘贴进去。

将start=后边的数字50改成%d

2、如何设置排除(包含)关键字?

排除关键字是标题和内容只要出现关键字就会排除掉该条租房信息。

例如默认是限女这个关键字,只要租房信息中包含限女生入住,只限女生等出现限女关键字的一律不爬。

多个关键字用|分隔,注意是英文的。

例如:限女|短租|整租,这三个关键字设置后,只要标题和内容出现这三个关键字软件就不会爬取。

包含关键字只适用于标题,例如包含关键字为A,标题中含A,但内容中不含,会爬取;内容含A,标题不含,不会爬取。

3、关于识别标题中的价格

使用正则\b\d{4}\b识别标题中的价格信息,无法爬取少于1000元的信息。

4、关于爬取结果排序

先根据价格从小到大排序,价格相同根据发帖时间排序。

使用说明

1、确保C:\\Windows\\Fonts\\目录下有simsun.ttc字体文件

2、爬取结果文件(markdown)建议使用typora打开

更新内容

1. 新增配置文件,现在配置可以保存了

2. 新增爬取关键字,只爬取自己想要的

3. 修复其他BUG

猜您喜欢

同类推荐
var id = '167937';var mid = '2';var oldtitle='【豆瓣租房小组房源查找工具】豆瓣租房小组爬虫下载v1.1.2-领航下载站';var data_url = '//m.lhdown.com/statics/js/data-';