百度文库分类搜索工具
大体的界面如下,下拉框可以选择【少量-快速】、【适量-中速】、【大量-慢速】,三个选项,因为做翻页太麻烦,我就给了3个选项,需要速度快的选第一个,但是查询出的文档不多。需要查询大量文档的,选择慢速。正常愿意等20秒左右的,选择中速就行。每种速度的爬取线程和分组都做了测试。速度也只能这样了,没法再快了,CPU核心数少的话,开再多线程也只是增加了线程的上下文切换的消耗,起不到加快的作用的。 点击【查询】后,右侧会有百分比出来,百分比一开始比较少,不要着急,因为是并发,所以等到50%之后距离100%也就是一会的时间了。查询结果的列头支持排序,可以根据下载券(主要是用到这个)、下载量、文档评分等自行排序。 程序默认选择无需下载券的查询,如果有下载券,但非VIP可以选择【下载券可下载】的单选框,点击查询。结果如下,双击记录自行跳转到相关文档,就可以下载了。 百度文库分类搜索工具:三岁半资源网 |