鸿蒙开发者社区

WOT技术大会

公众号矩阵

移动端

短视频免费课程课程排行直播课软考学堂

全部课程厂商认证 IT技术 24年11月软考 PMP项目管理免费题库

文章资源问答课堂专栏直播

51CTO

鸿蒙开发者社区

51CTO技术栈

51CTO官微

51CTO学堂

51CTO博客

CTO训练营

鸿蒙开发者社区订阅号

51CTO软考

51CTO学堂APP

51CTO学堂企业版APP

鸿蒙开发者社区视频号

51CTO软考题库

鸿蒙开发者社区

登录/注册
51CTO

中国优质的IT技术网站

51CTO博客

专业IT技术创作平台

51CTO学堂

IT职业在线教育平台

活动短视频专栏极客Show 鸿蒙技术特刊

Scrapy 获取不到拉勾网指定的xpath数据

Scrapy 获取不到拉勾网指定的xpath数据-鸿蒙开发者社区

用scrapy shell调试，也没出来数据

Scrapy 获取不到拉勾网指定的xpath数据-鸿蒙开发者社区

爬虫小白，在线求大佬指点！

BOT_NAME = 'lagou'

SPIDER_MODULES = ['lagou.spiders']

NEWSPIDER_MODULE = 'lagou.spiders'

#指定Log级别

LOG_LEVEL = 'ERROR'

#LOG_FILE = 'lagou.log'

# Crawl responsibly by identifying yourself (and your website) on the user-agent

USER_AGENT = [

'MSIE (MSIE 6.0; X11; Linux; i686) Opera 7.23',

'Opera/9.20 (Macintosh; Intel Mac OS X; U; en)',

'Opera/9.0 (Macintosh; PPC Mac OS X; U; en)',

'iTunes/9.0.3 (Macintosh; U; Intel Mac OS X 10_6_2; en-ca)',

'Mozilla/4.76 [en_jp] (X11; U; SunOS 5.8 sun4u)',

'iTunes/4.2 (Macintosh; U; PPC Mac OS X 10.2)',

'Mozilla/5.0 (Macintosh; Intel Mac OS X 10.6; rv:5.0) Gecko/20100101 Firefox/5.0',

'Mozilla/5.0 (Macintosh; Intel Mac OS X 10.6; rv:9.0) Gecko/20100101 Firefox/9.0',

'Mozilla/5.0 (Macintosh; Intel Mac OS X 10.8; rv:16.0) Gecko/20120813 Firefox/16.0',

'Mozilla/4.77 [en] (X11; I; IRIX;64 6.5 IP30)',

'Mozilla/4.8 [en] (X11; U; SunOS; 5.7 sun4u)'

]

PROXIES = [

{

'ip_port': '61.216.156.222:60808',

'user_pass': ''

},

{

'ip_port': '183.236.232.160:8080',

'user_pass': ''

},

{

'ip_port': '222.74.73.202:42055',

'user_pass': ''

},

{

'ip_port': '210.5.10.87:53281',

'user_pass': ''

},

{

'ip_port': '183.236.232.160:8080',

'user_pass': ''

},

{

'ip_port': '61.216.156.222:60808',

'user_pass': ''

},

]

# Obey robots.txt rules

ROBOTSTXT_OBEY = False

# Configure maximum concurrent requests performed by Scrapy (default: 16)

#CONCURRENT_REQUESTS = 32

# Configure a delay for requests for the same website (default: 0)

# See https://docs.scrapy.org/en/latest/topics/settings.html#download-delay

# See also autothrottle settings and docs

DOWNLOAD_DELAY = 3

# The download delay setting will honor only one of:

#CONCURRENT_REQUESTS_PER_DOMAIN = 16

#CONCURRENT_REQUESTS_PER_IP = 16

# Disable cookies (enabled by default)

COOKIES_ENABLED = False

Scrapy 获取不到拉勾网指定的xpath数据-鸿蒙开发者社区

用xpath插件数据没问题啊，哭了...

急急急，在线等大佬指点！

python 爬虫

一只小汪汪鸭

2022-11-20 10:52:33

浏览

赞

收藏 0

回答 0

待解决

如何写精华回答，获更多曝光？

发布

相关问题

HarmonyOS 使用系统的Preferences来保存数据，获取不到数据

239浏览 • 1回复待解决

HarmonyOS图片压缩不到指定大小

478浏览 • 1回复待解决

调用preferences.get接口，获取不到之前存储的数据

2059浏览 • 1回复待解决

HarmonyOS IAP如何指定使用沙箱 / 现网环境？

125浏览 • 1回复待解决

adb: CreateFileW 'nul' failed: 系统找不到指定的文件。

7940浏览 • 1回复待解决

获取指定月份的天数。

333浏览 • 1回复待解决

HarmonyOS 剪切板systemPasteboard.getData接口获取不到数据

312浏览 • 1回复待解决

native侧的log获取不到

1555浏览 • 1回复待解决

openharmony怎么获取以太网MAC地址？

2493浏览 • 1回复待解决

Preferences获取不到值

8878浏览 • 2回复待解决

用户相册, 获取不到albumName

1685浏览 • 1回复待解决

官网获取的hi3518 SDK的wifi功能如何正常使用

10541浏览 • 2回复已解决

如何获取指定Bundle Name的Ability信息

1880浏览 • 1回复待解决

鸿蒙UI数据绑定不适用prop注解方式以及指定获取某个View

717浏览 • 1回复待解决

ohpm 获取指定仓库指定包的最新版本号

62浏览 • 1回复待解决

#鸿蒙学习大百科#键值型数据库如何获取指定key的value？

138浏览 • 1回复待解决

CDN会选择网宿吗？CDN会选择网宿吗？CDN会选择网宿吗CDN会选择网宿吗？CDN会选择网宿吗？CDN会选择网宿吗？

2796浏览 • 0回复待解决

鸿蒙应用开发请求不到数据

8044浏览 • 2回复待解决

http request 请求不到接口数据

4811浏览 • 1回复待解决

dataPreferences.Preferences取不到数据

129浏览 • 0回复待解决

HarmonyOS如何获取指定子组件的宽高

1087浏览 • 1回复待解决

HarmonyOS 获取不到手机号

165浏览 • 1回复待解决

connection.getPairedDevices()接口获取不到真实的mac地址？

587浏览 • 1回复待解决

怎样从海量数据中模糊查询到指定字段的数据行?

1886浏览 • 1回复待解决

HarmonyOS 联系人Picker是怎么获取手机通讯录数据的，看文档搜索不到相关使用

311浏览 • 1回复待解决

提问

该提问已有0人参与，帮助了0人

相关讨论帖

ace build apk --debug 系统找不到指定路径的解决办法【坚果派】 0回复

鸿蒙 ArkTS 从数组内查找指定的数据 1回复

为什么我抓不到baidu的数据包 0回复

HarmonyOS应用开发数据交互-使用指定网络访问数据 0回复

通过特定命令单独获取OpenHarmony标准、轻量、小型系统指定开发板的代码 0回复

Copyright © 2005-2024 51CTO.COM 京ICP证060544版权所有未经许可请勿转载