纸飞机数据抓取怎样应对网站的动态反爬虫验证码?
1 个回答
你这个情况很普遍,现在很多网站都用动态验证码防爬了,确实比较麻烦。
首先你要弄明白对方验证码属于哪一类,滑块?点图?还是识别文字?不同验证码的处理方式是不一样的。
如果你是做TG推广需要数据,可以试试这几个靠谱方向:1、用第三方打码平台,比如OCR,虽然成本高点;2、直接找现成的代理+模拟器方案,模拟真人行为绕过检测;3、换个思路,找替代数据源,比如API接口,或者别人整理好的数据集。
另外也不要硬刚,改改请求头、加个延迟、用真实IP池,很多时候这些小细节就能解决大问题。
最后提醒一下,做爬虫不要太激进,容易翻车。慢慢调,总会找到路子。