技巧七:OCR识别,攻克验证码难关
对于简单的验证码,可以使用 OCR 技术进行识别,例如 tesserocr 库。
from PIL import Image
import tesserocr
img = Image.open("captcha.png")
code = tesserocr.image_to_text(img)
技巧八:Headers 设置,模拟真实请求
除了 User-Agent,还可以设置 Referer、Cookie 等 Headers 信息,使请求更加真实。
headers = {
'User-Agent': '...',
'Referer': '...',
'Cookie': '...',
}