检查网址存活性

通过python可以很方便的检测一个网址的存活(是不是404),即检测状态码,这种方式不必等待整个网址下载完整。

def check_url(url:str):
    p = urlparse(url)
    conn = HTTPConnection(p.netloc)
    conn.request('HEAD', p.path)
    resp = conn.getresponse()
    return resp.status < 400

使用起来也非常简单:

# True
check_url("http://www.baidu.com")
# False
check_url("http://www.baidu.com/does-not-exists.html")

发表评论

电子邮件地址不会被公开。 必填项已用*标注