python举例实现HTMLParser解析HTML 对于我们用Python实现的爬虫首要任务可以分为两个步骤,第一步是用爬虫把目标网站的页面抓下来,第二步就是解析该HTML页面,看看里面的内容到底是新闻、图片还是视频。假设第一步已经完成了,第二步应该如何解析HTML呢?HTML本质上是XML的子集,但是HTML的语法没有XML那么严格,所以不能用标准的DOM或SAX来解析HTML。好在Python提供了……继续阅读 » 搞java代码 1个月前 (05-24) 1浏览 0评论0个赞