pyquery的使用

pyquery可以像jquery那样操作xml文档,一般如果想要获取html里某元素的内容都是使用正则之类的方法,正则这方法想要匹配精准,表达式得写好,不像pyquery选择器那样很容易就可以写出来,下面我简单的介绍下我个人使用。

首先使用:"pip install pyquery"安装,结果如下图:

安装完毕之后即可使用:

from pyquery import PyQuery as pq
d = pq(url='http://www.bstaint.net')
d('title').text()

不过在使用中遇到个问题,在使用"d(‘td:first’).text()"的时候报如下错误:

AttributeError: ‘XPathExpr’ object has no attribute ‘add_post_condition’

截图如下:

之后搜索了下,找到了解决方法,使用github上的版本即可解决该问题:

pip uninstall pyquery
pip install git+git://github.com/gawel/pyquery.git

下面是测试截图:

补充:
简单使用了下,感觉还需要继续加强,比如上图我原本使用的选择器是"d(‘h2 a:first’).text()"这样是无法获取我需要的标签。

参考链接:http://stackoverflow.com/questions/15474248/attributeerror-xpathexpr-object-has-no-attribute-add-post-condition

转载请注明: 本文《pyquery的使用》来源于bstaint的博客

没有评论: