Parsing 如何使用pup限制标记级别的结果数?

Parsing 如何使用pup限制标记级别的结果数?,parsing,command-line,css-selectors,html-parsing,pup,Parsing,Command Line,Css Selectors,Html Parsing,Pup,简言之: 有没有一种方法可以用来限制结果的数量,而不是总的,而是在标记级别 背景故事/用例: 自从我知道了小狗的事,我就被它迷住了。我一直在思考新的用例。今天早上我想用它来抓取最新的头条新闻 ESPN似乎有这样一个无序的列表:然后是一堆列表项 一个简单的解决办法是: $ curl -s -S http://espn.go.com/ | pup .headlines a text{} 对吧??但是,正如你所看到的,有时每行都有多个链接指向每一个主题和其他作者,因此你最终会得到像Low、Anand

简言之:

有没有一种方法可以用来限制结果的数量,而不是总的,而是在标记级别

背景故事/用例:

自从我知道了小狗的事,我就被它迷住了。我一直在思考新的用例。今天早上我想用它来抓取最新的头条新闻

ESPN似乎有这样一个无序的列表:然后是一堆列表项

一个简单的解决办法是:

$ curl -s -S http://espn.go.com/ | pup .headlines a text{}
对吧??但是,正如你所看到的,有时每行都有多个链接指向每一个主题和其他作者,因此你最终会得到像Low、Anande、Stark和Dinich等ESPN作者的姓氏这样的结果

理想情况下,我想做这样的事情:

$ curl -s -S http://espn.go.com/ | pup .headlines li a slice{:1} text{}
但这只返回第一个结果:\


每个项目有多个标记,因此我希望检索所有项目,但将标记数量限制为每个项目1个。这可能吗?

太棒了!谢谢你,埃里克@几周后,LoisaidaSam,但小狗现在有了一个伪动作,可以让这一切干净地发生
$ curl -s -S http://espn.go.com/ | pup '.headlines li a:first-of-type text{}'