Unix 抓取网页并提取以特定符号开头的单词

Unix 抓取网页并提取以特定符号开头的单词,unix,sed,awk,grep,wget,Unix,Sed,Awk,Grep,Wget,我想从以下内容中提取所有twitter句柄: 所有twitter句柄都以@ 所以像wget twitaholic.com/top100/followers/|grep-oh“@”这样的东西只打印句柄,但这不起作用(只打印@)。怎么了 您正在使用grep的-o选项,并且只指定一个字符,即@,而且您不需要-h选项 试试这个: wget twitaholic.com/top100/followers/ | grep -o "@[^<]*" $ wget twitaholic.com/top10

我想从以下内容中提取所有twitter句柄:

所有twitter句柄都以
@


所以像
wget twitaholic.com/top100/followers/|grep-oh“@”这样的东西只打印句柄,但这不起作用(只打印
@
)。怎么了

您正在使用
grep
-o
选项,并且只指定一个字符,即
@
,而且您不需要
-h
选项

试试这个:

wget twitaholic.com/top100/followers/ | grep -o "@[^<]*"
$ wget twitaholic.com/top100/followers/ | grep -o "@[^<]*" | head -10
@katyperry
@justinbieber
@BarackObama
@ladygaga
@YouTube
@taylorswift13
@britneyspears
@rihanna
@jtimberlake
@instagram
因此,您需要有效地从
@
提取文本
$ wget twitaholic.com/top100/followers/ | grep -o "@[^<]*" | head -10
@katyperry
@justinbieber
@BarackObama
@ladygaga
@YouTube
@taylorswift13
@britneyspears
@rihanna
@jtimberlake
@instagram