Objective c 目标C-为所有图像及其大小的标题、描述和URL列表刮取网页
我试图用它来刮网页,但我不知道它的语法 使用XPathQuery进行搜索 我需要从任意网页获取标题、描述和图像列表 目前的代码类似于Objective c 目标C-为所有图像及其大小的标题、描述和URL列表刮取网页,objective-c,web-scraping,tfhpple,Objective C,Web Scraping,Tfhpple,我试图用它来刮网页,但我不知道它的语法 使用XPathQuery进行搜索 我需要从任意网页获取标题、描述和图像列表 目前的代码类似于 NSData * data = [NSData dataWithContentsOfURL:[NSURL URLWithString:@"http://www.google.com"]]; TFHpple * doc = [[TFHpple alloc] initWithHTMLData:data]; NSArray *arr
NSData * data = [NSData dataWithContentsOfURL:[NSURL URLWithString:@"http://www.google.com"]];
TFHpple * doc = [[TFHpple alloc] initWithHTMLData:data];
NSArray *arr = [doc searchWithXPathQuery:@"//title"];
TFHppleElement *titleElem = [arr firstObject];
NSString *titleStr = titleElem.text;
NSLog(@"arr = %@",arr);
我希望它能够检索所有节点
arr = [doc searchWithXPathQuery:@"//"];
但事实并非如此
我不在乎把框架换成另一个
这样做的最佳策略是什么?请查看
NSURL *sUrl = [NSURL URLWithString:@"http://www.apple.com/"];
NSData *htmlData = [NSData dataWithContentsOfURL:sUrl];
NSString *markUp = [NSString stringWithUTF8String:[htmlData bytes]];
HTMLDocument *site = [HTMLDocument documentWithString:markUp];
NSString *siteTitle = [site firstNodeMatchingSelector:@"title"].textContent;