Twitter 如何扩展短URL“;4sq.com/xCMa****”;到完整长度的真实URL“;foursquare.com/someone/checkin/4f5d****“;

Twitter 如何扩展短URL“;4sq.com/xCMa****”;到完整长度的真实URL“;foursquare.com/someone/checkin/4f5d****“;,twitter,foursquare,Twitter,Foursquare,我目前正在做一个研究项目,需要从Twitter上收集签入推文 一个爬虫程序已经实现,我收到的推文格式如下:“我在某处4sq.com/xW1q**” 当点击链接“4sq.com/xW1q**”时,页面将重定向到类似“foursquare.com/SOMEONE/checkin/CHECKINID&签名”的URL。我需要提取签入ID和签名,以便获得详细的签入信息 我想问的是,如何通过编程将较短的URL扩展到较长的URL,以获得签入ID和签名?有人建议我应该发出一个HEAD请求来获取完整的URL,但我

我目前正在做一个研究项目,需要从Twitter上收集签入推文

一个爬虫程序已经实现,我收到的推文格式如下:“我在某处4sq.com/xW1q**”

当点击链接“4sq.com/xW1q**”时,页面将重定向到类似“foursquare.com/SOMEONE/checkin/CHECKINID&签名”的URL。我需要提取签入ID和签名,以便获得详细的签入信息

我想问的是,如何通过编程将较短的URL扩展到较长的URL,以获得签入ID和签名?有人建议我应该发出一个HEAD请求来获取完整的URL,但我不知道如何获取


提前谢谢

新的更正确的答案

4sq.com使用bit.ly来缩短URL,因此您应该使用bit.ly API来扩展URL:

HEAD
请求是正确的做法

要在curl中执行
HEAD
请求,请执行以下操作:

curl -i -X HEAD http://4sq.com/abcdefg
返回如下标题:

HTTP/1.1 301 Moved
Server: nginx
Date: Tue, 13 Mar 2012 14:26:02 GMT
Content-Type: text/html; charset=utf-8
...other headers...
Location: <<<FULL URL>>>
HTTP/1.1 301移动
服务器:nginx
日期:2012年3月13日星期二14:26:02 GMT
内容类型:text/html;字符集=utf-8
…其他标题。。。
地点:

如果您能告诉我们更多关于您所使用的编码语言的信息,我们可以为您提供关于如何发出HEAD请求并获取该HEAD值的更具体建议。

谢谢!我自己解决了这个问题。我在Java中使用了“HttpURLConnection”,它很有效。无论如何,感谢你的正确答案。顺便说一句。在我从完整的URL中提取CHECKINID和签名之后,下一步是获取签入发生地的纬度和长度值。有没有关于如何做到这一点的点击?请查看更新的答案,有一个比HEAD请求更好的方法。