Warning: file_get_contents(/data/phpspider/zhask/data//catemap/0/backbone.js/2.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Web 音乐抒情网站如何或从何处获取数据?_Web_Web Scraping - Fatal编程技术网

Web 音乐抒情网站如何或从何处获取数据?

Web 音乐抒情网站如何或从何处获取数据?,web,web-scraping,Web,Web Scraping,有成吨的音乐歌词网站在那里。不久前,我正在看我加入的乐队的一些歌词。这让我想,“这个网站是如何获得所有这些歌词的,我又是如何获得类似的东西的?”当时找不到太多,所以我决定写一个程序,基本上解析一个网站的乐队信息和歌词,并将数据放在我创建的数据库中 但我仍然想知道这些网站是如何获得数据的?我的方法不是非常有效,非常特定于站点,如果站点更改其脚本结构,我必须更改解析程序。一定有更简单的方法 非常感谢任何人的想法 我猜是JSON文件还是XML文件。要“掌握它”,有多种方法从网站下载数据。wget是一种

有成吨的音乐歌词网站在那里。不久前,我正在看我加入的乐队的一些歌词。这让我想,“这个网站是如何获得所有这些歌词的,我又是如何获得类似的东西的?”当时找不到太多,所以我决定写一个程序,基本上解析一个网站的乐队信息和歌词,并将数据放在我创建的数据库中

但我仍然想知道这些网站是如何获得数据的?我的方法不是非常有效,非常特定于站点,如果站点更改其脚本结构,我必须更改解析程序。一定有更简单的方法


非常感谢任何人的想法

我猜是JSON文件还是XML文件。要“掌握它”,有多种方法从网站下载数据。wget是一种手段,我并不宽恕它,但它几乎不是一个秘密

大多数网站都是从用户那里获得歌词的。例如,Musixmatch允许用户在数据库中不存在歌词的情况下创建歌词。当用户创建歌词时,它可能会自动保存到musixmatch的数据库中。有很多歌词网站允许用户上传歌词

网站获取数据的另一种方式是通过数据挖掘,就像你说的,编写一个解析器/刮板来浏览其他人的网站