Web 音乐抒情网站如何或从何处获取数据?
有成吨的音乐歌词网站在那里。不久前,我正在看我加入的乐队的一些歌词。这让我想,“这个网站是如何获得所有这些歌词的,我又是如何获得类似的东西的?”当时找不到太多,所以我决定写一个程序,基本上解析一个网站的乐队信息和歌词,并将数据放在我创建的数据库中 但我仍然想知道这些网站是如何获得数据的?我的方法不是非常有效,非常特定于站点,如果站点更改其脚本结构,我必须更改解析程序。一定有更简单的方法Web 音乐抒情网站如何或从何处获取数据?,web,web-scraping,Web,Web Scraping,有成吨的音乐歌词网站在那里。不久前,我正在看我加入的乐队的一些歌词。这让我想,“这个网站是如何获得所有这些歌词的,我又是如何获得类似的东西的?”当时找不到太多,所以我决定写一个程序,基本上解析一个网站的乐队信息和歌词,并将数据放在我创建的数据库中 但我仍然想知道这些网站是如何获得数据的?我的方法不是非常有效,非常特定于站点,如果站点更改其脚本结构,我必须更改解析程序。一定有更简单的方法 非常感谢任何人的想法 我猜是JSON文件还是XML文件。要“掌握它”,有多种方法从网站下载数据。wget是一种
非常感谢任何人的想法 我猜是JSON文件还是XML文件。要“掌握它”,有多种方法从网站下载数据。wget是一种手段,我并不宽恕它,但它几乎不是一个秘密大多数网站都是从用户那里获得歌词的。例如,Musixmatch允许用户在数据库中不存在歌词的情况下创建歌词。当用户创建歌词时,它可能会自动保存到musixmatch的数据库中。有很多歌词网站允许用户上传歌词 网站获取数据的另一种方式是通过数据挖掘,就像你说的,编写一个解析器/刮板来浏览其他人的网站