Web crawler 确定';清洁';广播电台播放的歌曲

Web crawler 确定';清洁';广播电台播放的歌曲,web-crawler,keyword,radio,Web Crawler,Keyword,Radio,我有一个歌曲数据库,可以查看内容,看看它们是否适合广播播放 是否有可能创建一个程序,使用网络爬虫扫描歌词网站上特定艺术家的页面(例如,歌词点播),以获取特定关键字 我可以搜索冲突,该程序会给我一个列表,列出歌词点播网站上包含特定“淫秽”词语的所有冲突页面。因为歌词网站的组织方式倾向于URL包含实际的歌曲标题 (例如),我可以查看检索到的列表,准确地知道哪些歌曲不适合播放。或者,更好的是,该程序只搜索电台iTunes音乐文件夹中包含的歌曲 一个程序能做到这一点吗?如有任何见解和/或建议,将不胜感激

我有一个歌曲数据库,可以查看内容,看看它们是否适合广播播放

是否有可能创建一个程序,使用网络爬虫扫描歌词网站上特定艺术家的页面(例如,歌词点播),以获取特定关键字

我可以搜索冲突,该程序会给我一个列表,列出歌词点播网站上包含特定“淫秽”词语的所有冲突页面。因为歌词网站的组织方式倾向于URL包含实际的歌曲标题 (例如),我可以查看检索到的列表,准确地知道哪些歌曲不适合播放。或者,更好的是,该程序只搜索电台iTunes音乐文件夹中包含的歌曲


一个程序能做到这一点吗?如有任何见解和/或建议,将不胜感激

关于你们图书馆的一点对我来说似乎很重要: 这些曲目必须以一种干净的方式命名,比如“艺术家头衔(混音)”。如果它们像:ArtistXYTrackName,则必须先重命名它们

我认为应该很容易扫描图书馆并列出清单。 然后我肯定有一些歌词页面提供了一个界面。 然后,您只需搜索曲目列表中的每一首曲目->扫描歌词页面的数据库->然后再次扫描关键词


我做了一些研究,发现了一个提供接口(API)的lyric数据库。我想,我可以根据您的需要为您编写一个小工具。

关于您的库的一点似乎对我很重要: 这些曲目必须以一种干净的方式命名,比如“艺术家头衔(混音)”。如果它们像:ArtistXYTrackName,则必须先重命名它们

我认为应该很容易扫描图书馆并列出清单。 然后我肯定有一些歌词页面提供了一个界面。 然后,您只需搜索曲目列表中的每一首曲目->扫描歌词页面的数据库->然后再次扫描关键词


我做了一些研究,发现了一个提供接口(API)的lyric数据库。我想,我可以根据您的需要为您编写一个小工具。

非常感谢您的回复和提供的信息。我不知道API,我想我只是访问了你提到的网站。当你说我需要清理曲目标题时,你是说歌曲应该有合适的标题吗?如果是这样的话,他们会这样做……我必须确保库中的所有歌曲都被正确分类,以帮助利用我们的DJ软件(Megaseg)的功能。或者…你的意思是我需要重命名所有曲目,以便它们都包含艺术家和歌曲标题吗?所有曲目都需要设置为“艺术家-曲目名称”,否则任何工具都无法判断要编辑哪个曲目,但在编辑所有曲目之前,这会更合理,完成一个带有两个编辑轨迹的工具,看看是否一切正常。非常感谢您的回复和提供的信息。我不知道API,我想我只是访问了你提到的网站。当你说我需要清理曲目标题时,你是说歌曲应该有合适的标题吗?如果是这样的话,他们会这样做……我必须确保库中的所有歌曲都被正确分类,以帮助利用我们的DJ软件(Megaseg)的功能。或者…你的意思是我需要重命名所有曲目,以便它们都包含艺术家和歌曲标题吗?所有曲目都需要设置为“艺术家-曲目名称”,否则任何工具都无法判断要编辑哪个曲目,但在编辑所有曲目之前,这会更合理,完成带有两个编辑轨迹的工具,然后查看是否一切正常。