对IMDB FTP数据标题类型进行排序

对IMDB FTP数据标题类型进行排序,ftp,text-extraction,imdb,Ftp,Text Extraction,Imdb,我试图建立一个图表来连接演员,他们使用IMDB ftp数据制作电影 然而,我只想用电影(标题类型:-故事片)作为连接。 我从IMDB下载了ftp数据。但是,我无法从文件中提取标题类型。我想知道是否有任何机构试图根据标题类型对IMDB提供的ftp数据进行排序,以及它们是如何区分的。标题本身将告诉您正在处理的是哪种节目 如果以“(电视)”结尾,则是一部电视电影(为电视制作的一集) 如果以“(V)”结尾,则为视频电影(直接指向视频) 如果它被引号包围,并以“(mini)”结尾,那么它就是一部电视迷你

我试图建立一个图表来连接演员,他们使用IMDB ftp数据制作电影

然而,我只想用电影(标题类型:-故事片)作为连接。
我从IMDB下载了ftp数据。但是,我无法从文件中提取标题类型。我想知道是否有任何机构试图根据标题类型对IMDB提供的ftp数据进行排序,以及它们是如何区分的。

标题本身将告诉您正在处理的是哪种节目

  • 如果以“(电视)”结尾,则是一部电视电影(为电视制作的一集)
  • 如果以“(V)”结尾,则为视频电影(直接指向视频)
  • 如果它被引号包围,并以“(mini)”结尾,那么它就是一部电视迷你剧。(注意:我认为该类别在纯文本数据文件中不再存在)
  • 如果它只是被引号包围着,那它就是一部电视连续剧
  • 如果标题被引号包围,并以另一个标题结尾,并用大括号括起来,则它是电视(迷你或非迷你)系列剧的一集(括号内有该集的标题-如果已知的话-或#季节号、情节号或播出日期)
  • 其他任何东西都是电影
一个特例是电视连续剧中标有{{SUSPENDED}},这意味着这一集从未制作过,但它是计划好的,将来可能会制作

请注意,这些规则仅适用于可以从FTP服务器下载的纯文本数据文件。几年来,在网站上遵循了不同的规则

我已经做了很多关于这个主题的研究,是的主要作者(顺便说一句:看一下,因为将这些信息导入到SQL数据库中可能对您有用)