从列表文件格式创建xml文件
我已经从imdb数据库下载了一些.LIST文件,我想使用SNA软件(输入可以是xml或csv)将它们用于一些社交网络分析(参考研究).这些库可能会帮助您:从列表文件格式创建xml文件,xml,list,csv,imdb,imdbpy,Xml,List,Csv,Imdb,Imdbpy,我已经从imdb数据库下载了一些.LIST文件,我想使用SNA软件(输入可以是xml或csv)将它们用于一些社交网络分析(参考研究).这些库可能会帮助您: 以下是我编造的一些相关内容:一个sed文件“movies2xml.sed”: #符号等。。 s|和| \&|G s|| \|g #最后一个字段,如果是范围 [12\?][0189\?][0-9\?][0-9\?][0-9\?][0-9\?][0189\?][0-9\?][0-9\?][0-9\?][1\2| #最后一个字段(如果为单
以下是我编造的一些相关内容:一个sed文件“movies2xml.sed”:
#符号等。。
s|和| \&|G
s|| \|g
#最后一个字段,如果是范围
[12\?][0189\?][0-9\?][0-9\?][0-9\?][0-9\?][0189\?][0-9\?][0-9\?][0-9\?][1\2|
#最后一个字段(如果为单个字段)
s | \([12?][0189?][0-9?][0-9?]\)$\1|
#专为电视/视频/视频游戏制作。。
s |(\([TVG][TVG]*\)*
我希望在某个地方会有一个xml到json的转换器,对于信徒来说。我不知道“.LIST”文件是什么样子。请在此页面添加示例。例如movies.list:对不起,我无法从我工作的位置访问FTP服务器。我认为最好是把相关信息添加到问题的右边,这样所有的东西都放在一个地方。
( F=movies.xml ; echo '<list>' > $F ; \
zcat movies.list.gz | \
tr '\t' ' ' | tr -s ' -' | recode l9..u8..xml | \
sed -f movies2xml.sed >> $F ; \
echo '</list>' >> $F ; ) &
<?xml version="1.0" encoding="UTF-8"?>
<!-- imdb_movies_list.xsd -->
<xs:schema xmlns:xs="http://www.w3.org/2001/XMLSchema">
<xs:element name="list">
<xs:complexType>
<xs:sequence>
<xs:element minOccurs="0" maxOccurs="unbounded" ref="entry"/>
</xs:sequence>
</xs:complexType>
</xs:element>
<xs:element name="entry">
<xs:complexType>
<xs:sequence>
<xs:element minOccurs="1" maxOccurs="1" ref="title"/>
<xs:element minOccurs="1" maxOccurs="1" ref="y"/>
<xs:choice>
<xs:element minOccurs="0" maxOccurs="1" ref="for"/>
<xs:element minOccurs="0" maxOccurs="1" ref="ep"/>
</xs:choice>
<xs:element minOccurs="1" maxOccurs="1" ref="when"/>
</xs:sequence>
</xs:complexType>
</xs:element>
<xs:element name="title">
<xs:complexType mixed="true">
<xs:attribute name="type" use="required">
<xs:simpleType>
<xs:restriction base="xs:token">
<xs:enumeration value="tvseries"/>
<xs:enumeration value="videogame"/>
<xs:enumeration value="film"/>
</xs:restriction>
</xs:simpleType>
</xs:attribute>
</xs:complexType>
</xs:element>
<xs:element name="y">
<xs:complexType>
<xs:simpleContent>
<xs:extension base="yeartype">
<xs:attribute name="N" use="optional">
<xs:simpleType>
<xs:restriction base="xs:token">
<xs:enumeration value="I"/>
<xs:enumeration value="II"/>
<xs:enumeration value="III"/>
<xs:enumeration value="IV"/>
<xs:enumeration value="V"/>
<xs:enumeration value="VI"/>
<xs:enumeration value="VII"/>
<xs:enumeration value="VIII"/>
<xs:enumeration value="IX"/>
<xs:enumeration value="X"/>
<xs:enumeration value="XI"/>
<xs:enumeration value="XII"/>
<xs:enumeration value="XIII"/>
<xs:enumeration value="XIV"/>
<xs:enumeration value="XV"/>
<xs:enumeration value="XVI"/>
<xs:enumeration value="XVII"/>
<xs:enumeration value="XVIII"/>
<xs:enumeration value="XIX"/>
<xs:enumeration value="XX"/>
<xs:enumeration value="XXI"/>
<xs:enumeration value="XXII"/>
<xs:enumeration value="XXIII"/>
<xs:enumeration value="XXIV"/>
<xs:enumeration value="XXV"/>
<xs:enumeration value="XXVI"/>
<xs:enumeration value="XXVII"/>
<xs:enumeration value="XXVIII"/>
<xs:enumeration value="XXIX"/>
</xs:restriction>
</xs:simpleType>
</xs:attribute>
</xs:extension>
</xs:simpleContent>
</xs:complexType>
</xs:element>
<xs:element name="for">
<xs:simpleType>
<xs:restriction base="xs:token">
<xs:enumeration value="TV"/>
<xs:enumeration value="V"/>
<xs:enumeration value="VG"/>
</xs:restriction>
</xs:simpleType>
</xs:element>
<xs:element name="ep">
<xs:complexType mixed="true">
<xs:attribute name="s" type="xs:integer" use="optional"/>
<xs:attribute name="e" type="xs:integer" use="optional"/>
</xs:complexType>
</xs:element>
<xs:element name="when">
<xs:complexType>
<xs:choice>
<xs:sequence>
<xs:element name="y" type="yeartype" minOccurs="1" maxOccurs="1"/>
</xs:sequence>
<xs:sequence>
<xs:element name="f" type="yeartype" minOccurs="1" maxOccurs="1"/>
<xs:element name="t" type="yeartype" minOccurs="1" maxOccurs="1"/>
</xs:sequence>
</xs:choice>
</xs:complexType>
</xs:element>
<xs:simpleType name="yeartype">
<xs:restriction base="xs:string">
<xs:pattern value="[12?][0189?][0-9?][0-9?]"/>
</xs:restriction>
</xs:simpleType>
</xs:schema>