Warning: file_get_contents(/data/phpspider/zhask/data//catemap/2/csharp/317.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
C# xls xml文件到CSV_C#_Xml_Excel - Fatal编程技术网

C# xls xml文件到CSV

C# xls xml文件到CSV,c#,xml,excel,C#,Xml,Excel,我有一个从blackbox系统收到的文件,该文件以某种方式混合在xml和excel之间,当我使用excel打开该文件时,首先会收到一条警告消息,如果我使用文本编辑器打开该文件,则以下xml头是: <?xml version="1.0" encoding="UTF-8"?> <?mso-application progid="Excel.Sheet"?> <Workbook xmlns="urn:schemas-microsoft-com:office

我有一个从blackbox系统收到的文件,该文件以某种方式混合在xml和excel之间,当我使用excel打开该文件时,首先会收到一条警告消息,如果我使用文本编辑器打开该文件,则以下xml头是:

<?xml version="1.0" encoding="UTF-8"?>
    <?mso-application progid="Excel.Sheet"?>
    <Workbook xmlns="urn:schemas-microsoft-com:office:spreadsheet"
        xmlns:o="urn:schemas-microsoft-com:office:office"
        xmlns:x="urn:schemas-microsoft-com:office:excel"
        xmlns:ss="urn:schemas-microsoft-com:office:spreadsheet"
        xmlns:html="http://www.w3.org/TR/REC-html40">

        <Styles>

                <Style ss:ID="Default">
                    <Alignment ss:Horizontal="Left" ss:Vertical="Bottom" />
                    <Borders/>
                    <Font/>
                    <Interior/>
                    <NumberFormat/>
                    <Protection/>
                </Style>
                <Style ss:ID="sHeader">
                    <Alignment ss:Horizontal="Left" ss:Vertical="Bottom" />
                    <Font ss:Bold="1"/>
                    <NumberFormat ss:Format="@"/>
                </Style>

我尝试了许多解决方案,包括(首先尝试将文件导入DataGridView,然后将其导出到csv),但我总是得到无法识别的数据库格式

首先,这是什么样的xls与xml文件混合?我如何删除所有这些头部信息,而只拥有一个简单的csv文件

更新: 我找到了从这个excel XML文件加载数据的方法,但是我在一列中接收所有数据

这是我使用的代码:

 XmlDocument xml = new XmlDocument();
            string filePath = @"C:\temp\test.xml";
            xml.Load(filePath);
            XmlNamespaceManager nsmgr = new XmlNamespaceManager(xml.NameTable);
            nsmgr.AddNamespace("ss", "urn:schemas-microsoft-com:office:spreadsheet");
            XmlElement root = xml.DocumentElement;
            XmlNodeList nodeList = root.SelectNodes("//ss:Data", nsmgr);
            dataGridView1.DataSource= ConvertXmlNodeListToDataTable(nodeList);


public static DataTable ConvertXmlNodeListToDataTable(XmlNodeList xnl)
        {

            DataTable dt = new DataTable();

            int TempColumn = 0;



            foreach (XmlNode node in xnl.Item(0).ChildNodes)
            {

                TempColumn++;

                DataColumn dc = new DataColumn(node.Name, System.Type.GetType("System.String"));

                if (dt.Columns.Contains(node.Name))
                {

                    dt.Columns.Add(dc.ColumnName = dc.ColumnName + TempColumn.ToString());

                }

                else
                {

                    dt.Columns.Add(dc);

                }

            }

            int ColumnsCount = dt.Columns.Count;
            for (int i = 0; i < xnl.Count; i++)
            {

                DataRow dr = dt.NewRow();

                for (int j = 0; j < ColumnsCount; j++)
                {

                    dr[j] = xnl.Item(i).ChildNodes[j].InnerText;

                }

                dt.Rows.Add(dr);

            }

            return dt;

        }

    }
xmldocumentxml=newxmldocument();
字符串文件路径=@“C:\temp\test.xml”;
Load(文件路径);
XmlNamespaceManager nsmgr=新的XmlNamespaceManager(xml.NameTable);
AddNamespace(“ss”,“urn:schemas-microsoft-com:office:spreadsheet”);
XmlElement root=xml.DocumentElement;
XmlNodeList nodeList=root.SelectNodes(//ss:Data),nsmgr);
dataGridView1.DataSource=ConvertXmlNodeListToDataTable(nodeList);
公共静态数据表ConvertXmlNodeListToDataTable(XmlNodeList xnl)
{
DataTable dt=新的DataTable();
int TempColumn=0;
foreach(xnl.Item(0.ChildNodes)中的XmlNode节点)
{
TempColumn++;
DataColumn dc=新的DataColumn(node.Name,System.Type.GetType(“System.String”));
if(dt.Columns.Contains(node.Name))
{
添加(dc.ColumnName=dc.ColumnName+TempColumn.ToString());
}
其他的
{
dt.Columns.Add(dc);
}
}
int ColumnsCount=dt.Columns.Count;
对于(int i=0;i
我找到了一个解决方案:

使用microsoft名称空间加载xls xml文件 获取xmlNodeList

请注意,在我的区域中,我们使用分号作为分隔符

public static XmlNodeList ParseExcelEXMLFormat(string filePath)
   {
       try
       {

            XmlDocument xml = new XmlDocument();
            xml.Load(filePath);
            XmlNamespaceManager nsSchema = new XmlNamespaceManager(xml.NameTable);
            nsSchema.AddNamespace("ss", "urn:schemas-microsoft-com:office:spreadsheet");
            XmlElement root = xml.DocumentElement;
            XmlNodeList nodeList = root.SelectNodes("//ss:Data", nsSchema);
            return nodeList;
       }
       catch (Exception)
       {

           throw;
       }
   }
然后将XmlNodeList转换为StringBuilder

 public static StringBuilder XMLNodeListToStringBuilderConverter(XmlNodeList xmlNodeList, string separator)
   {
       try
       {
           StringBuilder sb = new StringBuilder();
           DataTable dt = new DataTable();
           foreach (XmlNode node in xmlNodeList.Item(0).ChildNodes) 
           {
               DataColumn dc = new DataColumn(node.FirstChild.InnerText, System.Type.GetType("System.String"));
               dt.Columns.Add(dc);
           }

           int ColumnsCount = dt.Columns.Count;

           string[] columnNames = dt.Columns.Cast<DataColumn>().
                                             Select(column => column.ColumnName).
                                             ToArray();
           sb.AppendLine(string.Join(separator, columnNames));

           string[] rows = new string[ColumnsCount];

           for (int i = 1; i < xmlNodeList.Count; i++) // loop through rows
           {
               for (int j = 0; j < ColumnsCount; j++) // loop through columns
               {

                   rows[j] = xmlNodeList.Item(i).ChildNodes[j].InnerText.Replace(separator, ",").Replace("\r\n", " ").Replace("\n", " ").Replace("\r", " "); // remove seperator from original text, it will casue problem 

               }
               sb.AppendLine(string.Join(separator, rows));
               Array.Clear(rows, 0, ColumnsCount);
           }

           return sb;
       }
       catch (Exception)
       {

           throw;
       }
   }
公共静态StringBuilder XMLNodeListToStringBuilderConverter(XmlNodeList XmlNodeList,字符串分隔符)
{
尝试
{
StringBuilder sb=新的StringBuilder();
DataTable dt=新的DataTable();
foreach(xmlNodeList.Item(0.ChildNodes)中的XmlNode节点)
{
DataColumn dc=新的DataColumn(node.FirstChild.InnerText,System.Type.GetType(“System.String”);
dt.Columns.Add(dc);
}
int ColumnsCount=dt.Columns.Count;
string[]columnNames=dt.Columns.Cast()。
选择(column=>column.ColumnName)。
ToArray();
sb.AppendLine(string.Join(分隔符、列名));
string[]行=新字符串[ColumnsCount];
for(int i=1;i
您检查过最新版本的Microsoft Office所使用的XML格式吗?我已经安装了Office 2007,我相信提供该文件的公司使用Office 2003A google作为格式,其中包括以下内容