在MongoDb中导入CSV文件(包含一些非UTF8字符)

在MongoDb中导入CSV文件(包含一些非UTF8字符),mongodb,csv,utf-8,data-import,database,Mongodb,Csv,Utf 8,Data Import,Database,如何将包含一些非UTF8字符的CSV文件导入MongoDB? 我尝试了一个推荐的导入代码 mongoimport --db dbname --collection colname --type csv --headerline --file D:/fastfood.xls 错误消息 exception: Invalid UTF8 character detected 我会手动删除这些无效字符,但数据的大小相当大 尝试谷歌,但没有成功 PS:mongo-v=2.4.6 谢谢 编辑: 顺便说一

如何将包含一些非UTF8字符的CSV文件导入MongoDB? 我尝试了一个推荐的导入代码

mongoimport --db dbname --collection colname --type csv --headerline --file D:/fastfood.xls
错误消息

exception: Invalid UTF8  character detected
我会手动删除这些无效字符,但数据的大小相当大

尝试谷歌,但没有成功

PS:mongo-v=2.4.6

谢谢

编辑:
顺便说一句,我使用的是Win7,在Linux中,您可以按照以下建议使用
iconv
命令:

iconv-f utf8-t utf8-c file.txt


我不熟悉MongoDB,因此我不知道如何在导入过程中保留无效字符。

您正在尝试将
xls
文件作为
csv
文件导入。请先将文件另存为csv,然后重试。

对于emacs用户:
在emacs中打开CSV文件,并使用“C-x C-m f”更改编码,并选择utf-8作为编码系统。有关更多信息,请参见

Win上也可以这样做吗?如果我在CMD上写'iconv',它将不起作用。(iconv不被识别为内部或外部命令)我认为可以在这里为windows下载iconv命令:如何在windows中从.csv文件中删除无效的UTF-8字符?iconv-f UTF-8-t UTF-8文件\u带有\u non\u utf8\u chars.csv>out.csvDid您得到了想要的结果(成功导入)还是相同的UTF-8错误?您是如何将文件从xls转换为csv的?我的意思是我得到了相同的结果-错误。我刚刚将文件保存为“csv”。没有使用任何工具或其他东西对其进行转换。假设它现在是一个有效的csv文件(例如,打开文件时可以看到数据,类似于记事本++),则确实存在一些奇怪的unicode问题。在将文件加载到Mongo之前,需要对其进行预处理。我会使用Python来实现这一点;我不知道使用PowerShell有什么直接的方法。仅仅因为它有.xls后缀并不意味着它是一个excel文件。很多应用程序都会输出csv/tsv并给它加上后缀。在记事本上看它。