将“逗号”列表数据库拆分为单独的数组(JAVA 1.7)

将“逗号”列表数据库拆分为单独的数组(JAVA 1.7),java,arrays,database,parsing,Java,Arrays,Database,Parsing,我正在做一个数据分析项目,我需要将一个非表而不是数组的数据库拆分成数组。数据库如下所示: 57, Federal-gov, 337895, Bachelors, 13, Married-civ-spouse, Prof-specialty, Husband, Black, Male, 0, 0, 40, United-States, >50K 38, Private, 28887, 11th, 7, Married-civ-spouse, Sales, Husband, White, Ma

我正在做一个数据分析项目,我需要将一个非表而不是数组的数据库拆分成数组。数据库如下所示:

57, Federal-gov, 337895, Bachelors, 13, Married-civ-spouse, Prof-specialty, Husband, Black, Male, 0, 0, 40, United-States, >50K
38, Private, 28887, 11th, 7, Married-civ-spouse, Sales, Husband, White, Male, 0, 0, 50, United-States, <=50K
41, State-gov, 101603, Assoc-voc, 11, Married-civ-spouse, Craft-repair, Husband, White, Male, 0, 0, 40, United-States, <=50K
如您所见,不同的变量/列由逗号分隔。我想知道将这些数据分割成单独数组的最有效方法是什么,每个列/变量都会变成一个单独的数组条目。代码应该接收这个数据库,然后遍历每一行,并用适当的值设置一个新的数组条目。现在我可以使用字符串数组了。此外,我还想从数据库中删除包含未完成信息的行,这些行缺少以?表示的数据?。任何帮助都将不胜感激:。如果您有任何问题,请随时提问。我在Java1.7中工作。谢谢


关于我正在使用的数据库的更多信息(如果需要):我绝对不会在这里发布完整的答案,因为这将是一个“请为我做”的问题。我将向您展示我将遵循的算法来解决它,并共享几个链接以开始

逐行读取文件。 用逗号分隔这行。 将每个字段映射到一个类中,该类保存数据并具有相应的类型POJO。您需要访问数组的每个位置,映射字段并将其转换为正确的类型。 将POJO添加到ArrayList或任何其他类型的列表中,或按其ID将其映射到hashmap中。 调试,调试和调试。想想所有可能出错的事情。。。该文件的格式可能不正确。如果值包含逗号怎么办?如果将数据存储到HashMap中,并且文件上有重复的Id,该怎么办?如果CSV中的类型不一致怎么办?如果…怎么办。。。?
祝你好运

你试过什么,有什么问题?我建议你仔细阅读一下如何逐行阅读文本文件,以及如何用逗号分隔每一行。我还建议使用Java 8,因为它有一个流API,有助于数据处理Java 1.7是一个由“逗号”列表组成的旧版本数据库,您是指CSV文件吗?读取CSV文件的最佳方法是使用。