Java 更换或删除新行“\";来自Spark数据集列值的字符

Java 更换或删除新行“\";来自Spark数据集列值的字符,java,apache-spark,Java,Apache Spark,我有以下代码来读取xml Dataset<Row> dataset1 = SparkConfigXMLProcessor.sparkSession.read().format("com.databricks.spark.xml") .option("rowTag", properties.get(EventHubConsumerConstants.IG_ORDER_TAG).toString()) .load(prope

我有以下代码来读取xml

Dataset<Row> dataset1 = SparkConfigXMLProcessor.sparkSession.read().format("com.databricks.spark.xml")
                .option("rowTag", properties.get(EventHubConsumerConstants.IG_ORDER_TAG).toString())
                .load(properties.get("C:\\inputOrders.xml").toString());
Dataset dataset1=SparkConfigXMLProcessor.sparkSession.read().format(“com.databricks.spark.xml”)
.option(“rowTag”,properties.get(EventHubConsumerConstants.IG\u ORDER\u TAG.toString())
.load(properties.get(“C:\\inputOrders.xml”).toString();
获取新行字符的列值之一。 我想用一些字符替换它,或者只是想删除它。
请在下面的代码中帮助解决我的问题

Dataset<Row> newDF = dataset1.withColumn("menuitemname", regexp_replace(col("menuitemname"), "[\\n]", ""));
Dataset newDF=dataset1.withColumn(“menuitemname”、regexp\u replace(col(“menuitemname”)、“[\\n]”、“);

上面的代码可以工作

这就是我使用的代码。我通常也会添加一个选项卡(\t)。同时使用\r和\n将查找UNIX(\n)、Windows(\r)和OSX(\r)换行符

Dataset<Row> newDF = dataset1.withColumn("menuitemname", regexp_replace(col("menuitemname"), "\n|\r", ""));
Dataset newDF=dataset1.withColumn(“menuitemname”、regexp\u replace(col(“menuitemname”)、“\n\r”、”);
Dataset<Row> newDF = dataset1.withColumn("menuitemname", regexp_replace(col("menuitemname"), "\n|\r", ""));