创建空数据帧Java Spark

创建空数据帧Java Spark,java,dataframe,apache-spark,Java,Dataframe,Apache Spark,有许多关于如何使用Spark Scala/Python创建空数据帧/数据集的示例。但我想知道如何在JavaSpark中创建一个空的数据帧/数据集 我必须创建一个空数据框,其中只有一列的标题为column_1,并键入String。Alternative-1使用用户定义的模式创建空数据框 //备选方案-1 StructType s=新的StructType() .add(新的StructField(“Column_1”,DataTypes.StringType,true,Metadata.empty

有许多关于如何使用Spark Scala/Python创建空数据帧/数据集的示例。但我想知道如何在JavaSpark中创建一个空的数据帧/数据集

我必须创建一个空数据框,其中只有一列的标题为column_1,并键入String。

Alternative-1使用
用户定义的模式创建
空数据框
//备选方案-1
StructType s=新的StructType()
.add(新的StructField(“Column_1”,DataTypes.StringType,true,Metadata.empty());
数据集csv=spark.read().schema.csv(spark.emptyDataset(Encoders.STRING());
csv.show(假);
printSchema();
/**
* +--------+
*|第1列|
* +--------+
* +--------+
*
*根
*|--第_1列:字符串(nullable=true)
*/
备选方案2:使用
null
值和
用户定义模式创建数据帧
Dataset df4=spark.sql(“选择强制转换(null为字符串)列_1”);
df4.显示(假);
df4.printSchema();
/**
* +--------+
*|第1列|
* +--------+
*|空|
* +--------+
*
*根
*|--第_1列:字符串(nullable=true)
*/
备选案文-3
ClassTag rowTag=scala.reflect.ClassTag$.MODULE$.apply(Row.class);
数据集df5=spark.createDataFrame(spark.sparkContext().emptyRDD(行标记),
新结构类型()
.add(新的StructField(“Column_1”,DataTypes.StringType,true,Metadata.empty());
df5.显示(假);
df5.printSchema();
/**
* +--------+
*|第1列|
* +--------+
* +--------+
*
*根
*|--第_1列:字符串(nullable=true)
*/
spark.emptyDataframe
创建没有任何列和值的数据帧
Dataset-rowDataset=spark.emptyDataFrame();
rowDataset.show(false);
rowDataset.printSchema();
/**
* ++
* ||
* ++
* ++
*
*根
*/
Alternative-1使用
用户定义的模式创建
空数据框
//备选方案-1
StructType s=新的StructType()
.add(新的StructField(“Column_1”,DataTypes.StringType,true,Metadata.empty());
数据集csv=spark.read().schema.csv(spark.emptyDataset(Encoders.STRING());
csv.show(假);
printSchema();
/**
* +--------+
*|第1列|
* +--------+
* +--------+
*
*根
*|--第_1列:字符串(nullable=true)
*/
备选方案2:使用
null
值和
用户定义模式创建数据帧
Dataset df4=spark.sql(“选择强制转换(null为字符串)列_1”);
df4.显示(假);
df4.printSchema();
/**
* +--------+
*|第1列|
* +--------+
*|空|
* +--------+
*
*根
*|--第_1列:字符串(nullable=true)
*/
备选案文-3
ClassTag rowTag=scala.reflect.ClassTag$.MODULE$.apply(Row.class);
数据集df5=spark.createDataFrame(spark.sparkContext().emptyRDD(行标记),
新结构类型()
.add(新的StructField(“Column_1”,DataTypes.StringType,true,Metadata.empty());
df5.显示(假);
df5.printSchema();
/**
* +--------+
*|第1列|
* +--------+
* +--------+
*
*根
*|--第_1列:字符串(nullable=true)
*/
spark.emptyDataframe
创建没有任何列和值的数据帧
Dataset-rowDataset=spark.emptyDataFrame();
rowDataset.show(false);
rowDataset.printSchema();
/**
* ++
* ||
* ++
* ++
*
*根
*/

Good one someshwar增加了一种方法Good one someshwar增加了一种方法