Java 高效地将包含字母的字符串转换为Int-Apache Spark

Java 高效地将包含字母的字符串转换为Int-Apache Spark,java,python,scala,apache-spark,Java,Python,Scala,Apache Spark,我正在使用一个将用户作为字符串的数据集(即B000GKXY4S)。我想将这些用户中的每一个都转换为int,这样我就可以在apachespark中使用Rating(user:int,product:int,Rating:Double)类。最有效的方法是什么?最好使用Spark Scala函数或python本机函数。如果您只想将任何可匹配字符串转换为int-字符串。hashCode()。但是,您必须处理可能的哈希冲突。或者,你必须将每个字符转换成int值,并将它们添加到一起(不添加)。如果字符串由8

我正在使用一个将用户作为字符串的数据集(即B000GKXY4S)。我想将这些用户中的每一个都转换为int,这样我就可以在apachespark中使用Rating(user:int,product:int,Rating:Double)类。最有效的方法是什么?最好使用Spark Scala函数或python本机函数。

如果您只想将任何可匹配字符串转换为int-
字符串。hashCode()
。但是,您必须处理可能的哈希冲突。或者,你必须将每个字符转换成int值,并将它们添加到一起(不添加)。

如果字符串由8位字符组成,你可以认为它们是基本的256个数字。这将为每个值提供一个唯一的整数值,尽管它可能是一个巨大的数字(Python可以轻松处理)。