为什么HDInsight上的Python脚本在';没有名为numpy';的模块;?
我已使用脚本操作创建了HDInsight群集,如中所述: 您可以使用脚本操作集群定制在HDInsight上的Hadoop中的任何类型的集群上安装Spark。脚本操作允许您仅在创建集群时运行脚本以自定义集群。有关详细信息,请参阅 我已经运行了一个基本的Python(单词计数示例)脚本,但当我启动一个使用为什么HDInsight上的Python脚本在';没有名为numpy';的模块;?,python,azure,apache-spark,azure-hdinsight,Python,Azure,Apache Spark,Azure Hdinsight,我已使用脚本操作创建了HDInsight群集,如中所述: 您可以使用脚本操作集群定制在HDInsight上的Hadoop中的任何类型的集群上安装Spark。脚本操作允许您仅在创建集群时运行脚本以自定义集群。有关详细信息,请参阅 我已经运行了一个基本的Python(单词计数示例)脚本,但当我启动一个使用NumPy的Python脚本时,我得到一个导入器错误:“没有名为NumPy的模块” 既然NumPy是(应该是)在HDInsight集群上开箱即用安装的,为什么我不能导入该包?有没有办法在节点上安装N
NumPy
的Python脚本时,我得到一个导入器错误:“没有名为NumPy的模块”
既然NumPy是(应该是)在HDInsight集群上开箱即用安装的,为什么我不能导入该包?有没有办法在节点上安装NumPy?HDInsight不允许您对节点进行任何访问。您可以使用脚本操作将自定义包应用于HDInsight群集中的所有数据节点。文件在 大致来说,您要做的是在PowerShell中创建集群,并包括以下内容:
$config = Add-AzureHDInsightScriptAction -Config $config –Name MyScriptActionName –Uri http://uri.to/scriptaction.ps1 –Parameters MyScriptActionParameter -ClusterRoleCollection HeadNode,DataNode
处的脚本可以轻松地存储在blob存储上,并在指定的节点类型上运行。这是用于安装任何自定义python(或其他)软件包的脚本。您可以使用脚本操作将自定义软件包应用于HDInsight集群中的所有数据节点。文件在 大致来说,您要做的是在PowerShell中创建集群,并包括以下内容:
$config = Add-AzureHDInsightScriptAction -Config $config –Name MyScriptActionName –Uri http://uri.to/scriptaction.ps1 –Parameters MyScriptActionParameter -ClusterRoleCollection HeadNode,DataNode
处的脚本可以轻松地存储在blob存储上,并在指定的节点类型上运行。您可以使用该脚本安装任何自定义python(或其他)软件包。您可以使用答案中提到的自定义脚本,但是下面的命令在Hbase-Hdinsight集群中对我有效。(它也应该在Hadoop-Hdinsight集群中工作。)
您可以使用答案中提到的自定义脚本,但是下面的命令在Hbase-Hdinsight集群中适用于我。(它也应该在Hadoop-Hdinsight集群中工作。)