Warning: file_get_contents(/data/phpspider/zhask/data//catemap/2/python/321.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Python 基于Hadoop的股市数据分析_Python_Hadoop_Stock_Stockquotes - Fatal编程技术网

Python 基于Hadoop的股市数据分析

Python 基于Hadoop的股市数据分析,python,hadoop,stock,stockquotes,Python,Hadoop,Stock,Stockquotes,我正在为我的大学项目创建一个使用Hadoop分析股票数据的项目。我已经使用Cloudera manager在Google云上创建了集群。 我是一个完全的初学者。根据我的研究,我需要获得一个API来获取数据,并使用MAPR代码或任何其他方法对其进行处理。 但是,我不知道如何集成该API将数据导入hadoop集群 指向我尝试使用的API的链接: python包装类:我不知道它的用途 请有人帮我解释一下获取数据的基本过程。我愿意接受关于其他API或其他建议的建议。 非常感谢您提供的任何帮助。githu

我正在为我的大学项目创建一个使用Hadoop分析股票数据的项目。我已经使用Cloudera manager在Google云上创建了集群。 我是一个完全的初学者。根据我的研究,我需要获得一个API来获取数据,并使用MAPR代码或任何其他方法对其进行处理。 但是,我不知道如何集成该API将数据导入hadoop集群

指向我尝试使用的API的链接:

python包装类:我不知道它的用途

请有人帮我解释一下获取数据的基本过程。我愿意接受关于其他API或其他建议的建议。
非常感谢您提供的任何帮助。

github存储库链接清楚地解释了一切。您不需要从任何地方获取数据。只需从第一个链接获取api密钥,然后按照github自述文档进行操作。您只需输入要使用其股票数据的公司的股票代码


请参考您共享的github链接。所有内容都有完整的文档记录。

如果您试图在Cloudera环境中使用MapR代码,可能会遇到一些问题。除非你是说MapReduceBebesides,否则Cloudera不提供Nifi。不知道你为什么给它贴标签。鉴于自述文件使用Pandas,并且没有对Hadoop的引用,该API不需要连接到Hadoop。您下载一个文件并将其上传到HDFS或谷歌云存储谢谢。我获得了到存储库的链接,并能够创建它。但现在我无法验证它。我需要配置SSL上下文的详细信息。身份验证详细信息需要以下详细信息密钥库文件名:密钥库密码:密钥库类型:JKS/PKCS12信任库文件名:信任库密码:信任库类型:JKS/PKCS12我在站点证书中找不到任何此类信息。在继续之前,请确保您没有防火墙问题。如果您使用的是学院/公司的互联网,则可能存在防火墙限制。如果您正在使用家庭互联网连接,但仍然面临相同的问题,则可以在上述存储库的“问题”部分提出查询。以下是链接: