Python 基于Hadoop的股市数据分析
我正在为我的大学项目创建一个使用Hadoop分析股票数据的项目。我已经使用Cloudera manager在Google云上创建了集群。 我是一个完全的初学者。根据我的研究,我需要获得一个API来获取数据,并使用MAPR代码或任何其他方法对其进行处理。 但是,我不知道如何集成该API将数据导入hadoop集群 指向我尝试使用的API的链接: python包装类:我不知道它的用途 请有人帮我解释一下获取数据的基本过程。我愿意接受关于其他API或其他建议的建议。Python 基于Hadoop的股市数据分析,python,hadoop,stock,stockquotes,Python,Hadoop,Stock,Stockquotes,我正在为我的大学项目创建一个使用Hadoop分析股票数据的项目。我已经使用Cloudera manager在Google云上创建了集群。 我是一个完全的初学者。根据我的研究,我需要获得一个API来获取数据,并使用MAPR代码或任何其他方法对其进行处理。 但是,我不知道如何集成该API将数据导入hadoop集群 指向我尝试使用的API的链接: python包装类:我不知道它的用途 请有人帮我解释一下获取数据的基本过程。我愿意接受关于其他API或其他建议的建议。 非常感谢您提供的任何帮助。githu
非常感谢您提供的任何帮助。github存储库链接清楚地解释了一切。您不需要从任何地方获取数据。只需从第一个链接获取api密钥,然后按照github自述文档进行操作。您只需输入要使用其股票数据的公司的股票代码
请参考您共享的github链接。所有内容都有完整的文档记录。如果您试图在Cloudera环境中使用MapR代码,可能会遇到一些问题。除非你是说MapReduceBebesides,否则Cloudera不提供Nifi。不知道你为什么给它贴标签。鉴于自述文件使用Pandas,并且没有对Hadoop的引用,该API不需要连接到Hadoop。您下载一个文件并将其上传到HDFS或谷歌云存储谢谢。我获得了到存储库的链接,并能够创建它。但现在我无法验证它。我需要配置SSL上下文的详细信息。身份验证详细信息需要以下详细信息密钥库文件名:密钥库密码:密钥库类型:JKS/PKCS12信任库文件名:信任库密码:信任库类型:JKS/PKCS12我在站点证书中找不到任何此类信息。在继续之前,请确保您没有防火墙问题。如果您使用的是学院/公司的互联网,则可能存在防火墙限制。如果您正在使用家庭互联网连接,但仍然面临相同的问题,则可以在上述存储库的“问题”部分提出查询。以下是链接: