Hadoop和Stata_Hadoop_Hive_Apache Pig_Stata

Hadoop和Stata

hadoop hive apache-pig stata

Hadoop和Stata,hadoop,hive,apache-pig,stata,Hadoop,Hive,Apache Pig,Stata,有人有使用Stata和Hadoop的经验吗？斯塔塔13现在有了一个好机会，所以我认为让他们踢得好应该是很简单的我特别感兴趣的是能够解析weblog数据，将其转换为适合统计分析的形式最近有人提出了这个问题，但没有人回答，所以我想我会在观众更有可能体验到这项技术的地方尝试一下。我将（不）尝试一下。从JavaAPI的外观来看，调用方似乎将Stata本质上视为一个数据存储。如果是这样的话，那么我可以想象Stata将作为一个数据库融入hadoop世界，并通过其自己的InputFormat和Output

有人有使用Stata和Hadoop的经验吗？斯塔塔13现在有了一个好机会，所以我认为让他们踢得好应该是很简单的

我特别感兴趣的是能够解析weblog数据，将其转换为适合统计分析的形式

最近有人提出了这个问题，但没有人回答，所以我想我会在观众更有可能体验到这项技术的地方尝试一下。

我将（不）尝试一下。从JavaAPI的外观来看，调用方似乎将Stata本质上视为一个数据存储。如果是这样的话，那么我可以想象Stata将作为一个数据库融入hadoop世界，并通过其自己的InputFormat和OutputFormat进行访问。在您的特定情况下，我会想象您会编写一个StataOutputFormat，您的reducer将使用它来编写解析数据。唯一的缺点似乎是您引用的评论，即Stata应用程序往往是I/O绑定的，因此我不知道使用hadoop是否真的会对您有所帮助

不管怎样，你都必须写下所有的数据
无论您是否使用hadoop，该写操作都将是I/O绑定的