Amazon web services AWS上的机器学习(NLP)。云9?SageMaker?EC2-AMI?

Amazon web services AWS上的机器学习(NLP)。云9?SageMaker?EC2-AMI?,amazon-web-services,amazon-ec2,nlp,amazon-sagemaker,aws-cloud9,Amazon Web Services,Amazon Ec2,Nlp,Amazon Sagemaker,Aws Cloud9,我终于来到了云端,将我的NLP工作提升到了一个新的水平,但我有点被我拥有的所有可能性所淹没。所以我来向你寻求建议 目前我看到三种可能性: SageMaker Jupyter笔记本非常棒 它既快又简单 节省了大量用于管理一切的时间,您可以非常轻松地将模型投入生产 花费更多 无版本控制 Cloud9 EC2(-AMI) 那就是我现在的处境。我真的很喜欢SageMaker,尽管我不喜欢缺少版本控制(至少我现在还没有找到任何东西) Cloud9似乎只是EC2实例的IDE。。我还没有发现Cloud

我终于来到了云端,将我的NLP工作提升到了一个新的水平,但我有点被我拥有的所有可能性所淹没。所以我来向你寻求建议

目前我看到三种可能性:

  • SageMaker
    • Jupyter笔记本非常棒
    • 它既快又简单
    • 节省了大量用于管理一切的时间,您可以非常轻松地将模型投入生产
    • 花费更多
    • 无版本控制
  • Cloud9
  • EC2(-AMI)
那就是我现在的处境。我真的很喜欢SageMaker,尽管我不喜欢缺少版本控制(至少我现在还没有找到任何东西)

Cloud9似乎只是EC2实例的IDE。。我还没有发现Cloud9和SageMaker在机器学习方面的任何比较。可能是因为Cloud9不是作为ML解决方案发布的。但这似乎是一种选择

你对这个问题有什么看法?我错过了什么?你建议我去干什么?你的工作流程是什么?为什么


我正在寻找一个简单的工作环境,在那里我可以快速测试我的模型,准确地说。这不仅仅是我一个人在做,这是一个团队的努力

由于您是一个团队,我建议使用sagemaker定制docker图像。这样,您就可以完全自由地使用您的算法。docker图像存储在ecr中。在这里,您可以上传同一映像的多个版本,并对它们进行标记,以保持对不同版本(您从git repo构建)的控制

Sagemaker还将执行角色赋予docker映像内部。因此,您仍然可以完全访问其他aws资源(如果执行角色具有正确的权限)

在我看来,这是一个很好的开始,因为它显示了sagemaker是如何与您的图像交互的

关于其他解决方案的一些注意事项:

您发布的所有其他解决方案的问题都是您希望在同一台机器上构建和执行。当然你可以这样做,但请记住,gpu实例是昂贵的,因此你可能只有在代码准备好运行时才切换到云

一些其他注释

  • Jupyter笔记本一般不适合协作编程。我想他们想用jupyter实验室改变这一点,但这仍在开发中,sagemaker目前只使用笔记本电脑

  • EC2和sagemaker一样便宜,但你必须做更多的工作。尤其是如果您希望以docker映像的形式运行模型。此外,使用sagemaker,您可以轻松构建模型推理的端点,而使用ec2实现该端点将更加复杂

  • Cloud 9我从未使用过这项服务,但乍一看,在上面开发似乎不错,但如果你想在gpu机器上实现这一点,问题仍然存在。因为您使用ec2作为实例,所以具有相同的优势/劣势


首先我想指出的是,SageMaker笔记本并不是唯一可以与SageMaker的其他组件(如培训和托管)交互的IDE环境。事实上,只要安装了AWS SDK或SageMaker Python SDK,就可以通过Cloud9或安装在EC2甚至笔记本电脑上的任何IDE对SageMaker培训/托管进行API调用

关于IDE的选择,它实际上取决于您的特定需求。SageMaker笔记本基于Jupyter(现在也支持JupyterLab beta版),以ML为中心,完全管理。在ML中常用的数百个Python包,以及Tensorflow、Keras、MxNet、SageMaker Python SDK等,都是为您预安装和自动维护的。可以想象,它还与SageMaker的其他组件更紧密地集成


Cloud9也是一个托管IDE,但它是通用的,而不是特定于ML的。如果您想在cloud9上使用Jupyter,则需要您进行额外的工作。它不像SageMaker笔记本那样预安装和维护通用ML/DL相关软件包的版本

这个问题很不清楚。你是否在寻找一个简单的工作环境,在那里你可以快速测试你的模型,或者像训练和推断现有算法那样进行自动化生产?我正在寻找一个简单的工作环境,在那里我可以准确地快速测试我的模型。不仅仅是我在做,这是团队的努力。版本控制-git作为命令行工具预先安装在SageMaker笔记本实例上。请记住,并非所有问题都遵循规则。那些不符合要求的问题,例如这一个(基于意见并在没有适当要求的情况下征求建议),将被关闭并可能被删除。当它们被删除时,您的答案也将被删除。