Machine learning 对没有Matlab的机器学习工具集的建议

Machine learning 对没有Matlab的机器学习工具集的建议,machine-learning,artificial-intelligence,Machine Learning,Artificial Intelligence,我是机器学习领域的新手,我计划使用python作为实现算法的编程语言,使用Java作为系统架构 据我所知,机器学习更多的是对特定领域的数据进行建模,可视化数据,并选择合适的模型和参数。实现模型/算法是最后一步,也是相对容易的一步 Matlab似乎拥有机器学习的一切,但它太昂贵,需要学习一门新的语言 对于企业项目的机器学习,除了编程语言之外,我通常还需要什么工具?数据建模、可视化等方面经过几年的反复试验,我建议您直接使用python,可能使用scikit learn或tensorflow(如果您想

我是机器学习领域的新手,我计划使用python作为实现算法的编程语言,使用Java作为系统架构

据我所知,机器学习更多的是对特定领域的数据进行建模,可视化数据,并选择合适的模型和参数。实现模型/算法是最后一步,也是相对容易的一步

Matlab似乎拥有机器学习的一切,但它太昂贵,需要学习一门新的语言


对于企业项目的机器学习,除了编程语言之外,我通常还需要什么工具?数据建模、可视化等方面经过几年的反复试验,我建议您直接使用python,可能使用scikit learn或tensorflow(如果您想使用硬核:)

我过去也尝试过R,虽然它是一种非常有效的语言,但它也有一些限制:默认情况下它是单线程的,尽管有解决方案,但它们没有python那么干净

此外,python似乎是机器学习的语言,它易于学习,而且速度快(当然取决于解释器的实现),而且还有Huuuuuge对它的支持,许多教程、文档,更重要的是,图书馆都在积极开发和支持

最后,我建议你把SydED看作是数据科学的好IDE,我也尝试过RoDo,但是它不像SydRad那样成熟和稳定。
希望这能有所帮助。

经过几年的反复尝试,我建议您直接使用python,可能使用scikit learn或tensorflow(如果您想使用hardcore:)

我过去也尝试过R,虽然它是一种非常有效的语言,但它也有一些限制:默认情况下它是单线程的,尽管有解决方案,但它们没有python那么干净

此外,python似乎是机器学习的语言,它易于学习,而且速度快(当然取决于解释器的实现),而且还有Huuuuuge对它的支持,许多教程、文档,更重要的是,图书馆都在积极开发和支持

最后,我建议你把SydED看作是数据科学的好IDE,我也尝试过RoDo,但是它不像SydRad那样成熟和稳定。
希望这能有所帮助。

这太宽泛了,可能是一个违反SO规则的问题。别担心。。。Python在Matlab上已经超过了Matlab(在功率方面,也许不是使用简单,是的,尤其是因为所有相关库的核心算法都是用Fortran、C、C++编写的,其中很多甚至和Matlab中使用的一样。我不确定你所说的系统架构是什么意思,但我很有信心python也能取代java。嗨,sascha,谢谢你的提醒。我所说的系统架构是指除算法实现之外的所有东西,比如数据仓库、分布式系统、微服务等。这太宽泛了,可能是一个违反SO规则的问题。别担心。。。Python在Matlab上已经超过了Matlab(在功率方面,也许不是使用简单,是的,尤其是因为所有相关库的核心算法都是用Fortran、C、C++编写的,其中很多甚至和Matlab中使用的一样。我不确定你所说的系统架构是什么意思,但我很有信心python也能取代java。嗨,sascha,谢谢你的提醒。我所说的系统架构是指除了算法实现之外的所有东西,比如数据仓库、分布式系统、微服务等等。那么数据建模和可视化呢?很抱歉造成了混乱。我的问题是询问编程语言以外的工具、帮助可视化数据的工具、选择合适的模型和测试我的模型。关于数据建模,同样,scikit learn将完成大部分工作。添加numpy和pandas,然后完成。根据可视化,matplotlib会执行此操作。此外,scikit learn还提供了一套很好的指标来评估您的模型有多好(精确度、召回率、f1……),我同意您提到的大部分内容。但速度并不是口译员的问题。数量不多,其中最快的(例如pypy)甚至不能处理像scikitlearn这样的复杂lib。在Python的科学堆栈中的性能很好的原因是封装/混合C、C++和FORTRAN(例如SKEXCEL大部分是Cython代码,甚至C;Cython代码没有真正解释)。谢谢。那么数据建模和可视化呢?很抱歉造成了混乱。我的问题是询问编程语言以外的工具、帮助可视化数据的工具、选择合适的模型和测试我的模型。关于数据建模,同样,scikit learn将完成大部分工作。添加numpy和pandas,然后完成。根据可视化,matplotlib会执行此操作。此外,scikit learn还提供了一套很好的指标来评估您的模型有多好(精确度、召回率、f1……),我同意您提到的大部分内容。但速度并不是口译员的问题。数量不多,其中最快的(例如pypy)甚至不能处理像scikitlearn这样的复杂lib。在Python的科学堆栈中的良好性能仅仅是因为包装/混合C、C++和FORTRAN(例如,SKEXCEL大部分是Cython代码,甚至C;Cython代码实际上没有被解释)。