Python数据科学库与SQL
我正在从事一个需要存储大量数据的项目。我想知道在python中使用SQL和数据科学库有什么区别。如果我打算使用“数据科学”,我也打算使用其基于python的库中的SQL,或者使用csv文件来存储信息。我非常倾向于“数据科学”,因为我发现以下优势:Python数据科学库与SQL,python,sql,database,data-science,Python,Sql,Database,Data Science,我正在从事一个需要存储大量数据的项目。我想知道在python中使用SQL和数据科学库有什么区别。如果我打算使用“数据科学”,我也打算使用其基于python的库中的SQL,或者使用csv文件来存储信息。我非常倾向于“数据科学”,因为我发现以下优势: 它在主观上对我来说很容易使用。我犯的错误要少得多 由于我在运行时的知识有限,我认为数据科学库将更加高效 最重要的是,它有许多内置函数,可以让我制作更简单的函数 然而,由于有这么多人在使用SQL,我想知道我是否遗漏了一些重要的东西,特别是在可伸缩性方面
祝你好运,旅途愉快 你说的Python中的“数据科学库”是什么意思。。。SQL特别擅长于搜索、筛选、重新排序、分组、排名等。您还可以编制索引并获得高性能。好所有这些都是以实际学习SQL为代价的——这至少需要几个月的时间。但是,对于数据操作,最好使用Python库。作为一个简单的示例,请尝试在SQL中转置表:。正如您所看到的,在Python中使用Pandas变得非常简单,这变得不必要的复杂:
df.T
。但是,学习SQL很重要。例如,如果您想要处理大数据,那么您可以使用其他工具(如Hive)使用基于SQL的语言执行操作。如果您已经了解SQL语言,学习Hive会变得更简单。也可以使用Pyspark代替Python。因此,我认为您应该将SQL和Python库一起用于数据科学,例如Numpy、Pandas、Matplotlib、ScikitLearn等。这两个库都非常有用important@user322778表格不是转置,而是轴心。转置矩阵意味着重新排列其轴。可以将二维矩阵及其轴信息编码到一个表中,以便旋转该表可以转换矩阵,但这应该在直接的关系操作之后完成。矩阵与表格的选择取决于所做的操作(可能包括类型之间的转换)。