Python 比较两列中的值
现在我有一个大型股票数据集(2GB):Python 比较两列中的值,python,finance,Python,Finance,现在我有一个大型股票数据集(2GB): StockID日期行业代码1行业代码2 0 10000 1986-01-06南399 1 10000 1986-01-07南399 2 10000 1986-01-08南399 3 10000 1986-01-09南399 ... 我想检查两件事 如果股票实体曾经更改其行业代码1或行业代码2 如果一个股票实体在一个行业代码中被划分为金融行业,而在另一个行业代码中则不被划分为金融行业(即当['industry code 1']=52或53时['indu
StockID日期行业代码1行业代码2
0 10000 1986-01-06南399
1 10000 1986-01-07南399
2 10000 1986-01-08南399
3 10000 1986-01-09南399
...
我想检查两件事
行业代码1
或行业代码2
['industry code 1']=52
或53
时['industry code 2']!=60
至70
或反之亦然)你的第一个问题是不可能的,除非你有数据的历史记录。如果您有历史记录,那么您所要做的就是检查当前数据帧值和旧值是否相同,如果不相同,则表示实体已更改 对于第二个问题,如果您使用的是pandas之类的库,并且您的数据帧存储在变量df中,那么您可以使用以下方法检查特定情况:
df[(df['Industry code 1'] == 52 | df['Industry code 1'] == 53) & (df['Industry code 2'] < 60 | df['Industry code 2'] > 70)]
df[(df[‘行业代码1’]==52 | df[‘行业代码1’]==53)和(df[‘行业代码2’]<60 | df[‘行业代码2’]>70)]
此代码特定于您给出的示例,但是您可以修改它以适合您想要创建的任何子集。这将为您提供一个子集,然后您可以对其执行任何操作(查看哪些股票实体遵循此模式,总共有多少股票实体,等等)
希望有帮助 除非您有数据历史记录,否则您的第一个问题是不可能的。如果您有历史记录,那么您所要做的就是检查当前数据帧值和旧值是否相同,如果不相同,则表示实体已更改 对于第二个问题,如果您使用的是pandas之类的库,并且您的数据帧存储在变量df中,那么您可以使用以下方法检查特定情况:
df[(df['Industry code 1'] == 52 | df['Industry code 1'] == 53) & (df['Industry code 2'] < 60 | df['Industry code 2'] > 70)]
df[(df[‘行业代码1’]==52 | df[‘行业代码1’]==53)和(df[‘行业代码2’]<60 | df[‘行业代码2’]>70)]
此代码特定于您给出的示例,但是您可以修改它以适合您想要创建的任何子集。这将为您提供一个子集,然后您可以对其执行任何操作(查看哪些股票实体遵循此模式,总共有多少股票实体,等等)
希望有帮助 嗨,请解释如何从数据中回答第一个问题(关于实体变更)。嗨,对于第一个问题,我想做的是确保每个公司上市后都处于同一行业。嗨,请解释如何从数据中回答第一个问题(关于实体变更)。嗨,对于第一个问题,我想做的是确保每个公司上市后都保持在同一个行业。谢谢!对于第一个问题,我想做的是确保每家公司上市后都处于同一行业。您可能误解了我想知道是否对数据集进行了任何更新。谢谢!对于第一个问题,我想做的是确保每家公司上市后都处于同一行业。您可能误解了我想知道是否对数据集进行了任何更新。