Warning: file_get_contents(/data/phpspider/zhask/data//catemap/4/string/5.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Python 比较两列中的值_Python_Finance - Fatal编程技术网

Python 比较两列中的值

Python 比较两列中的值,python,finance,Python,Finance,现在我有一个大型股票数据集(2GB): StockID日期行业代码1行业代码2 0 10000 1986-01-06南399 1 10000 1986-01-07南399 2 10000 1986-01-08南399 3 10000 1986-01-09南399 ... 我想检查两件事 如果股票实体曾经更改其行业代码1或行业代码2 如果一个股票实体在一个行业代码中被划分为金融行业,而在另一个行业代码中则不被划分为金融行业(即当['industry code 1']=52或53时['indu

现在我有一个大型股票数据集(2GB):

StockID日期行业代码1行业代码2
0 10000 1986-01-06南399
1 10000 1986-01-07南399
2 10000 1986-01-08南399
3 10000 1986-01-09南399
...  
我想检查两件事

  • 如果股票实体曾经更改其
    行业代码1
    行业代码2
  • 如果一个股票实体在一个行业代码中被划分为金融行业,而在另一个行业代码中则不被划分为金融行业(即当
    ['industry code 1']=52
    53
    ['industry code 2']!=60
    70
    或反之亦然)

  • 你的第一个问题是不可能的,除非你有数据的历史记录。如果您有历史记录,那么您所要做的就是检查当前数据帧值和旧值是否相同,如果不相同,则表示实体已更改

    对于第二个问题,如果您使用的是pandas之类的库,并且您的数据帧存储在变量df中,那么您可以使用以下方法检查特定情况:

    df[(df['Industry code 1'] == 52 | df['Industry code 1'] == 53) & (df['Industry code 2'] < 60 | df['Industry code 2'] > 70)] 
    
    df[(df[‘行业代码1’]==52 | df[‘行业代码1’]==53)和(df[‘行业代码2’]<60 | df[‘行业代码2’]>70)]
    
    此代码特定于您给出的示例,但是您可以修改它以适合您想要创建的任何子集。这将为您提供一个子集,然后您可以对其执行任何操作(查看哪些股票实体遵循此模式,总共有多少股票实体,等等)


    希望有帮助

    除非您有数据历史记录,否则您的第一个问题是不可能的。如果您有历史记录,那么您所要做的就是检查当前数据帧值和旧值是否相同,如果不相同,则表示实体已更改

    对于第二个问题,如果您使用的是pandas之类的库,并且您的数据帧存储在变量df中,那么您可以使用以下方法检查特定情况:

    df[(df['Industry code 1'] == 52 | df['Industry code 1'] == 53) & (df['Industry code 2'] < 60 | df['Industry code 2'] > 70)] 
    
    df[(df[‘行业代码1’]==52 | df[‘行业代码1’]==53)和(df[‘行业代码2’]<60 | df[‘行业代码2’]>70)]
    
    此代码特定于您给出的示例,但是您可以修改它以适合您想要创建的任何子集。这将为您提供一个子集,然后您可以对其执行任何操作(查看哪些股票实体遵循此模式,总共有多少股票实体,等等)


    希望有帮助

    嗨,请解释如何从数据中回答第一个问题(关于实体变更)。嗨,对于第一个问题,我想做的是确保每个公司上市后都处于同一行业。嗨,请解释如何从数据中回答第一个问题(关于实体变更)。嗨,对于第一个问题,我想做的是确保每个公司上市后都保持在同一个行业。谢谢!对于第一个问题,我想做的是确保每家公司上市后都处于同一行业。您可能误解了我想知道是否对数据集进行了任何更新。谢谢!对于第一个问题,我想做的是确保每家公司上市后都处于同一行业。您可能误解了我想知道是否对数据集进行了任何更新。