Python 尝试使用列表填充数据框列

Python 尝试使用列表填充数据框列,python,Python,我有一个数据框(df),我想创建一个名为country的新列,它是通过查看region列计算出来的,如果region值出现在England regions列表中,则country值设置为England,否则它是region列中的值 请参阅以下内容以了解我所需的输出: name salary region B1salary country 0 Jason 42000 London 42000 England 1 Molly 52000

我有一个数据框(
df
),我想创建一个名为
country
的新列,它是通过查看region列计算出来的,如果region值出现在England regions列表中,则country值设置为England,否则它是region列中的值

请参阅以下内容以了解我所需的输出:

    name  salary         region B1salary country
0  Jason   42000         London    42000 England
1  Molly   52000     South West          England
2   Tina   36000   East Midland          England
3   Jake   24000          Wales            Wales
4    Amy   73000  West Midlands          England
您可以看到,country中的所有值都设置为England,除了分配给Jakes记录的值设置为Wales(因为Wales不在
EnglandRegions
列表中)。下面的代码产生以下错误:

  File "C:/Users/stacey/Documents/scripts/stacey.py", line 20
    df['country'] = np.where((df.loc[df['region'].isin(EnglandRegions)),'England', df['region'])
                                                                      ^
SyntaxError: invalid syntax
代码如下:

import pandas as pd
import numpy as np

EnglandRegions = ["London", "South West", "East Midland", "West Midlands", "East Anglia"]

data = {'name': ['Jason', 'Molly', 'Tina', 'Jake', 'Amy'], 
        'salary': [42000, 52000, 36000, 24000, 73000], 
        'region': ['London', 'South West', 'East Midland', 'Wales', 'West Midlands']}
df = pd.DataFrame(data, columns = ['name', 'salary', 'region'])
df['B1salary'] = np.where((df['salary']>=40000) & (df['salary']<=50000) , df['salary'], '')
df['country'] = np.where((df.loc[df['region'].isin(EnglandRegions)),'England', df['region'])
print(df)
将熊猫作为pd导入
将numpy作为np导入
英格兰地区=[“伦敦”、“西南”、“东米德兰”、“西米德兰”、“东英格兰”]
数据={'name':['Jason','Molly','Tina','Jake','Amy'],
“工资”:[42000、52000、36000、24000、73000],
“地区”:[“伦敦”、“西南”、“东米德兰”、“威尔士”、“西米德兰”]]
df=pd.DataFrame(数据,列=['name','salary','region'])

df['B1salary']=np.where((df['salary']>=40000)和(df['salary']错误所指的具体问题是,您缺少一个]来包含您的.loc。但是,修复此问题无论如何都不会起作用。请尝试:

df['country']=np.where(df['region'].isin(英格兰地区),'EnglandRegions',df['region'])

这基本上是您在上面的
B1salary
行中已经拥有的