Python Dask基于上一列添加新列

Python Dask基于上一列添加新列,python,pandas,numpy,dask,large-data,Python,Pandas,Numpy,Dask,Large Data,我正在使用Dask库分析我的数据 我有这组数据,我想添加一个新列,即电话号码标志: ID Phone No 001 NaN 002 O123421 003 Nan 我的愿望输出如下所示,如果用户在电话上有NaN,则没有标记为“0”,否则为“1”: ID Phone No Phone No Flag 001 NaN 0 002 O123421 1 003 Nan 0 有人可以帮我吗?请根据您展示的样

我正在使用Dask库分析我的数据

我有这组数据,我想添加一个新列,即电话号码标志:

ID   Phone No
001   NaN
002   O123421
003   Nan
我的愿望输出如下所示,如果用户在电话上有NaN,则没有标记为“0”,否则为“1”:

ID    Phone No   Phone No Flag
001    NaN           0
002    O123421       1
003    Nan           0

有人可以帮我吗?

请根据您展示的样品尝试以下内容。您可以在此处使用
np.where
.isnull()
函数。只需通过np检查条件。如果列(电话号码)的值为NaN,则将0分配给新列或将1分配给新列值

import pandas as pd
import numpy as np
df1['Phone No Flag']=np.where(df1['Phone No'].isnull(),0,1)

Dask支持常规的
pandas
语法,因此下面的代码与
pandas
中的代码相同:

ddf['phone\u no\u flag']=ddf['phone\u no'].isna()*1

乘以1得到的是0/1的值,而不是真/假。

你能给你的答案添加一些解释吗?