Pandas 如何根据条件更改考拉数据帧中的值

Pandas 如何根据条件更改考拉数据帧中的值,pandas,pyspark,spark-koalas,Pandas,Pyspark,Spark Koalas,我正在使用考拉,我想根据条件更改列的值 在熊猫中,我可以使用: 将熊猫作为pd导入 df_测试=pd.DataFrame({ “a”:[1,2,3] ,'b':['1','2','3']}) df_test2=pd.DataFrame({ c:[2,1,3] ,'d':['1','2','3']}) df_test.loc[df_test.a.isin(df_test2['c']),'b']='four' df_测试头() a b 零一四 1234 二三四 我试图在考拉中使用相同的方法,但我有

我正在使用考拉,我想根据条件更改列的值

在熊猫中,我可以使用:

将熊猫作为pd导入
df_测试=pd.DataFrame({
“a”:[1,2,3]
,'b':['1','2','3']})
df_test2=pd.DataFrame({
c:[2,1,3]
,'d':['1','2','3']})
df_test.loc[df_test.a.isin(df_test2['c']),'b']='four'
df_测试头()
a b
零一四
1234
二三四
我试图在考拉中使用相同的方法,但我有一个错误:

---------------------------------------------------------------------------
PandasNotImplementedError回溯(最后一次调用)
在里面
5笔新贷款[“注销”]=0
6.
---->7新贷款。loc[(新贷款['ID'].isin(用户输入注销['ID']),'注销]=1
8新贷款。loc[新贷款[‘冲销’]==1,“正在使用”]=0
9 new_loans=new_loans.sort_值(按=['ZOHOID','Disb Date']))
/isin中的usr/local/lib/python3.7/dist-packages/databricks/koalas/base.py(self,values)
894             )
895
-->896返回self.\u和\u new\u scol(self.spark.column.isin(列表(值)))
897
898 def isnull(自)->联合[“系列”,“索引”]:
/usr/local/lib/python3.7/dist-packages/databricks/koalas/series.py in_u_iter__;(self)
5871
5872定义(自身):
->5873返回丢失的类PandasLikeSeries.\uuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuu
5874
5875如果sys.version_info>=(3,7):
/usr/local/lib/python3.7/dist-packages/databricks/koalas/missing/__-init__uuuuu.py在不受支持的函数中(*args,**kwargs)
21 def不支持的_函数(*args,**kwargs):
22提升盘未执行错误(
--->23类名称=类名称,方法名称=方法名称,原因=原因
24         )
25
PandasNotImplementedError:未实现方法“pd.Series.\uu iter\uuuu()”。如果要以NumPy数组的形式收集数据,请改用“to_NumPy()”。
我怎么能在考拉做同样的手术

更新 下面这个问题:我已经做了:

df_test.loc[df_test.a.isin(df_test2['c'].to_list()),'b']='four'
但现在我有一个错误:

---------------------------------------------------------------------------
PythonException回溯(最近一次调用)
/usr/local/lib/python3.7/dist-packages/IPython/core/formatters.py in_u_____________(self,obj)
700 type\u PPRINTS=self.type\u打印机,
701延迟的打印机=自延迟的打印机)
-->702打印机。漂亮(obj)
703打印机。刷新()
704返回流。getvalue()
/pretty(self,obj)中的usr/local/lib/python3.7/dist-packages/IPython/lib/pretty.py
392如果cls不是对象\
393和可调用(cls.dict.get(“报告”):
-->394返回报告(obj、自我、循环)
395
396返回默认值(对象、自身、循环)
/usr/local/lib/python3.7/dist-packages/IPython/lib/pretty.py in_repr_pprint(obj,p,cycle)
698“”“一个仅重定向到正常repr函数的pprint。”“”
699#找到换行符并替换为p.break())
-->700输出=repr(obj)
701行=输出。拆分行()
702带p.组():
/usr/local/lib/python3.7/dist-packages/databricks/koalas/frame.py in____repr____(self)
10614返回self.\u至\u internal\u pandas().至\u string()
10615
>10616 pdf=self.\u获取\u或\u创建\u报告\u熊猫\u缓存(最大显示\u计数)
10617 pdf_length=len(pdf)
10618 pdf=pdf.iloc[:最大显示计数]
/缓存中的usr/local/lib/python3.7/dist-packages/databricks/koalas/frame.py(self,n)
10606 def_get_或_create_repr_pandas_缓存(self,n):
10607如果不在hasattr(自我,“\u repr\u pandas\u缓存”)或n不在自我中。\u repr\u pandas\u缓存:
>10608 self._repr_pandas_cache={n:self.head(n+1)。_to_internal_pandas()}
10609返回自我。\u repr\u pandas\u缓存[n]
10610
/usr/local/lib/python3.7/dist-packages/databricks/koalas/frame.py in_to_internal_pandas(self)
10602此方法仅供内部使用。
10603         """
>10604将自身内部返回到框架
10605
10606 def_get_或_create_repr_pandas_缓存(self,n):
/包装属性(self)中的usr/local/lib/python3.7/dist-packages/databricks/koalas/utils.py
514 def wrapped_lazy_属性(自身):
515如果不是HASTATR(自身,属性名称):
-->516 setattr(self,attr_name,fn(self))
517返回getattr(self,attr\u name)
518
/usr/local/lib/python3.7/dist-packages/databricks/koalas/internal.py-to_pandas_框架(self)
807“作为数据帧返回。"""
808 sdf=自-至-内部-火花-帧
-->809 pdf=sdf.toPandas()
810如果len(pdf)==0且len(sdf.schema)>0:
811 pdf=pdf.astype(
/toPandas(self)中的usr/local/spark/python/pyspark/sql/pandas/conversion.py
136
137#下面是没有箭头优化的toPandas。
-->138 pdf=pd.DataFrame.from_记录(self.collect(),columns=self.columns)
139列\计数器=计数器(自列)
140
/collect(self)中的usr/local/spark/python/pyspark/sql/dataframe.py
594         """
595使用SCCallSiteSync(self.\u sc)作为css:
-->596 sock\u info=self.\u jdf.collectToPython()
597返回列表(\u从\u套接字加载\u(sock\u信息,BatchedSerializer(PickleSerializer()))
598
/usr/local/lib/python3.7/dist-packages/py4j/java_gateway.py in____调用(self,*args)
1303 answer=self.gateway\u client.send\u命令(command)
1304返回值=获取返回值(
->1305应答,self.gateway\u客户端,self.target\u id,self.name)
1306
1307用于温度参数
/usr/local/lib/python3.7/dist-packages/databricks/koalas/internal.py in to_pandas_frame(self)
    807         """ Return as pandas DataFrame. """
    808         sdf = self.to_internal_spark_frame
--> 809         pdf = sdf.toPandas()
    810         if len(pdf) == 0 and len(sdf.schema) > 0:
    811             pdf = pdf.astype(

/usr/local/spark/python/pyspark/sql/pandas/conversion.py in toPandas(self)
    136 
    137         # Below is toPandas without Arrow optimization.
--> 138         pdf = pd.DataFrame.from_records(self.collect(), columns=self.columns)
    139         column_counter = Counter(self.columns)
    140 

/usr/local/spark/python/pyspark/sql/dataframe.py in collect(self)
    594         """
    595         with SCCallSiteSync(self._sc) as css:
--> 596             sock_info = self._jdf.collectToPython()
    597         return list(_load_from_socket(sock_info, BatchedSerializer(PickleSerializer())))
    598