Python 在云数据实验室(从bigquery)中使用熊猫删除重复项回溯错误

Python 在云数据实验室(从bigquery)中使用熊猫删除重复项回溯错误,python,pandas,duplicates,google-bigquery,google-cloud-datalab,Python,Pandas,Duplicates,Google Bigquery,Google Cloud Datalab,我正在尝试在熊猫中使用drop_duplicates功能: 我得到这个错误: ErrorTraceback (most recent call last) <ipython-input-9-3b85467271be> in <module>() ----> 1 ssc_df.drop_duplicates(ssc_df.ssc_ssc_key, keep = False) /usr/local/lib/python2.7/dist-packages/pandas/

我正在尝试在熊猫中使用drop_duplicates功能:

我得到这个错误:

ErrorTraceback (most recent call last)
<ipython-input-9-3b85467271be> in <module>()
----> 1 ssc_df.drop_duplicates(ssc_df.ssc_ssc_key, keep = False)

/usr/local/lib/python2.7/dist-packages/pandas/util/decorators.pyc in wrapper(*args, **kwargs)
     89                 else:
     90                     kwargs[new_arg_name] = new_arg_value
---> 91             return func(*args, **kwargs)
     92         return wrapper
     93     return _deprecate_kwarg

/usr/local/lib/python2.7/dist-packages/pandas/core/frame.pyc in drop_duplicates(self, subset, keep, inplace)
   3136         deduplicated : DataFrame
   3137         """
-> 3138         duplicated = self.duplicated(subset, keep=keep)
   3139 
   3140         if inplace:

/usr/local/lib/python2.7/dist-packages/pandas/util/decorators.pyc in wrapper(*args, **kwargs)
     89                 else:
     90                     kwargs[new_arg_name] = new_arg_value
---> 91             return func(*args, **kwargs)
     92         return wrapper
     93     return _deprecate_kwarg
ErrorTraceback(最近一次调用)
在()
---->1 ssc_df.drop_duplicates(ssc_df.ssc_ssc_key,keep=False)
/包装器中的usr/local/lib/python2.7/dist-packages/pandas/util/decorators.pyc(*args,**kwargs)
89.其他:
90 kwargs[新参数名称]=新参数值
--->91返回函数(*args,**kwargs)
92返回包装器
93返回(不推荐)
/usr/local/lib/python2.7/dist-packages/pandas/core/frame.pyc在drop_副本中(self、subset、keep、inplace)
3136已消除重复:数据帧
3137         """
->3138 duplicated=self.duplicated(子集,keep=keep)
3139
3140如果到位:
/包装器中的usr/local/lib/python2.7/dist-packages/pandas/util/decorators.pyc(*args,**kwargs)
89.其他:
90 kwargs[新参数名称]=新参数值
--->91返回函数(*args,**kwargs)
92返回包装器
93返回(不推荐)

我最初的想法是第一个参数(
子集
)应该是一个字符串或字符串列表。请尝试以下方法

ssc_df = bq.Query(ssc_ciq_match).to_dataframe()
ssc_df.drop_duplicates('ssc_ssc_key', keep = False)

如果这不能解决您的问题,请提供完整的堆栈跟踪?该问题仅包含堆栈跟踪的一部分。

我最初的想法是第一个参数(
子集
)应该是字符串或字符串列表。请尝试以下方法

ssc_df = bq.Query(ssc_ciq_match).to_dataframe()
ssc_df.drop_duplicates('ssc_ssc_key', keep = False)
如果这不能解决您的问题,请提供完整的堆栈跟踪?该问题仅包含堆栈跟踪的一部分