Python 在数据帧上使用if函数
我正在尝试使用panda进行数据管理。因此python扫描一个包含一些数据的.tsv,并使用panda将其转换为df,使用头文件。我现在有一个数据帧(df),比如说“x”,长度为50。我想知道df中有多少数字小于5。为此,我使用了:Python 在数据帧上使用if函数,python,pandas,dataframe,Python,Pandas,Dataframe,我正在尝试使用panda进行数据管理。因此python扫描一个包含一些数据的.tsv,并使用panda将其转换为df,使用头文件。我现在有一个数据帧(df),比如说“x”,长度为50。我想知道df中有多少数字小于5。为此,我使用了: if(len (df1(df1['x']<5))<10) 但它随后会打印整个df,而不是单个元素。如何打印单个元素和行号以便于数据管理 提前感谢:)要查找x列中小于5的元素总数: (df['x'] < 5).sum() (df['x']
if(len (df1(df1['x']<5))<10)
但它随后会打印整个df,而不是单个元素。如何打印单个元素和行号以便于数据管理
提前感谢:)要查找x列中小于5的元素总数:
(df['x'] < 5).sum()
(df['x']<5.sum()
要查找x列中小于5的元素索引,请执行以下操作:
df[df['x'] < 5].index
df[df['x']<5]。索引
或者使用numpy:
list(np.where(df['x'] < 5])
列表(np.where(df['x']<5])
是列x的名称还是数据框x的名称?谢谢您的回答。如果我想打印该行,我该怎么办?尤其是一些特定元素打印(df[df.index==indexNumber])
这显示的是标题名,而不是不正确的条目谢谢你的回答。我发现了问题。实际上,命令list(np.where(df['x']<5])
起作用,给出了带错误的实际行数。例如,[array(5,9,23…1089)]
。但是,我正在尝试将这些结果保存到日志文件中。在这种情况下,相同的命令不会保存.txt文件中的行号,而是保存元素的值,但有一个错误。例如,[数组(0.234,0.176,0.999…0.288)]
。那么您能帮助我如何将结果中获得的相同行号保存到日志文件中。如果它可以是.tsv文件,那就太好了。
list(np.where(df['x'] < 5])