Python 熊猫切割,如何标记右侧开放端点?
如何使正确的开放端点映射到带有pd.cut的标签?例如,下面的代码段, 只是显示间隔而不是标签(例如,[10000000.0,50000000.0]),而不是“100亿至500亿美元”)Python 熊猫切割,如何标记右侧开放端点?,python,pandas,Python,Pandas,如何使正确的开放端点映射到带有pd.cut的标签?例如,下面的代码段, 只是显示间隔而不是标签(例如,[10000000.0,50000000.0]),而不是“100亿至500亿美元”) 实际上,您在pd.cut中使用了您的休息时间作为垃圾箱。无需使用pd.IntervalIndex breaks = [0, 1000000, 5000000, 10000000, 50000000, np.inf] # actual values are in millions labels = [
实际上,您在
pd.cut
中使用了您的休息时间作为垃圾箱。无需使用pd.IntervalIndex
breaks = [0, 1000000, 5000000, 10000000, 50000000, np.inf] # actual values are in millions
labels = [
'under $1 billion',
'\$1 billion - $5 billion',
'\$5 billion - $10 billion',
'\$10 billion - $50 billion',
'over $50 billion']
df = pd.DataFrame({'value': np.random.randint(0, 50000000, 20)})
df['Asset Size'] = pd.cut(df['value'], bins = breaks, labels=labels, right=False)
\
是以$
符号开头字符串的转义符,您还需要添加np.inf
来表示超过500亿的任何内容。实际上,您在pd.cut
中使用断点作为箱子。无需使用pd.IntervalIndex
breaks = [0, 1000000, 5000000, 10000000, 50000000, np.inf] # actual values are in millions
labels = [
'under $1 billion',
'\$1 billion - $5 billion',
'\$5 billion - $10 billion',
'\$10 billion - $50 billion',
'over $50 billion']
df = pd.DataFrame({'value': np.random.randint(0, 50000000, 20)})
df['Asset Size'] = pd.cut(df['value'], bins = breaks, labels=labels, right=False)
\
是以$
符号开头字符串的转义,您还需要添加np.inf
来表示超过500亿的任何内容