Dataframe 基于字符串长度的Julia数据帧过滤
是否有一种基于列中字符串长度过滤Julia数据帧的矢量化方法?以下方法是否足够:Dataframe 基于字符串长度的Julia数据帧过滤,dataframe,julia,Dataframe,Julia,是否有一种基于列中字符串长度过滤Julia数据帧的矢量化方法?以下方法是否足够: df = DataFrame(fielda=[1,2],fieldb=["good","morning"]) df[Bool[length(x)<5 for x in df[:fieldb]],:] df=DataFrame(fielda=[1,2],fieldb=[“早上好”]) df[Bool[length(x)是否足够: df = DataFrame(fielda=[1,2],fieldb=["goo
df = DataFrame(fielda=[1,2],fieldb=["good","morning"])
df[Bool[length(x)<5 for x in df[:fieldb]],:]
df=DataFrame(fielda=[1,2],fieldb=[“早上好”])
df[Bool[length(x)是否足够:
df = DataFrame(fielda=[1,2],fieldb=["good","morning"])
df[Bool[length(x)<5 for x in df[:fieldb]],:]
df=DataFrame(fielda=[1,2],fieldb=[“早上好”])
使用数据帧的df[Bool[length(x)
df=数据帧(str=[“一”、“二”、“三”、“四”、“五”、“六”])
df[map(str->length(str),df[:str])。使用数据帧的长度(str)
df=数据帧(str=[“一”、“二”、“三”、“四”、“五”、“六”])
df[map(str->length(str),df[:str])。julia中的length(str)你不需要矢量化。同意。但是,偶尔(我知道我没有很好地阐述具体的场景)在数据帧中循环可能会很慢。然后,也许你应该清楚地说明具体的场景。当“在数据帧中循环”是“慢”时,这似乎不太可能向量化会更快,除非你多次遍历结果。你想实现什么?我假设向量操作通常比循环更快。“遍历结果”意味着什么?df[df[:time]>10,:]性能与使用条件循环通过列/数据帧一样?在julia中,您不需要矢量化。同意。但是,偶尔(我知道我没有很好地阐述具体场景)循环通过数据帧可能会很慢。然后,也许您应该阐述具体场景。在“在数据帧中循环”是“慢”的,矢量化速度会更快,除非你多次遍历结果。你想实现什么?我假设矢量运算通常比循环快。“遍历结果”意味着什么?df[df[:time]>10,:]性能是否与使用条件行循环通过列/数据帧一样?
df[map(str->length(str)<=3, df[:str]),:]