删除Julia中列中的特定数据
我用Julia来分析我的数据,我的数据中有一些异常值,所以我想删除它们;有一些数据;e、 g.75岁以上的人数;我想把他们排除在外。 例如,使用DataFrames.jl,df是一个数据集``:删除Julia中列中的特定数据,julia,Julia,我用Julia来分析我的数据,我的数据中有一些异常值,所以我想删除它们;有一些数据;e、 g.75岁以上的人数;我想把他们排除在外。 例如,使用DataFrames.jl,df是一个数据集``: julia> using DataFrames julia> df = DataFrame(A = 1:4, B = ["M", "F", "F", "M"]) 如何删除A列中的1 这样做的最佳代码是什么 谢谢如果数据在向量中,您可以使用过滤器: julia> data = rand
julia> using DataFrames
julia> df = DataFrame(A = 1:4, B = ["M", "F", "F", "M"])
如何删除A列中的1
这样做的最佳代码是什么
谢谢如果数据在向量中,您可以使用过滤器:
julia> data = rand(collect(1:100), 30); println(data);
[82, 80, 63, 6, 39, 44, 80, 80, 83, 58, 68, 87, 49, 40, 19, 87, 48, 19, 4, 80, 51,
82, 37, 2, 74, 90, 19, 68, 47, 11]
julia> filtered = filter(x -> x < 75, data); println(filtered);
[63, 6, 39, 44, 58, 68, 49, 40, 19, 48, 19, 4, 51, 37, 2, 74, 19, 68, 47, 11]
你可以用
julia> df = df[df.A .!= 1, :]
3×2 DataFrame
│ Row │ A │ B │
│ │ Int64 │ String │
├─────┼───────┼────────┤
│ 1 │ 2 │ F │
│ 2 │ 3 │ F │
│ 3 │ 4 │ M │
之前的
=
用于对操作进行矢量化,而:
用于返回所有列。如果您还想对列进行额外筛选,您可以传递所需的列向量,而不是:
您可以共享用于加载/创建数据的代码以及您想要实现的具体目标吗。如果我们知道您存储数据的格式,我们可以向您提供建议。很可能您使用的是DataFrames.jl,在这种情况下,我建议您阅读并编辑我的问题,谢谢您,Bogumil!谢谢你,比尔!但在过滤之后,我如何删除它们,我不想要数据异常值。请参阅修订后的答案——您可以使用数据帧上的过滤器来过滤特定行。
julia> df = df[df.A .!= 1, :]
3×2 DataFrame
│ Row │ A │ B │
│ │ Int64 │ String │
├─────┼───────┼────────┤
│ 1 │ 2 │ F │
│ 2 │ 3 │ F │
│ 3 │ 4 │ M │