Dataframe 如何在写入到";之后恢复数组{Tuple{Int64,Int64},1}的原始数据类型;。csv";-朱莉娅
我有一个元组列表,我正在将其写入一个文件,以便另一个文件可以读入该列表进行后处理。如果它有助于在图形中创建一个循环列表,那么每个循环本身就是一个元组列表。我将此列表称为循环基础 目前我是这样写的:Dataframe 如何在写入到";之后恢复数组{Tuple{Int64,Int64},1}的原始数据类型;。csv";-朱莉娅,dataframe,csv,types,file-io,julia,Dataframe,Csv,Types,File Io,Julia,我有一个元组列表,我正在将其写入一个文件,以便另一个文件可以读入该列表进行后处理。如果它有助于在图形中创建一个循环列表,那么每个循环本身就是一个元组列表。我将此列表称为循环基础 目前我是这样写的: df = DataFrame() df.Path = cycle_basis df.Size = cycle_size CSV.write("cycle_basis.csv",df) cycle_size只是一个整数,表示每个循环中的边数。我可以看到它存储在CSV中,如下所示(为
df = DataFrame()
df.Path = cycle_basis
df.Size = cycle_size
CSV.write("cycle_basis.csv",df)
cycle_size只是一个整数,表示每个循环中的边数。我可以看到它存储在CSV中,如下所示(为了这篇文章,在一个超小的图形上运行,通常文件会更长):
我已尝试按如下方式将每个字符串转换回其原始数据类型:convert(数组{Tuple{Int64,Int64},1},cycle.Path[1])
,但这只会导致以下错误:
ERROR: MethodError: Cannot `convert` an object of type String to an object of type Array{Tuple{Int64,Int64},1}
Closest candidates are:
convert(::Type{Array{S,N}}, ::PooledArrays.PooledArray{T,R,N,RA} where RA) where {S, T, R, N} at /home/charper/.julia/packages/PooledArrays/yiLq3/src/PooledArrays.jl:294
convert(::Type{T}, ::AbstractArray) where T<:Array at array.jl:533
convert(::Type{T}, ::T) where T<:AbstractArray at abstractarray.jl:14
...
Stacktrace:
[1] top-level scope at none:0
ERROR:MethodError:无法将String类型的对象“转换”为Array类型的对象{Tuple{Int64,Int64},1}
最接近的候选人是:
转换(::Type{Array{S,N}},::pooledarays.pooledarays{T,R,N,RA}其中{S,T,R,N}位于/home/charper/.julia/packages/pooledarays/yiLq3/src/pooledarays.jl:294
convert(::Type{T},::AbstractArray),其中T我不建议对此类数据使用CSV存储。可能最简单的方法是JSONTables.jl:
julia> df = DataFrame(a=[1,2], b=[[(1,2),(3,4)], [(5,6),(7,8)]])
2×2 DataFrame
│ Row │ a │ b │
│ │ Int64 │ Array… │
├─────┼───────┼──────────────────┤
│ 1 │ 1 │ [(1, 2), (3, 4)] │
│ 2 │ 2 │ [(5, 6), (7, 8)] │
julia> s = arraytable(df)
"[{\"a\":1,\"b\":[[1,2],[3,4]]},{\"a\":2,\"b\":[[5,6],[7,8]]}]"
julia> DataFrame(jsontable(s))
2×2 DataFrame
│ Row │ a │ b │
│ │ Int64 │ Array… │
├─────┼───────┼──────────────────┤
│ 1 │ 1 │ [[1, 2], [3, 4]] │
│ 2 │ 2 │ [[5, 6], [7, 8]] │
julia> DataFrame(jsontable(objecttable(df))) # objecttable gives you a different layout of data
2×2 DataFrame
│ Row │ a │ b │
│ │ Int64 │ Array… │
├─────┼───────┼──────────────────┤
│ 1 │ 1 │ [[1, 2], [3, 4]] │
│ 2 │ 2 │ [[5, 6], [7, 8]] │
我在这里演示了如何将它存储在字符串中
并将其读回,但您可以使用IO
读回不会恢复元组,但会恢复结构
现在,这只是一个选择。本教程中对DataFrames.jl的不同加载/保存选项进行了比较:
现在,在CSV中,您可以执行以下操作:
julia> CSV.write("tmp.csv", df)
"tmp.csv"
julia> df2 = CSV.File("tmp.csv") |> DataFrame
2×2 DataFrame
│ Row │ a │ b │
│ │ Int64 │ String │
├─────┼───────┼──────────────────┤
│ 1 │ 1 │ [(1, 2), (3, 4)] │
│ 2 │ 2 │ [(5, 6), (7, 8)] │
julia> df2.b = eval.(Meta.parse.(df2.b))
2-element Array{Array{Tuple{Int64,Int64},1},1}:
[(1, 2), (3, 4)]
[(5, 6), (7, 8)]
julia> df2
2×2 DataFrame
│ Row │ a │ b │
│ │ Int64 │ Array… │
├─────┼───────┼──────────────────┤
│ 1 │ 1 │ [(1, 2), (3, 4)] │
│ 2 │ 2 │ [(5, 6), (7, 8)] │
但这不是一种安全的方法。在eval
中,任何不安全的代码都可以被注入执行。哇,这非常有用。感谢您提供不同教程的链接。我将首先尝试Jasontables方法,但我仍然不确定评估方法。()在第二个示例中不安全吗?再次感谢!运行例如eval(Meta.parse(“Run(`julia`))
,想象一下,我本可以在那里放置一些更邪恶的东西,并且您的文件在编写后可能会被对手修改:)。哈哈哈,这是一个很好的例子。非常清楚地说明了它如何被滥用。
julia> CSV.write("tmp.csv", df)
"tmp.csv"
julia> df2 = CSV.File("tmp.csv") |> DataFrame
2×2 DataFrame
│ Row │ a │ b │
│ │ Int64 │ String │
├─────┼───────┼──────────────────┤
│ 1 │ 1 │ [(1, 2), (3, 4)] │
│ 2 │ 2 │ [(5, 6), (7, 8)] │
julia> df2.b = eval.(Meta.parse.(df2.b))
2-element Array{Array{Tuple{Int64,Int64},1},1}:
[(1, 2), (3, 4)]
[(5, 6), (7, 8)]
julia> df2
2×2 DataFrame
│ Row │ a │ b │
│ │ Int64 │ Array… │
├─────┼───────┼──────────────────┤
│ 1 │ 1 │ [(1, 2), (3, 4)] │
│ 2 │ 2 │ [(5, 6), (7, 8)] │