使用Ruby代码解析Javascript
我正在用Ruby编写一个测试代码,并试图解析一个网站的HTML源文件。它有一个JavaScript变量,我可以使用它与其他值进行比较。例如:使用Ruby代码解析Javascript,javascript,ruby,nokogiri,Javascript,Ruby,Nokogiri,我正在用Ruby编写一个测试代码,并试图解析一个网站的HTML源文件。它有一个JavaScript变量,我可以使用它与其他值进行比较。例如: <script type="text/javascript" language="JavaScript"> function GetParam(name) { var req_var = { a: 'xyz', b: 'yy.com', c: 'en', d:0,
<script type="text/javascript" language="JavaScript">
function GetParam(name) {
var req_var = {
a: 'xyz',
b: 'yy.com',
c: 'en',
d:0,
e: 'y'
};
}
</script>
函数GetParam(名称){
var req_var={
a:‘xyz’,
b:‘yy.com’,
c:‘嗯’,
d:0,
e:‘y’
};
}
这里我想从这个函数中提取变量
req\u var
。有可能吗?如果有的话,有人能帮我吗?ruby中的javascript解析器
rkelly gem为我抛出了一个异常,因此我使用了fork--您必须卸载原始的fork,因为它们使用相同的名称: 吉姆雷利
gem-rkelly混音 我有以下JS代码:
var xpos = 0;
var ypos = 0;
var city = 'Parish';
var cashSaldo = '0.00';
var bankSaldo = '';
var address = 'Lot: 0 - 0';
var simplemode = true;
var email_reminder = true;
var text_citylist = 'Take a cab to';
var text_nostreet = 'Lot';
var text_lotpos = 'Lot:';
var text_products_title = 'Products';
var text_products_subtitle = 'Produce and set prices';
var text_title = 'Miniconomy';
var text_has_harbor = 'This city has a harbor';
var products = {"gron":{"ln":"Clay"},"stee":{"ln":"Brick"},"ijee":{"ln":"Iron Ore"},"boom":{"ln":"Tree"},"goud":{"ln":"Gold"},"olie":{"ln":"Oil"},"oven":{"ln":"Oven"},"ijze":{"ln":"Iron"},"hout":{"ln":"Wood"},"schi":{"ln":"Bulletproof Vest"},"benz":{"ln":"Gas"},"pomp":{"ln":"Pump"},"schr":{"ln":"Screwdriver"},"sche":{"ln":"Shovel"},"moto":{"ln":"Electrical Engine"},"plas":{"ln":"Plastic"},"zaag":{"ln":"Saw"},"mach":{"ln":"Machine"},"chip":{"ln":"Chip"},"tele":{"ln":"Telephone"},"came":{"ln":"Camera"},"alar":{"ln":"Alarm"},"glas":{"ln":"Glass"}};
var isChristmas = 0;
var newMap = 1;
这是我用来解析它的代码:
o = lambda do |x|
next true if x == [:true]
next x.size != 2 ? fail : eval(x[1].to_s) if x[0] == :lit || x[0] == :str
next x.size != 2 ? fail : Hash[ x[1].map do |a,b,c|
fail unless a == :property
fail unless b.is_a? Symbol
[eval(b.to_s).to_sym, o[c]]
end ] if x.first == :object
fail x.inspect
end
require "rkelly"
result = Hash[ RKelly::Parser.new.parse(my_js_code).to_sexp.map do |k, v|
fail unless k == :var
fail unless v.size == 1
a, b, c = v.first
fail unless a == :var_decl
k, v = c
fail unless k == :assign
[b, o[v]]
end ]
这导致:
{:xpos=>0,
:ypos=>0,
:city=>"Parish",
:cashSaldo=>"0.00",
:bankSaldo=>"",
:address=>"Lot: 0 - 0",
:simplemode=>true,
:email_reminder=>true,
:text_citylist=>"Take a cab to",
:text_nostreet=>"Lot",
:text_lotpos=>"Lot:",
:text_products_title=>"Products",
:text_products_subtitle=>"Produce and set prices",
:text_title=>"Miniconomy",
:text_has_harbor=>"This city has a harbor",
:products=>
{:gron=>{:ln=>"Clay"},
:stee=>{:ln=>"Brick"},
:ijee=>{:ln=>"Iron Ore"},
:boom=>{:ln=>"Tree"},
:goud=>{:ln=>"Gold"},
:olie=>{:ln=>"Oil"},
:oven=>{:ln=>"Oven"},
:ijze=>{:ln=>"Iron"},
:hout=>{:ln=>"Wood"},
:schi=>{:ln=>"Bulletproof Vest"},
:benz=>{:ln=>"Gas"},
:pomp=>{:ln=>"Pump"},
:schr=>{:ln=>"Screwdriver"},
:sche=>{:ln=>"Shovel"},
:moto=>{:ln=>"Electrical Engine"},
:plas=>{:ln=>"Plastic"},
:zaag=>{:ln=>"Saw"},
:mach=>{:ln=>"Machine"},
:chip=>{:ln=>"Chip"},
:tele=>{:ln=>"Telephone"},
:came=>{:ln=>"Camera"},
:alar=>{:ln=>"Alarm"},
:glas=>{:ln=>"Glass"}},
:isChristmas=>0,
:newMap=>1}
这可能适用于一些非常受限的JavaScript,但通常不可能仅用正则表达式解析JavaScript代码(或任何编程语言)。(你可能知道@Pan Thomakos,当然,但我输入这条评论是为了让年轻易受影响的人受益,他们可能会在未来几年内阅读答案。)这是真的,但这似乎是一个足够有限的情况,他不需要解析整个javascript程序,他只需要“var req_var=”和“;”之间的值。您已经使用了Nokogiri标记,所以我不确定“从这个函数中提取变量
req_var
是什么意思”。需要使用Nokogiri查找此脚本块的帮助吗?您想从HTML中得到什么,仅仅是名为req\u var
的变量的文本?您想将其转换为Ruby哈希吗?我在同一代码中使用Nokogiri来执行其他html解析。所以,如果我能用Nokogiri,那就太好了。如果我能把它转换成ruby哈希,那就太好了。