Curl Erlang卷曲并排除各种文本/标记

Curl Erlang卷曲并排除各种文本/标记,curl,erlang,Curl,Erlang,我正在用erlang卷曲一个网页,自然得到html代码,到目前为止还不错! 我的代码是这样的: startCURL()-> Cmd = "curl \"" ++ "http://mywebsite.com/something.html" ++ "\"", Output = os:cmd(Cmd), io:format("The HTML output: ~s~n", [Output]). 现在,我想通过erlang排除html中的各种标记。例子: Hello改为“Hello”,不带和 我

我正在用erlang卷曲一个网页,自然得到html代码,到目前为止还不错! 我的代码是这样的:

startCURL()->
Cmd = "curl \"" ++ "http://mywebsite.com/something.html" ++ "\"",
Output = os:cmd(Cmd),
io:format("The HTML output: ~s~n", [Output]).
现在,我想通过erlang排除html中的各种标记。例子:
Hello
改为“Hello”,不带

我真的很感激能得到的一切帮助!
谢谢

演示如何使用
mochiweb\u html
对html文档执行各种技巧。希望这就足够让您开始了。

您可以使用中的replace函数将不需要的标记替换为空字符串

re:replace(Output, "</?br>", "", [global]). 
re:replace(输出,“,”,[global])。

谢谢,但这不是我想要的。您好,谢谢,我想我们现在很接近了。不幸的是,您的代码示例没有替换任何内容。甚至连测试html文件中的纯文本都没有。它确实有效。您可能正在再次打印输出,这就是为什么看不到任何更改。您应该执行Output2=re:replace(输出“,”,[global])。然后打印输出2。变量在Erlang中是不可变的。我再次打印输出,现在使用Output2它工作得非常好!这正是我想要的,非常感谢@Cashmen!相关:正如Robertaloi指出的,如果你想用html做更复杂的事情,你可能不想使用正则表达式,也不想在Legocia的答案中查看链接。我只是建议用一种简单的方法过滤掉一些标签。如果可以编写正则表达式,基本上可以过滤掉任何内容。