Curl Erlang卷曲并排除各种文本/标记_Curl_Erlang

Curl Erlang卷曲并排除各种文本/标记

curl erlang

Curl Erlang卷曲并排除各种文本/标记,curl,erlang,Curl,Erlang,我正在用erlang卷曲一个网页，自然得到html代码，到目前为止还不错！我的代码是这样的： startCURL()-> Cmd = "curl \"" ++ "http://mywebsite.com/something.html" ++ "\"", Output = os:cmd(Cmd), io:format("The HTML output: ~s~n", [Output]). 现在，我想通过erlang排除html中的各种标记。例子： Hello改为“Hello”，不带和我

我正在用erlang卷曲一个网页，自然得到html代码，到目前为止还不错！我的代码是这样的：

startCURL()->
Cmd = "curl \"" ++ "http://mywebsite.com/something.html" ++ "\"",
Output = os:cmd(Cmd),
io:format("The HTML output: ~s~n", [Output]).

现在，我想通过erlang排除html中的各种标记。例子：

Hello

改为“Hello”，不带

和

我真的很感激能得到的一切帮助！

谢谢

演示如何使用

mochiweb\u html

对html文档执行各种技巧。希望这就足够让您开始了。

您可以使用中的replace函数将不需要的标记替换为空字符串

re:replace(Output, "</?br>", "", [global]).

re:replace（输出，“，”，[global]）。

谢谢，但这不是我想要的。您好，谢谢，我想我们现在很接近了。不幸的是，您的代码示例没有替换任何内容。甚至连测试html文件中的纯文本都没有。它确实有效。您可能正在再次打印输出，这就是为什么看不到任何更改。您应该执行Output2=re:replace（输出“，”，[global]）。然后打印输出2。变量在Erlang中是不可变的。我再次打印输出，现在使用Output2它工作得非常好！这正是我想要的，非常感谢@Cashmen！相关：正如Robertaloi指出的，如果你想用html做更复杂的事情，你可能不想使用正则表达式，也不想在Legocia的答案中查看链接。我只是建议用一种简单的方法过滤掉一些标签。如果可以编写正则表达式，基本上可以过滤掉任何内容。