Javascript DOM操作的最佳工具?

Javascript DOM操作的最佳工具?,javascript,dom,serverside-javascript,Javascript,Dom,Serverside Javascript,我正在开发一个网络刮板,它可以收集来自不同网站的数据。我开始使用PHP的内置DOM函数,但在遇到一些问题(特别是关于格式错误的标记和字符编码)后,我选择放弃PHP。我在考虑服务器端Javascript,但我愿意接受其他建议。如果我使用Javascript,我应该使用哪个解释器?试过了吗?Python有一个优秀的模块,在大多数情况下可以处理损坏的标记。它还允许在页面格式错误到其内置试探法无法工作时使用钩子对HTML进行预处理。我用BeautifulSoup写了几十个解析器 还有一个更快的模块,可以

我正在开发一个网络刮板,它可以收集来自不同网站的数据。我开始使用PHP的内置DOM函数,但在遇到一些问题(特别是关于格式错误的标记和字符编码)后,我选择放弃PHP。我在考虑服务器端Javascript,但我愿意接受其他建议。如果我使用Javascript,我应该使用哪个解释器?

试过了吗?

Python有一个优秀的模块,在大多数情况下可以处理损坏的标记。它还允许在页面格式错误到其内置试探法无法工作时使用钩子对HTML进行预处理。我用BeautifulSoup写了几十个解析器

还有一个更快的模块,可以解析无效的HTML

两个模块都有Ruby端口