node-htmlparser 是一个 JavaScript 的 HTML 文档解析器。
示例代码:
var htmlparser = require("htmlparser"); var rawHtml = "Xyz <script language= javascript>var foo = '<<bar>>';< / script><!--<!-- Waah! -- -->"; var handler = new htmlparser.DefaultHandler(function (error, dom) { if (error) [...do something for errors...] else [...parsing done, do something...] }); var parser = new htmlparser.Parser(handler); parser.parseComplete(rawHtml); sys.puts(sys.inspect(handler.dom, false, null));