最后这样做了
首先要求文本必须符合xml规范
Set<String> dangerTags = new HashSet<String>(Arrays.asList(
"applet",
"body",
"embed",
"frame",
"script",
"frameset",
"html",
"iframe",
"style",
"layer",
"link",
"ilayer",
"meta",
"object"
));
不允许上述标签
不允许onxxx属性
不允许a标签的href属性和img标签的src属性以javascript:打头
还有别的需要注意的么?
【 在 NIGHTFIRE (昵称不告诉你们) 的大作中提到: 】
: 你要在后台做么?解析dom有很多库啊
--
FROM 123.127.65.*