parser.setEncoding("8859_1");
parser.setInputHTML(html);
//�������еĽڵ�
NodeList nodes = parser.extractAllNodesThatMatch(scriptFilter);
for(int i=0;i<nodes.size();i++){
Node node = nodes.elementAt(i);
if(node instanceof TextNode)
text.append(node.getText());
else{
text.append('<');
text.append(node.getText());