// okay, parse the HTML code
ByteArrayInputStream bis = new ByteArrayInputStream(input.getContent());
Tidy tidy = new Tidy();
tidy.setUpperCaseTags(false);
tidy.setUpperCaseAttrs(false);
tidy.setErrout(new PrintWriter(new NullWriter()));
Document doc = tidy.parseDOM(bis,null);
rewriteDOM(doc,input.getURL());