parsers.put(MediaType.application("vnd.ms-excel"), parser);
parsers.put(MediaType.application("vnd.openxmlformats-officedocument.wordprocessingml.document"), parser);
parsers.put(MediaType.application("vnd.openxmlformats-officedocument.presentationml.presentation"), parser);
parsers.put(MediaType.application("vnd.openxmlformats-officedocument.spreadsheetml.sheet"), parser);
} else if (name.equals("org.apache.jackrabbit.extractor.OpenOfficeTextExtractor")) {
Parser parser = new OpenDocumentParser();
parsers.put(MediaType.application("vnd.oasis.opendocument.database"), parser);
parsers.put(MediaType.application("vnd.oasis.opendocument.formula"), parser);
parsers.put(MediaType.application("vnd.oasis.opendocument.graphics"), parser);
parsers.put(MediaType.application("vnd.oasis.opendocument.presentation"), parser);
parsers.put(MediaType.application("vnd.oasis.opendocument.spreadsheet"), parser);
parsers.put(MediaType.application("vnd.oasis.opendocument.text"), parser);
parsers.put(MediaType.application("vnd.sun.xml.calc"), parser);
parsers.put(MediaType.application("vnd.sun.xml.draw"), parser);
parsers.put(MediaType.application("vnd.sun.xml.impress"), parser);
parsers.put(MediaType.application("vnd.sun.xml.writer"), parser);
} else if (name.equals("org.apache.jackrabbit.extractor.PdfTextExtractor")) {
parsers.put(MediaType.application("pdf"), new PDFParser());
} else if (name.equals("org.apache.jackrabbit.extractor.PlainTextExtractor")) {
parsers.put(MediaType.TEXT_PLAIN, new TXTParser());
} else if (name.equals("org.apache.jackrabbit.extractor.PngTextExtractor")) {
Parser parser = new ImageParser();
parsers.put(MediaType.image("png"), parser);
parsers.put(MediaType.image("apng"), parser);
parsers.put(MediaType.image("mng"), parser);
} else if (name.equals("org.apache.jackrabbit.extractor.RTFTextExtractor")) {
Parser parser = new RTFParser();
parsers.put(MediaType.application("rtf"), parser);
parsers.put(MediaType.text("rtf"), parser);
} else if (name.equals("org.apache.jackrabbit.extractor.XMLTextExtractor")) {
Parser parser = new XMLParser();
parsers.put(MediaType.APPLICATION_XML, parser);
parsers.put(MediaType.text("xml"), parser);
} else {
logger.warn("Ignoring unknown text extractor class: {}", name);
}
}
parser.setParsers(parsers);
}