Работа над XmlParser
This commit is contained in:
67
server/core/xml/Fb2Parser.js
Normal file
67
server/core/xml/Fb2Parser.js
Normal file
@@ -0,0 +1,67 @@
|
||||
const fs = require('fs-extra');
|
||||
const iconv = require('iconv-lite');
|
||||
const textUtils = require('./textUtils');
|
||||
|
||||
const xmlParser = require('./xmlParser');
|
||||
const utils = require('../utils');
|
||||
|
||||
class Fb2Parser {
|
||||
checkEncoding(data) {
|
||||
//Корректируем кодировку UTF-16
|
||||
let encoding = textUtils.getEncoding(data);
|
||||
if (encoding.indexOf('UTF-16') == 0) {
|
||||
data = Buffer.from(iconv.decode(data, encoding));
|
||||
encoding = 'utf-8';
|
||||
}
|
||||
|
||||
//Корректируем пробелы, всякие файлы попадаются :(
|
||||
if (data[0] == 32) {
|
||||
data = Buffer.from(data.toString().trim());
|
||||
}
|
||||
|
||||
//Окончательно корректируем кодировку
|
||||
let result = data;
|
||||
|
||||
let left = data.indexOf('<?xml version="1.0"');
|
||||
if (left < 0) {
|
||||
left = data.indexOf('<?xml version=\'1.0\'');
|
||||
}
|
||||
|
||||
if (left >= 0) {
|
||||
const right = data.indexOf('?>', left);
|
||||
if (right >= 0) {
|
||||
const head = data.slice(left, right + 2).toString();
|
||||
const m = head.match(/encoding=['"](.*?)['"]/);
|
||||
if (m) {
|
||||
let enc = m[1].toLowerCase();
|
||||
if (enc != 'utf-8') {
|
||||
//enc может не соответсвовать реальной кодировке файла, поэтому:
|
||||
if (encoding.indexOf('ISO-8859') >= 0) {
|
||||
encoding = enc;
|
||||
}
|
||||
|
||||
result = iconv.decode(data, encoding);
|
||||
result = Buffer.from(result.toString().replace(m[0], `encoding="utf-8"`));
|
||||
}
|
||||
}
|
||||
}
|
||||
}
|
||||
|
||||
return result;
|
||||
}
|
||||
|
||||
async getDescAndCover(bookFile) {
|
||||
let data = await fs.readFile(bookFile);
|
||||
data = await utils.gunzipBuffer(data);
|
||||
//data = this.checkEncoding(data);
|
||||
|
||||
const result = xmlParser.parseXml(data.toString(), true, (route) => {
|
||||
console.log(route);
|
||||
return true;
|
||||
});
|
||||
|
||||
return xmlParser.simplifyXmlParsed(result);
|
||||
}
|
||||
}
|
||||
|
||||
module.exports = Fb2Parser;
|
||||
Reference in New Issue
Block a user