Улучшил распарсивание текста
This commit is contained in:
@@ -43,7 +43,7 @@ class BookConverter {
|
||||
else {
|
||||
//может это чистый текст?
|
||||
if (textUtils.checkIfText(data)) {
|
||||
await fs.writeFile(outputFile, this.convertHtml(data));
|
||||
await fs.writeFile(outputFile, this.convertHtml(data, true));
|
||||
return;
|
||||
}
|
||||
|
||||
@@ -167,7 +167,7 @@ class BookConverter {
|
||||
titleInfo['book-title'] = title;
|
||||
|
||||
//подозрение на чистый текст, надо разбить на параграфы
|
||||
if ((isText || pars.length < buf.length/2000) && spaceCounter.length) {
|
||||
if (isText || pars.length < buf.length/2000) {
|
||||
let total = 0;
|
||||
for (let i = 0; i < spaceCounter.length; i++) {
|
||||
total += (spaceCounter[i] ? spaceCounter[i] : 0);
|
||||
@@ -176,8 +176,7 @@ class BookConverter {
|
||||
let i = spaceCounter.length - 1;
|
||||
while (i > 0 && (!spaceCounter[i] || spaceCounter[i] < total)) i--;
|
||||
|
||||
const parIndent = i;
|
||||
if (parIndent > 0) {//нашли отступ параграфа
|
||||
const parIndent = (i > 0 ? i : 0);
|
||||
|
||||
let newPars = [];
|
||||
const newPar = () => {
|
||||
@@ -211,9 +210,6 @@ class BookConverter {
|
||||
} else {
|
||||
body.section._a[0] = pars;
|
||||
}
|
||||
} else {
|
||||
body.section._a[0] = pars;
|
||||
}
|
||||
|
||||
//убираем лишнее
|
||||
for (let i = 0; i < pars.length; i++)
|
||||
|
||||
Reference in New Issue
Block a user