Дмитрий
Дмитрий22 вересня 2018 р. 04:16

Зчитувач fb2-файлів на Qt Creator

Якийсь час тому я написав статтю, в якій показав, як відкрити файл fb2 за допомогою інструментів Qt. Через якийсь час я помітив у ньому низку недоліків, які вирішив усунути. Більше того, я виявив, що деякі fb2-рідери мають і недоліки (а саме, некоректне відображення таблиць), що й спонукало мене написати цю статтю. Спочатку можете прочитати останню статтю . Діятимемо за тим самим принципом: формуємо рядок книги у форматі html і розміщуємо її в об'єкті QTextBrowser.

Нагадаю, що для створення HTML документа потрібно виконати 3 дії: відкрити тег, заповнити його вмістом і закрити. Тому у нас є 4 варіанти: переписуємо з вихідного файлу, переписуємо з виправленнями, нічого не робимо (ігноруємо) та проводимо спецобробку.


Вступ

Усі теги формату fb2 можна розділити на 3 групи ідентичні html, схожі на html та інші.

Ідентичні теги показані у таблиці 1.

Таблиця 1 - теги fb2 та html

опис тег
Параграф p
Посилання a
Таблиця таблиця
Рядок таблиці tr
Комірка таблиці td
Комірка заголовка таблиці th
Надрядковий суп
Ніжний індекс підрядний
Шрифт мінівена код
Жирний шрифт сильний
Цитувати цитувати

Подібні теги ідентичні елементу HTML за призначенням, але мають різні назви. Усі відповідності наведені у таблиці 2.

Таблиця 2 - Відповідність тегів fb2 та html

опис fb2 html
Порожній рядок порожній рядок br
Курсив наголос i
Закреслення закреслення страйк

Алгоритм

Алгоритм відкриття файлів реалізований як функції openFB2File. Інші теги не мають чіткої відповідності з елементами html або схожі, але вимагають спеціальної обробки (<a> ,<body> ,<image> ). Деякі з них можна просто ігнорувати (<poem> ). Щоб перетворити основну частину (<v> ,<date> ,<text-author> ,<title> ,<subtitle> ), я пропоную їм зіставити<p> з деякими додатковими атрибутами. Алгоритм реалізується так:

    QFile f(file);
    if (!f.open(QIODevice::ReadOnly | QIODevice::Text))
    {
        qDebug() << "файл не открыт";
        return false;
    }
    bool ok = true;
    QString special;
    QString description; // описание видео
    //  настройки отображения
    int fontSize = 20;
    if( QSysInfo::productType() == "android" )
        fontSize *= 1.8;

    QXmlStreamReader sr(&f);
    QString rId;
    QString rType;

    QString opt;

    QStringList thisToken;

    while( !sr.atEnd() )
    {
        switch( sr.readNext() )
        {
        case QXmlStreamReader::NoToken:
            qDebug() << "QXmlStreamReader::NoToken";
            break;
        case QXmlStreamReader::StartDocument:
            *book = "<!DOCTYPE HTML><html><body style=\"font-size:%1px; font-family:Sans, Times New Roman;\">";
            *book = book->arg(fontSize);
            break;
        case QXmlStreamReader::EndDocument:
            book->append("</body></html>");
            break;
        case QXmlStreamReader::StartElement:
            thisToken.append( sr.name().toString() );

            if(thisToken.contains("description")) // ОПИСАНИЕ КНИГИ
            {
                if( thisToken.back() != "image" ) //пропускаем всё кроме обложки
                    break; // не выводим
            }

            if(sr.name().toString() == "title")
            {
                content->append(""); // добавляем пункт содержания
                break;
            }

            if( sr.name().toString() == "body" )
                if( !sr.attributes().isEmpty()
                    && sr.attributes().first().value().toString() == "notes")
                    special = "notes";  // режим примечаний

            if(special == "notes")
            {
                if( sr.name().toString() == "section" )
                {
                    if( sr.attributes().count() > 0 )
                    {
                        rId = sr.attributes().at(0).value().toString(); // ссылка на текст
                        rType = "";
                    }
                }
            }

            opt = " align=\"justify\"";
            if(thisToken.contains("title") )
            {
                opt = " align=\"center\" style=\"font-size:" +QString::number(int(fontSize * 1.5)) + "px\" ";
                if(special == "notes")
                {
                    opt += (" id=\"" + rId + "\"");
                }
            }
            if(thisToken.contains("subtitle") )
            {
                opt = " align=\"center\" style=\"font-size:" +QString::number(int(fontSize * 1.2)) + "px\" ";
            }
            if(thisToken.contains("annotation") )
            {
                opt = " align=\"left\" ";
            }

            if(sr.name().toString() == "p"
                    || sr.name().toString() == "subtitle")
            {
                book->append("<p"+opt +" >");
                break;
            }

            if( sr.name().toString() == "table" )
            {
                QString text;
                for(int i = 0; i < sr.attributes().count(); i++)
                {
                    if(sr.attributes().at(i).name() == "id")
                        qDebug() << sr.attributes().at(i).value().toString();
                    if(sr.attributes().at(i).name() == "style")
                        text.append( "style=\"" +sr.attributes().at(i).value().toString()+ ";\"" );
                }
                book->append("<table border=1 align=\"center\" style=\"border:solid;\" " + text + ">");
                break;
            }
            if( sr.name().toString() == "tr" )
            {
                QString text;
                if(!thisToken.contains("table"))
                    qDebug() << "ошибка в таблице";
                for(int i = 0; i < sr.attributes().count(); i++)
                {
                    if(sr.attributes().at(i).name() == "aling")
                        text.append( "aling=\"" +sr.attributes().at(i).value().toString()+ "\"" );
                    else
                        qDebug() << "<tr>" << sr.attributes().at(i).name() << sr.attributes().at(i).value().toString();
                }
                book->append("<tr " + text + ">");
                break;
            }            //
            if( sr.name().toString() == "td"
                 || sr.name().toString() == "th" )
            {
                if(!thisToken.contains("table"))
                    qDebug() << "ошибка в таблице";
                QString text;
                for(int i = 0; i < sr.attributes().count(); i++)
                {
                    if(sr.attributes().at(i).name() == "aling")
                        text.append( "aling=\"" +sr.attributes().at(i).value().toString()+ "\" " );
                    else if(sr.attributes().at(i).name() == "valing")
                        text.append( "valing=\"" +sr.attributes().at(i).value().toString()+ "\" " );
                    else if(sr.attributes().at(i).name() == "colspan")
                        text.append( "colspan=" +sr.attributes().at(i).value().toString()+ " " );
                    else if(sr.attributes().at(i).name() == "rowspan")
                        text.append( "rowspan=" +sr.attributes().at(i).value().toString()+ " " );
                    else
                        qDebug() << "<td th>" << sr.attributes().at(i).name() << sr.attributes().at(i).value().toString();
                }
                book->append( "<"+sr.name().toString()+ " " + text +">" );
                break;
            }
            if( sr.name().toString() == "empty-line" )
            {
                book->append("<br/>");
                break;
            }
            if(sr.name().toString() == "strong"
                    || sr.name().toString() == "sup"
                    || sr.name().toString() == "sub"
                    || sr.name().toString() == "code"
                    || sr.name().toString() == "cite")
            {
                book->append( "<" + sr.name().toString() + ">");
                break;
            }
            if(sr.name().toString() == "emphasis")
            {
                book->append( "<i>" );
                break;
            }
            if( sr.name().toString() == "v" )
            {
                book->append("<p align=\"left\" style=\"margin-left:25px;\">");
                break;
            }
            if(sr.name().toString() == "strikethrough")
            {
                book->append( "<strike>" );
                break;
            }

            if( sr.name().toString() == "a" ) // метка примечания
            {
                rId = "";
                for(int i = 0; i < sr.attributes().count(); i++)
                {
                    if(sr.attributes().at(i).name() == "type" )
                    {
                        //rType = sr.attributes().at(i).value().toString();
                    }
                    if(sr.attributes().at(i).name() == "href")
                    {
                        rId = sr.attributes().at(i).value().toString();
                    }
                }
                book->append("<a href=\"" + rId + "\"> ");
                //qDebug() << "a" << rId;
            }

            if(sr.name().toString() == "poem"
                    || sr.name().toString() == "stanza"
                    || sr.name().toString() == "epigraph")
            {
                break;
            }

            if(sr.name().toString() == "text-author" ) // автор текстта
            {
                book->append( "<p align=\"justify\" style=\"margin-left:45px;\">" );
                break;
            }
            if(sr.name().toString() == "date" ) // автор текстта
            {
                book->append( "<p align=\"justify\" style=\"margin-left:45px;\">" );
                break;
            }

            if( sr.name().toString() == "image" ) // расположение рисунков
            {
                if(sr.attributes().count() > 0)
                    book->append("<p align=\"center\">"+sr.attributes().at(0).value().toString() + "#" + "</p>");
            }
            if(sr.name() == "binary") // хранилище рисунков
            {
                if(sr.attributes().at(0).name() == "id")
                {
                    rId = sr.attributes().at(0).value().toString();
                    rType = sr.attributes().at(1).value().toString();
                }
                if(sr.attributes().at(1).name() == "id")
                {
                    rId = sr.attributes().at(1).value().toString();
                    rType = sr.attributes().at(0).value().toString();
                }
            }
            break;
        case QXmlStreamReader::EndElement:
            if( thisToken.last() == sr.name().toString() )
            {
                thisToken.removeLast();
            }
            else
                qDebug() << "error token";

            if(thisToken.contains("description")) // ОПИСАНИЕ КНИГИ
            {
                break; // не выводим
            }

            if( sr.name().toString() == "p"
                    || sr.name().toString() == "subtitle"
                    || sr.name().toString() == "v"
                    || sr.name().toString() == "date"
                    || sr.name().toString() == "text-author")
            {
                book->append("</p>");
                break;
            }

            if(sr.name().toString() == "td"
                    || sr.name().toString() == "th"
                    || sr.name().toString() == "tr"
                    || sr.name().toString() == "table"
                    || sr.name().toString() == "sup"
                    || sr.name().toString() == "sub"
                    || sr.name().toString() == "strong"
                    || sr.name().toString() == "code"
                    || sr.name().toString() == "cite")
            {
                book->append( "</"+sr.name().toString()+">" );
                break;
            }

            if( sr.name().toString() == "a" )
            {
                rId.remove("#");
                book->append( "</a><span id=\"" + rId + "___" + "\"></span>" );
                qDebug() << "id" << rId + "___";
                break;
            }

            if(sr.name().toString() == "emphasis")
            {
                book->append( "</i>" );
                break;
            }
            if(sr.name().toString() == "strikethrough")
            {
                book->append( "</strike>" );
                break;
            }

            if(sr.name().toString() == "stanza") // конец строфы
            {
                //book->append("<br/>");
                break;
            }
            if(sr.name().toString() == "epigraph"
                    || sr.name().toString() == "poem")
            {
                break;
            }

            if(special == "notes") // режим извлечения примечаний
            {
                if( sr.name().toString() == "body" )
                {
                    special = "";
                }
                if( sr.name().toString() == "section" )
                {
                    book->insert(book->lastIndexOf("<"), "<a href=\"#" + rId + "___" + "\"> назад</a>");
                }
            }
            break;
        case QXmlStreamReader::Characters:
            if( sr.text().toString() == "" )
            {
                //qDebug() << "isEmpty";
                break;
            }
            if( sr.text().toString() == "\n" )
            {
                //qDebug() << "isEmpty";
                break;
            }

            if(thisToken.contains("description")) // ОПИСАНИЕ КНИГИ
            {
                description.append(sr.text().toString() + " "); // не выводим
                break;
            }

            if(thisToken.contains( "binary" ) ) // для рисунков
            {
                QString image = "<img src=\"data:"
                        + rType +";base64,"
                        + sr.text().toString()
                        + "\"/>";
                book->replace("#"+rId +"#", image);
                rId = "";
                rType = "";

                break;
            }
            if(thisToken.contains("div"))
            {
                qDebug() << "div" << sr.text().toString();
                break;
            }
            if(thisToken.back() == "FictionBook")
            {
                qDebug() << "FictionBook" << sr.text().toString();
                break;
            }

            if( thisToken.contains("title") ) // формируем содержание
            {
                content->back() += " " + sr.text().toString();//content->back()=="" ? "" : " " +
                //  qDebug() << "title" << sr.text().toString();
            }

            if(special == "notes" && !thisToken.contains("title") )  // добавление текста примечания
            {
                rType += " ";
                rType += sr.text().toString();
                //break;
            }

            if(thisToken.back() == "p"
                    || thisToken.back() == "subtitle"
                    || thisToken.back() == "v"
                    || thisToken.back() == "emphasis"
                    || thisToken.back() == "strong"
                    || thisToken.back() == "strikethrough"
                    || thisToken.back() == "sup"
                    || thisToken.back() == "sub"
                    || thisToken.back() == "td"
                    || thisToken.back() == "th"
                    || thisToken.back() == "code"
                    || thisToken.back() == "cite"
                    || thisToken.back() == "text-author"  // ??
                    || thisToken.back() == "date"
                    )
            {
                book->append( sr.text().toString() );
                break;
            }

            if(thisToken.back() == "section")
            {
                break;
            }
            if(thisToken.back() == "body")
            {
                break;
            }
            if(thisToken.back() == "table"
                    || thisToken.back() == "tr"
                    || thisToken.back() == "title"
                    || thisToken.back() == "poem"
                    || thisToken.back() == "stanza")
            {
                //book->append( sr.text().toString() );
                break;
            }
            if(thisToken.back() == "annotation")
            {
                qDebug() << "annotation" << sr.text().toString();
                break;
            }

            if(thisToken.back() == "a")
            {
                book->append( sr.text().toString() );
                break;
            }
            //все прочие тэги
            if( !sr.text().toString().isEmpty() )
            {
                qDebug() << thisToken.back() <<  "исключение" ;
                book->append("<span> " + sr.text().toString() + "</span>");
            }
            break;
        }
    }
    f.close();

Функція відкриття файлу запускається натисканням кнопки:

    ui->textBrowser->clear();
    QString text;
    QStringList content;

    if(name.endsWith(".fb2"))
    {
        openerTextFiles otf;
        otf.openFB2File(name, &text, &content);
        ui->textBrowser->setText(text);
        ui->textBrowser->verticalScrollBar()->setValue(0);
    }

Тепер згенеровану html-сторінку можна легко зберегти

    QFile file(name);
    if ( !file.open(QIODevice::WriteOnly | QIODevice::Text) )
        return;

    QTextStream out(&file);
    out << ui->textBrowser->toHtml();
    file.close();

Наша читалка готова.

Вихідний код можна завантажити тут .

Рекомендуємо хостинг TIMEWEB
Рекомендуємо хостинг TIMEWEB
Стабільний хостинг, на якому розміщується соціальна мережа EVILEG. Для проектів на Django радимо VDS хостинг.

Вам це подобається? Поділіться в соціальних мережах!

ВТ
  • 06 лютого 2019 р. 10:58
  • (відредаговано)

добавил функцию чтения из fb2.zip чеоез QZipReader

    if (name.endsWith(".zip")) {
        QZipReader unzip(name);
        QByteArray ba;
            QVector<QZipReader::FileInfo> files = unzip.fileInfoList();
            QZipReader::FileInfo fi = files.at(0);
                if (fi.isFile) {
                    ba = unzip.fileData(fi.filePath);
                    if (fi.size != ba.size()) qDebug() << "unzip error";
            }
            unzip.close();
            openerTextFiles otf;
            otf.openFB2File(ba, &text, &content);
            ui->textBrowser->document()->clear();
            ui->textBrowser->setHtml(text);
            ui->textBrowser->verticalScrollBar()->setValue(0);
 }

в.pro добавить: QT += gui-private,
в .h :

#include <QtGui/private/qzipwriter_p.h>
#include <QtGui/private/qzipreader_p.h>

ридер через QByteArray сделал

    bool openFB2File(QByteArray ba, QString *book, QStringList *content);
ВТ
  • 09 лютого 2019 р. 03:24

ну у меня несколько компактней получилось


tags = {'poem':'i','emphasis':'i', 'stanza':'i','title':'p','title':'p','empty-line':'br',
'subtitle':'p','section' : 'p','strong':'b','v':'p','coverpage':'br',
}

attrs = {
'title':{'align':'center','style':'font-size:24px;'},
'subtitle':{'align':'center','style':'font-size:22px;'},
'table':{'width':'100%','align':'center','border':'1'},
'td':{'align':'center'},
'p':{'align':'justify','style':'font-size:20px;'},
}

class Fb2Reader(QObject):
    def __init__(self,fbdata = None):
        super().__init__()
        self.fbdata = fbdata

    def read(self):
        sr = QXmlStreamReader(self.fbdata)
        ba = QByteArray()
        wr = QXmlStreamWriter(ba)
        wr.setAutoFormatting(True)
        wr.setAutoFormattingIndent(1)
        tokens = []
        name = ''
        d = {}
        images = []
        while not sr.atEnd():
            elem = sr.readNext()
            if sr.hasError() : 
                err = sr.errorString()+':'+str(sr.lineNumber())
                return err
            if elem == QXmlStreamReader.StartDocument:
                wr.writeStartDocument()
            elif elem == QXmlStreamReader.EndDocument:
                wr.writeEndDocument()
            elif elem == QXmlStreamReader.StartElement:
                name = sr.name()
                tokens.append(name)
                if 'description' in tokens and name != 'image':
                    continue
                d = {i.name():i.value() for i in sr.attributes()}
                if name == 'image':
                    link = d.get('href')
                    wr.writeStartElement('p')
                    wr.writeAttribute('align','center')
                    wr.writeCharacters(link)
                    wr.writeEndElement()
                    continue
                tag = tags.get(name,name)
                wr.writeStartElement('',tag)
                attr = attrs.get(name)
                if  attr:
                    for i in attr: 
                        wr.writeAttribute('',i,attr[i])
                else:
                    for i in d: 
                        wr.writeAttribute('',i,d[i])            
            elif elem == QXmlStreamReader.EndElement:
                tokens.pop()
                wr.writeEndElement()
            elif elem == QXmlStreamReader.Characters:
                if 'description' in tokens: continue
                text = sr.text()
                if name == 'binary':
                    link,typ = d.get('id'),d.get('content-type')
                    content = '<img src=\"data:' + typ +';base64,' + text +'\"/>'
                    images.append(('#'+link,content,)) 
                else: wr.writeCharacters(text)
        s = bytes(ba).decode()
        for i in images: 
            s = s.replace(i[0],i[1])
        del images
        return s

```

ВТ
  • 09 лютого 2019 р. 03:27

и с навигацией вы круто заморочилить - QTextBrowser отслеживает нажатие на линки

        self.edit.anchorClicked.connect(self.on_anchor)
        self.btnBack.setEnabled(False)
        self.btnBack.clicked.connect(self.back_ward)

    def on_anchor(self,args):
        self.cursor_pos = self.edit.textCursor().position()
        self.btnBack.setEnabled(True)

    def back_ward(self):
        self.btnBack.setEnabled(False)
        self.edit.moveCursor(self.cursor_pos)
        self.edit.viewport().repaint()

```

Дмитрий
  • 26 лютого 2019 р. 10:37

Спасибо за комментарии, а zip-архивация пригодится для открытия книг fb3 и epub. Это работает на Qt без дополнительных библиотек? Я сделал архиватор, но qzipwriter_p.h и qzipreader_p.h, а ещё zlib качал отдельно.

Коментарі

Only authorized users can post comments.
Please, Log in or Sign up
Ua

Qt - Тест 001. Сигналы и слоты

  • Результат:84бали,
  • Рейтинг балів4
Ua

Qt - Тест 001. Сигналы и слоты

  • Результат:42бали,
  • Рейтинг балів-8
ОК

Qt - Тест 001. Сигналы и слоты

  • Результат:47бали,
  • Рейтинг балів-6
Останні коментарі
ИМ
Игорь Максимов22 листопада 2024 р. 11:51
Django - Підручник 017. Налаштуйте сторінку входу до Django Добрый вечер Евгений! Я сделал себе авторизацию аналогичную вашей, все работает, кроме возврата к предидущей странице. Редеректит всегда на главную, хотя в логах сервера вижу запросы на правильн…
Evgenii Legotckoi
Evgenii Legotckoi31 жовтня 2024 р. 14:37
Django - Урок 064. Як написати розширення для Python Markdown Добрый день. Да, можно. Либо через такие же плагины, либо с постобработкой через python библиотеку Beautiful Soup
A
ALO1ZE19 жовтня 2024 р. 08:19
Читалка файлів fb3 на Qt Creator Подскажите как это запустить? Я не шарю в программировании и кодинге. Скачал и установаил Qt, но куча ошибок выдается и не запустить. А очень надо fb3 переконвертировать в html
ИМ
Игорь Максимов05 жовтня 2024 р. 07:51
Django - Урок 064. Як написати розширення для Python Markdown Приветствую Евгений! У меня вопрос. Можно ли вставлять свои классы в разметку редактора markdown? Допустим имея стандартную разметку: <ul> <li></li> <li></l…
d
dblas505 липня 2024 р. 11:02
QML - Урок 016. База даних SQLite та робота з нею в QML Qt Здравствуйте, возникает такая проблема (я новичок): ApplicationWindow неизвестный элемент. (М300) для TextField и Button аналогично. Могу предположить, что из-за более новой верси…
Тепер обговоріть на форумі
Дмитрий
Дмитрий03 лютого 2025 р. 06:24
Создание deb-пакета. Как создать ярлык на рабочем столе после установки собственного deb-пакета? Всем привет. Сделал свой deb-пакет с программой. Всё устанавливается и работает. Ставлю по пути /usr/bin/my_application. Как для пользователя при установке пакета сразу создать ярлык на раб…
NW
Nayo Wai30 січня 2025 р. 09:22
не запускается компьютер!!! Не запускается компьютер (точнее работает блок , но сам монитор вообще жесть)В общем я ничего с интернета не скачивала в последнее время. На компе никаких левых пр…
n
nkly03 січня 2025 р. 02:52
Нужно запретить перемещение только некоторых итемов, остальные перемещать можно. Вопрос решен. Узнать QModelIndex элемента на который мы перетаскиваем другой элемент, можно с помощью функции indexAt(event->position().toPoint()) представления QTreeViev вызываемой в переопр…
M
Marsel16 серпня 2023 р. 14:26
OAuth2.0 через VK, получение email Спасибо большое за помощь и простите за то что отнял время своей невнимательностью.
Evgenii Legotckoi
Evgenii Legotckoi24 червня 2024 р. 15:11
добавить qlineseries в функции Я тут. Работы оень много. Отправил его в бан.

Слідкуйте за нами в соціальних мережах