Михаиллл
МихаилллJan. 11, 2019, 6:34 a.m.

Как текст из Word перевести в формат HTML

Qt, HTML, Word

Здравствуйте.
Как текст из Word перевести в формат HTML?
Ниже приведена функция получения текста в формате обычной строки.

    QString ResumeFileName ("");
    ResumeFileName = QFileDialog::getOpenFileName(0, "Выберете резюме hh.ru", "", "*.doc *.docx *.rtf");
    ResumeFileName.replace(QRegExp("[/]"), "\\");
    qDebug()<<ResumeFileName;
    if (ResumeFileName != "")
    {
        QAxObject   wordApplication("Word.Application");
        QAxObject *documents = wordApplication.querySubObject("Documents");
        QAxObject *document = documents->querySubObject("Open(const QString&, bool)", ResumeFileName, true);
        QAxObject *words = document->querySubObject("Words");
        QString TextResume;
        QString HTMLResume;
        int countWord = words->dynamicCall("Count()").toInt();
        for (int a = 1; a <= countWord; a++){
            TextResume.append(words->querySubObject("Item(int)", a)->dynamicCall("Text()").toString());
            HTMLResume.append(words->querySubObject("Item(int)", a)->dynamicCall("Text()").какаято функция);
        }
        document->dynamicCall("Close (boolean)", false);
        TextResume.replace(QRegExp("[\r]"), "\r\n"); //замена символов
        qDebug()<<TextResume;
        QString Coments1 ("");
        LoadResumeInDB(TextResume, Coments1, HTMLResume);
    }
We recommend hosting TIMEWEB
We recommend hosting TIMEWEB
Stable hosting, on which the social network EVILEG is located. For projects on Django we recommend VDS hosting.

Do you like it? Share on social networks!

20
nayk1982
  • Jan. 11, 2019, 8:17 a.m.

toHtmlEscaped()

    Михаиллл
    • Jan. 11, 2019, 11:19 a.m.
    • (edited)

    Так нельзя, выдает ошибку: no member named 'toHtmlEscaped' in 'QVariant'
    Я хотел бы сохранить форматирование и картинки

      nayk1982
      • Jan. 11, 2019, 10:54 p.m.

      Ваш вопрос был "Как текст из Word перевести в формат HTML?". Ошибку выдает, потому что это функция класса QString, а не QVariant.
      Если хотите документ HTML с форматированием и картинками, тогда нужно сам документ Word сохранять как Вэб страницу, а потом загружать готовый HTML в программу. Но учтите, что Word сохраняет HTML с кучей ненужных элементов.
      Сам формат документа HTML известен .

        Михаиллл
        • Jan. 12, 2019, 3:12 a.m.

        А QVariant нельзя сохранить как HTML?
        Не знаете, как сохранить Word в HTML?

          nayk1982
          • Jan. 12, 2019, 4:48 a.m.

          В Вашем коде QVariant содержит строку, поэтому

          QString htmlString = words->querySubObject("Item(int)", a)->dynamicCall("Text()").toString().toHtmlEscaped();
          HTMLResume.append( htmlString );
          

          Но это не решает Вашу проблему сохранения форматирования и картинок. Полагаю, что после открытия документа:

          QAxObject *document = documents->querySubObject("Open(const QString&, bool)", ResumeFileName, true);
          

          нужно вызвать функцию "SaveAs()" через ActiveX и указать формат сохранения HTML.

            Михаиллл
            • Jan. 12, 2019, 5:34 a.m.

            Скажите пожалуйста, как вызвать функцию "SaveAs()" через ActiveX ?

              Михаиллл
              • Jan. 12, 2019, 6:07 a.m.

              Этот текст можно перевести в ByteArray, может быть из него можно перевести в HTML?

                Михаиллл
                • Jan. 12, 2019, 6:53 a.m.

                Вот тут нашел решение.
                Попробовал сдалать так, но выдает ошибки при работе

                HTMLResume = words->querySubObject("WebOptions")->setProperty("Encoding",0x0000000A);
                qDebug()<<HTMLResume;
                

                Помогите пожалуйста с этим разобраться

                  nayk1982
                  • Jan. 12, 2019, 7:15 a.m.

                  А так?

                  document->querySubObject("WebOptions")->dynamicCall("Encoding", 65001);
                  document->dynamicCall("SaveAs(const QVariant&,const QVariant)", newFileName, 0x0000000A);
                  
                    Михаиллл
                    • Jan. 12, 2019, 8:28 a.m.

                    Программа также ломается при работе с ошибкой:
                    QAxBase::dynamicCallHelper: WebOptions: No such property in [unknown]
                    Candidates are:

                      Михаиллл
                      • Jan. 13, 2019, 6:59 a.m.

                      Еще тут обсуждали похожий вопрос, но я пока не смог из этого составить ничего рабочего.
                      Пожалуйста помогите.

                        Михаиллл
                        • Jan. 13, 2019, 7:30 a.m.

                        И еще есть такая функция, но как ей воспользоваться
                        QString QAxBase::generateDocumentation ()
                        Returns a rich text string with documentation for the wrapped COM object. Dump the string to an HTML-file, or use it in e.g. a QTextBrowser widget.

                          Михаиллл
                          • Jan. 14, 2019, 6:54 a.m.
                          • (edited)

                          А если так написать

                          HTMLResume.append(words->querySubObject("Item(int)", a)->dynamicCall("Encoding",0x0000000A).toString());
                          

                          то не выбрасывает, но возникают трудности с кодировкой :
                          QAxBase::dynamicCallHelper: Encoding: No such property in [unknown]
                          Candidates are:
                          Editors
                          EmphasisMark
                          End
                          EndnoteOptions
                          Endnotes
                          EnhMetaFileBits

                          А если написать так, то выкидывает

                          words->querySubObject("Item(int)", a)->querySubObject("WebOptions")->dynamicCall("Encoding",0x0000000A);
                          
                            Михаиллл
                            • Jan. 14, 2019, 8:28 a.m.

                            или может быть можно QVariant разметить на QTextEdit, а от туда перевести в HTML?

                              Михаиллл
                              • Jan. 14, 2019, 8:40 a.m.

                              Если делать так, то почти работает

                                          HTMLQVariant = words->querySubObject("Item(int)", a)->dynamicCall("Text()");
                                          HTMLResume += HTMLQVariant.convert(0x0000000A);
                              

                              Наверно нужна только верная кодировка.
                              Может Вы знаете какая?

                                Михаиллл
                                • Jan. 15, 2019, 7:07 a.m.

                                Видимо можно использовать эту библиотеку
                                И использовать этот код:

                                using OpenXmlPowerTools;
                                using DocumentFormat.OpenXml.Wordprocessing;
                                
                                byte[] byteArray = File.ReadAllBytes(DocxFilePath);
                                using (MemoryStream memoryStream = new MemoryStream())
                                {
                                     memoryStream.Write(byteArray, 0, byteArray.Length);
                                     using (WordprocessingDocument doc = WordprocessingDocument.Open(memoryStream, true))
                                     {
                                          HtmlConverterSettings settings = new HtmlConverterSettings()
                                          {
                                               PageTitle = "My Page Title"
                                          };
                                          XElement html = HtmlConverter.ConvertToHtml(doc, settings);
                                
                                          File.WriteAllText(HTMLFilePath, html.ToStringNewLineOnAttributes());
                                     }
                                }
                                

                                Вот только не могу подключить библиотеку.
                                Помогите пожалуйста

                                  Evgenii Legotckoi
                                  • Jan. 15, 2019, 7:21 a.m.

                                  Никак вы её не подключите в проект на Qt. Это C# библиотека.

                                    Михаиллл
                                    • Jan. 15, 2019, 8:34 a.m.

                                    На основании этого кода получил структуру

                                    #ifndef CONVERTDOCINHTML_H
                                    #define CONVERTDOCINHTML_H
                                    
                                    #include <QGuiApplication>
                                    #include <QDataStream>
                                    #include <QMetaType>
                                    #include <QXmlStreamWriter>
                                    #include <QBuffer>
                                    #include <QImage>
                                    #include <QBitmap>
                                    #include <QPixmap>
                                    #include <QVariant>
                                    #include <QDateTime>
                                    #include <QFile>
                                    
                                    struct ConvertDocInHTML
                                    {
                                        int guessDecimals(double val)
                                        {
                                            int precision = 0;
                                            for (double junk = 0; !qFuzzyIsNull(std::modf(val, &junk)); ++precision)
                                                val *= 10.0;
                                            return precision;
                                        }
                                        QString guessDecimalsString(double val, QLocale* loca  = Q_NULLPTR)
                                        {
                                            if (loca)
                                                return loca->toString(val, 'f', guessDecimals(val));
                                            return QString::number(val, 'f', guessDecimals(val));
                                        }
                                        bool isImageType(int val) {
                                            switch(val){
                                            case QMetaType::QImage:
                                            case QMetaType::QPixmap:
                                            case QMetaType::QBitmap:
                                                return true;
                                            }
                                            return false;
                                        }
                                        QString saveImageVariant(const QImage& imageData)
                                        {
                                            QByteArray byteArray;
                                            QBuffer buffer(&byteArray);
                                            imageData.save(&buffer, "PNG");
                                            return QString::fromLatin1(byteArray.toBase64().constData());
                                        }
                                        QString variantToString(const QVariant& val)
                                        {
                                            QString result;
                                            QByteArray data;
                                            QDataStream outStream(&data, QIODevice::WriteOnly);
                                            outStream << val;
                                            data = qCompress(data);
                                            return QString::fromLatin1(data.toBase64());
                                        }
                                    
                                        QString saveVariant(const QVariant& val)
                                        {
                                            if (val.isNull())
                                                return QString();
                                            switch (val.type()) {
                                            case QMetaType::UnknownType:
                                                Q_ASSERT_X(false, "saveVariant", "Trying to save unregistered type.");
                                                return QString();
                                            case QMetaType::Bool: return val.toBool() ? QStringLiteral("1") : QStringLiteral("0");
                                            case QMetaType::Long:
                                            case QMetaType::Short:
                                            case QMetaType::Char:
                                            case QMetaType::SChar:
                                            case QMetaType::Int: return QString::number(val.toInt());
                                            case QMetaType::ULong:
                                            case QMetaType::UShort:
                                            case QMetaType::UChar:
                                            case QMetaType::UInt: return QString::number(val.toUInt());
                                            case QMetaType::LongLong: return QString::number(val.toLongLong());
                                            case QMetaType::ULongLong:  return QString::number(val.toULongLong());
                                            case QMetaType::Double:
                                            case QMetaType::Float: return guessDecimalsString(val.toDouble());
                                            case QMetaType::QChar: return QString(val.toChar());
                                            case QMetaType::QString: return val.toString();
                                            case QMetaType::QByteArray: return QString::fromLatin1(val.toByteArray().toBase64());
                                            case QMetaType::QDate: return val.toDate().toString(Qt::ISODate);
                                            case QMetaType::QTime: return val.toTime().toString(Qt::ISODate);
                                            case QMetaType::QDateTime: return val.toDateTime().toString(Qt::ISODate);
                                            case QMetaType::QImage: return saveImageVariant(val.value<QImage>());
                                            case QMetaType::QPixmap: return saveImageVariant(val.value<QPixmap>().toImage());
                                            case QMetaType::QBitmap: return saveImageVariant(val.value<QBitmap>().toImage());
                                            default:
                                                return ConvertDocInHTML::variantToString(val);
                                            }
                                        }
                                        void writeHtmlVariant(QXmlStreamWriter& writer, const QVariant& val)
                                        {
                                            if (isImageType(val.type())) {
                                                writer.writeEmptyElement(QStringLiteral("img"));
                                                writer.writeAttribute(QStringLiteral("src"), "data:image/png;base64," + saveVariant(val));
                                                writer.writeAttribute(QStringLiteral("alt"), QStringLiteral("modelimage.png"));
                                                return;
                                            }
                                            writer.writeCharacters(saveVariant(val));
                                        }
                                    
                                    
                                       /* int main(int argc, char **argv) {
                                            QGuiApplication app(argc,argv);
                                            QFile htmlOutPut("TestOutput.html");
                                            if(!htmlOutPut.open(QIODevice::WriteOnly))
                                                return 1;
                                            htmlOutPut.write(QByteArrayLiteral("<!DOCTYPE html>"));
                                            QXmlStreamWriter htmlWriter(&htmlOutPut);
                                            htmlWriter.writeStartElement(QStringLiteral("html"));
                                            htmlWriter.writeAttribute(QStringLiteral("xmlns"),QStringLiteral("http://www.w3.org/1999/xhtml"));
                                            htmlWriter.writeAttribute(QStringLiteral("lang"),QStringLiteral("en"));
                                            htmlWriter.writeAttribute(QStringLiteral("xml:lang"),QStringLiteral("en"));
                                            htmlWriter.writeStartElement(QStringLiteral("head"));
                                            htmlWriter.writeEmptyElement(QStringLiteral("meta"));
                                            htmlWriter.writeAttribute(QStringLiteral("http-equiv"),QStringLiteral("Content-Type"));
                                            htmlWriter.writeAttribute(QStringLiteral("content"),QStringLiteral("text/html; charset=utf-8"));
                                            htmlWriter.writeStartElement(QStringLiteral("title"));
                                            htmlWriter.writeCharacters(QStringLiteral("Testing Variant to Html"));
                                            htmlWriter.writeEndElement(); //title
                                            htmlWriter.writeEndElement(); //head
                                            htmlWriter.writeStartElement(QStringLiteral("body"));
                                            htmlWriter.writeStartElement(QStringLiteral("p"));
                                            writeHtmlVariant(htmlWriter, QStringLiteral("The magic number is: "));
                                            writeHtmlVariant(htmlWriter, 88);
                                            writeHtmlVariant(htmlWriter, QStringLiteral(" and "));
                                            writeHtmlVariant(htmlWriter, 3.21);
                                            htmlWriter.writeEndElement(); //p
                                            QPixmap blueImage(200,200);
                                            blueImage.fill(Qt::blue);
                                            writeHtmlVariant(htmlWriter,blueImage);
                                            htmlWriter.writeEndDocument();
                                            return 0;
                                        }*/
                                    };
                                    
                                    #endif // CONVERTDOCINHTML_H
                                    
                                    

                                    Пробую сделать так:

                                    TextResume.append(words->querySubObject("Item(int)", a)->dynamicCall("Text()").toString());
                                                HTMLQVariant = words->querySubObject("Item(int)", a)->dynamicCall("Text()");
                                                HTMLResume = ConvertDocInHTML::saveVariant(HTMLQVariant);
                                    

                                    Но получаю ошибку :
                                    D:\QTProject\ReaderResume\mainwindow.cpp:1198: ошибка: cannot call member function 'QString ConvertDocInHTML::saveVariant(const QVariant&)' without object
                                    HTMLResume = ConvertDocInHTML::saveVariant(HTMLQVariant);
                                    Не знаете ли Вы как можно воспользоваться этой структурой?

                                      Evgenii Legotckoi
                                      • Jan. 15, 2019, 8:49 a.m.

                                      вы вызываете saveVariant как статический метод, а он таковым не является. Нужно создать объект ConvertDocInHTML, а потом из этого объекта вызывать данный метод.

                                        Михаиллл
                                        • Jan. 15, 2019, 11:53 a.m.

                                        Спасибо, заработало.
                                        Но выдало обычный текст без форатирования HTML.
                                        Придется искать дальше

                                          Comments

                                          Only authorized users can post comments.
                                          Please, Log in or Sign up
                                          l
                                          • laei
                                          • April 23, 2024, 4:19 p.m.

                                          C ++ - Test 004. Pointers, Arrays and Loops

                                          • Result:10points,
                                          • Rating points-10
                                          l
                                          • laei
                                          • April 23, 2024, 4:17 p.m.

                                          C++ - Тест 003. Условия и циклы

                                          • Result:50points,
                                          • Rating points-4
                                          e
                                          • ehot
                                          • March 31, 2024, 9:29 p.m.

                                          C++ - Тест 003. Условия и циклы

                                          • Result:78points,
                                          • Rating points2
                                          Last comments
                                          k
                                          kmssrFeb. 9, 2024, 2:43 a.m.
                                          Qt Linux - Lesson 001. Autorun Qt application under Linux как сделать автозапуск для флэтпака, который не даёт создавать файлы в ~/.config - вот это вопрос ))
                                          Qt WinAPI - Lesson 007. Working with ICMP Ping in Qt Без строки #include <QRegularExpressionValidator> в заголовочном файле не работает валидатор.
                                          EVA
                                          EVADec. 25, 2023, 6:30 p.m.
                                          Boost - static linking in CMake project under Windows Ошибка LNK1104 часто возникает, когда компоновщик не может найти или открыть файл библиотеки. В вашем случае, это файл libboost_locale-vc142-mt-gd-x64-1_74.lib из библиотеки Boost для C+…
                                          J
                                          JonnyJoDec. 25, 2023, 4:38 p.m.
                                          Boost - static linking in CMake project under Windows Сделал всё по-как у вас, но выдаёт ошибку [build] LINK : fatal error LNK1104: не удается открыть файл "libboost_locale-vc142-mt-gd-x64-1_74.lib" Хоть убей, не могу понять в чём дел…
                                          G
                                          GvozdikDec. 19, 2023, 5:01 a.m.
                                          Qt/C++ - Lesson 056. Connecting the Boost library in Qt for MinGW and MSVC compilers Для решения твой проблемы добавь в файл .pro строчку "LIBS += -lws2_32" она решит проблему , лично мне помогло.
                                          Now discuss on the forum
                                          G
                                          GarApril 22, 2024, 12:46 p.m.
                                          Clipboard Как скопировать окно целиком в clipb?
                                          DA
                                          Dr Gangil AcademicsApril 20, 2024, 2:45 p.m.
                                          Unlock Your Aesthetic Potential: Explore MSC in Facial Aesthetics and Cosmetology in India Embark on a transformative journey with an msc in facial aesthetics and cosmetology in india . Delve into the intricate world of beauty and rejuvenation, guided by expert faculty and …
                                          a
                                          a_vlasovApril 14, 2024, 1:41 p.m.
                                          Мобильное приложение на C++Qt и бэкенд к нему на Django Rest Framework Евгений, добрый день! Такой вопрос. Верно ли следующее утверждение: Любое Android-приложение, написанное на Java/Kotlin чисто теоретически (пусть и с большими трудностями) можно написать и на C+…
                                          Павел Дорофеев
                                          Павел ДорофеевApril 14, 2024, 9:35 a.m.
                                          QTableWidget с 2 заголовками Вот тут есть кастомный QTableView с многорядностью проект поддерживается, обращайтесь
                                          f
                                          fastrexApril 4, 2024, 11:47 a.m.
                                          Вернуть старое поведение QComboBox, не менять индекс при resetModel Добрый день! У нас много проектов в которых используется QComboBox, в версии 5.5.1, когда модель испускает сигнал resetModel, currentIndex не менялся. В версии 5.15 при resetModel происходит try…

                                          Follow us in social networks