Михаиллл
МихаилллJan. 11, 2019, 6:34 a.m.

Как текст из Word перевести в формат HTML

Qt, HTML, Word

Здравствуйте.
Как текст из Word перевести в формат HTML?
Ниже приведена функция получения текста в формате обычной строки.

    QString ResumeFileName ("");
    ResumeFileName = QFileDialog::getOpenFileName(0, "Выберете резюме hh.ru", "", "*.doc *.docx *.rtf");
    ResumeFileName.replace(QRegExp("[/]"), "\\");
    qDebug()<<ResumeFileName;
    if (ResumeFileName != "")
    {
        QAxObject   wordApplication("Word.Application");
        QAxObject *documents = wordApplication.querySubObject("Documents");
        QAxObject *document = documents->querySubObject("Open(const QString&, bool)", ResumeFileName, true);
        QAxObject *words = document->querySubObject("Words");
        QString TextResume;
        QString HTMLResume;
        int countWord = words->dynamicCall("Count()").toInt();
        for (int a = 1; a <= countWord; a++){
            TextResume.append(words->querySubObject("Item(int)", a)->dynamicCall("Text()").toString());
            HTMLResume.append(words->querySubObject("Item(int)", a)->dynamicCall("Text()").какаято функция);
        }
        document->dynamicCall("Close (boolean)", false);
        TextResume.replace(QRegExp("[\r]"), "\r\n"); //замена символов
        qDebug()<<TextResume;
        QString Coments1 ("");
        LoadResumeInDB(TextResume, Coments1, HTMLResume);
    }
We recommend hosting TIMEWEB
We recommend hosting TIMEWEB
Stable hosting, on which the social network EVILEG is located. For projects on Django we recommend VDS hosting.

Do you like it? Share on social networks!

20
nayk1982
  • Jan. 11, 2019, 8:17 a.m.

toHtmlEscaped()

    Михаиллл
    • Jan. 11, 2019, 11:19 a.m.
    • (edited)

    Так нельзя, выдает ошибку: no member named 'toHtmlEscaped' in 'QVariant'
    Я хотел бы сохранить форматирование и картинки

      nayk1982
      • Jan. 11, 2019, 10:54 p.m.

      Ваш вопрос был "Как текст из Word перевести в формат HTML?". Ошибку выдает, потому что это функция класса QString, а не QVariant.
      Если хотите документ HTML с форматированием и картинками, тогда нужно сам документ Word сохранять как Вэб страницу, а потом загружать готовый HTML в программу. Но учтите, что Word сохраняет HTML с кучей ненужных элементов.
      Сам формат документа HTML известен .

        Михаиллл
        • Jan. 12, 2019, 3:12 a.m.

        А QVariant нельзя сохранить как HTML?
        Не знаете, как сохранить Word в HTML?

          nayk1982
          • Jan. 12, 2019, 4:48 a.m.

          В Вашем коде QVariant содержит строку, поэтому

          QString htmlString = words->querySubObject("Item(int)", a)->dynamicCall("Text()").toString().toHtmlEscaped();
          HTMLResume.append( htmlString );
          

          Но это не решает Вашу проблему сохранения форматирования и картинок. Полагаю, что после открытия документа:

          QAxObject *document = documents->querySubObject("Open(const QString&, bool)", ResumeFileName, true);
          

          нужно вызвать функцию "SaveAs()" через ActiveX и указать формат сохранения HTML.

            Михаиллл
            • Jan. 12, 2019, 5:34 a.m.

            Скажите пожалуйста, как вызвать функцию "SaveAs()" через ActiveX ?

              Михаиллл
              • Jan. 12, 2019, 6:07 a.m.

              Этот текст можно перевести в ByteArray, может быть из него можно перевести в HTML?

                Михаиллл
                • Jan. 12, 2019, 6:53 a.m.

                Вот тут нашел решение.
                Попробовал сдалать так, но выдает ошибки при работе

                HTMLResume = words->querySubObject("WebOptions")->setProperty("Encoding",0x0000000A);
                qDebug()<<HTMLResume;
                

                Помогите пожалуйста с этим разобраться

                  nayk1982
                  • Jan. 12, 2019, 7:15 a.m.

                  А так?

                  document->querySubObject("WebOptions")->dynamicCall("Encoding", 65001);
                  document->dynamicCall("SaveAs(const QVariant&,const QVariant)", newFileName, 0x0000000A);
                  
                    Михаиллл
                    • Jan. 12, 2019, 8:28 a.m.

                    Программа также ломается при работе с ошибкой:
                    QAxBase::dynamicCallHelper: WebOptions: No such property in [unknown]
                    Candidates are:

                      Михаиллл
                      • Jan. 13, 2019, 6:59 a.m.

                      Еще тут обсуждали похожий вопрос, но я пока не смог из этого составить ничего рабочего.
                      Пожалуйста помогите.

                        Михаиллл
                        • Jan. 13, 2019, 7:30 a.m.

                        И еще есть такая функция, но как ей воспользоваться
                        QString QAxBase::generateDocumentation ()
                        Returns a rich text string with documentation for the wrapped COM object. Dump the string to an HTML-file, or use it in e.g. a QTextBrowser widget.

                          Михаиллл
                          • Jan. 14, 2019, 6:54 a.m.
                          • (edited)

                          А если так написать

                          HTMLResume.append(words->querySubObject("Item(int)", a)->dynamicCall("Encoding",0x0000000A).toString());
                          

                          то не выбрасывает, но возникают трудности с кодировкой :
                          QAxBase::dynamicCallHelper: Encoding: No such property in [unknown]
                          Candidates are:
                          Editors
                          EmphasisMark
                          End
                          EndnoteOptions
                          Endnotes
                          EnhMetaFileBits

                          А если написать так, то выкидывает

                          words->querySubObject("Item(int)", a)->querySubObject("WebOptions")->dynamicCall("Encoding",0x0000000A);
                          
                            Михаиллл
                            • Jan. 14, 2019, 8:28 a.m.

                            или может быть можно QVariant разметить на QTextEdit, а от туда перевести в HTML?

                              Михаиллл
                              • Jan. 14, 2019, 8:40 a.m.

                              Если делать так, то почти работает

                                          HTMLQVariant = words->querySubObject("Item(int)", a)->dynamicCall("Text()");
                                          HTMLResume += HTMLQVariant.convert(0x0000000A);
                              

                              Наверно нужна только верная кодировка.
                              Может Вы знаете какая?

                                Михаиллл
                                • Jan. 15, 2019, 7:07 a.m.

                                Видимо можно использовать эту библиотеку
                                И использовать этот код:

                                using OpenXmlPowerTools;
                                using DocumentFormat.OpenXml.Wordprocessing;
                                
                                byte[] byteArray = File.ReadAllBytes(DocxFilePath);
                                using (MemoryStream memoryStream = new MemoryStream())
                                {
                                     memoryStream.Write(byteArray, 0, byteArray.Length);
                                     using (WordprocessingDocument doc = WordprocessingDocument.Open(memoryStream, true))
                                     {
                                          HtmlConverterSettings settings = new HtmlConverterSettings()
                                          {
                                               PageTitle = "My Page Title"
                                          };
                                          XElement html = HtmlConverter.ConvertToHtml(doc, settings);
                                
                                          File.WriteAllText(HTMLFilePath, html.ToStringNewLineOnAttributes());
                                     }
                                }
                                

                                Вот только не могу подключить библиотеку.
                                Помогите пожалуйста

                                  Evgenii Legotckoi
                                  • Jan. 15, 2019, 7:21 a.m.

                                  Никак вы её не подключите в проект на Qt. Это C# библиотека.

                                    Михаиллл
                                    • Jan. 15, 2019, 8:34 a.m.

                                    На основании этого кода получил структуру

                                    #ifndef CONVERTDOCINHTML_H
                                    #define CONVERTDOCINHTML_H
                                    
                                    #include <QGuiApplication>
                                    #include <QDataStream>
                                    #include <QMetaType>
                                    #include <QXmlStreamWriter>
                                    #include <QBuffer>
                                    #include <QImage>
                                    #include <QBitmap>
                                    #include <QPixmap>
                                    #include <QVariant>
                                    #include <QDateTime>
                                    #include <QFile>
                                    
                                    struct ConvertDocInHTML
                                    {
                                        int guessDecimals(double val)
                                        {
                                            int precision = 0;
                                            for (double junk = 0; !qFuzzyIsNull(std::modf(val, &junk)); ++precision)
                                                val *= 10.0;
                                            return precision;
                                        }
                                        QString guessDecimalsString(double val, QLocale* loca  = Q_NULLPTR)
                                        {
                                            if (loca)
                                                return loca->toString(val, 'f', guessDecimals(val));
                                            return QString::number(val, 'f', guessDecimals(val));
                                        }
                                        bool isImageType(int val) {
                                            switch(val){
                                            case QMetaType::QImage:
                                            case QMetaType::QPixmap:
                                            case QMetaType::QBitmap:
                                                return true;
                                            }
                                            return false;
                                        }
                                        QString saveImageVariant(const QImage& imageData)
                                        {
                                            QByteArray byteArray;
                                            QBuffer buffer(&byteArray);
                                            imageData.save(&buffer, "PNG");
                                            return QString::fromLatin1(byteArray.toBase64().constData());
                                        }
                                        QString variantToString(const QVariant& val)
                                        {
                                            QString result;
                                            QByteArray data;
                                            QDataStream outStream(&data, QIODevice::WriteOnly);
                                            outStream << val;
                                            data = qCompress(data);
                                            return QString::fromLatin1(data.toBase64());
                                        }
                                    
                                        QString saveVariant(const QVariant& val)
                                        {
                                            if (val.isNull())
                                                return QString();
                                            switch (val.type()) {
                                            case QMetaType::UnknownType:
                                                Q_ASSERT_X(false, "saveVariant", "Trying to save unregistered type.");
                                                return QString();
                                            case QMetaType::Bool: return val.toBool() ? QStringLiteral("1") : QStringLiteral("0");
                                            case QMetaType::Long:
                                            case QMetaType::Short:
                                            case QMetaType::Char:
                                            case QMetaType::SChar:
                                            case QMetaType::Int: return QString::number(val.toInt());
                                            case QMetaType::ULong:
                                            case QMetaType::UShort:
                                            case QMetaType::UChar:
                                            case QMetaType::UInt: return QString::number(val.toUInt());
                                            case QMetaType::LongLong: return QString::number(val.toLongLong());
                                            case QMetaType::ULongLong:  return QString::number(val.toULongLong());
                                            case QMetaType::Double:
                                            case QMetaType::Float: return guessDecimalsString(val.toDouble());
                                            case QMetaType::QChar: return QString(val.toChar());
                                            case QMetaType::QString: return val.toString();
                                            case QMetaType::QByteArray: return QString::fromLatin1(val.toByteArray().toBase64());
                                            case QMetaType::QDate: return val.toDate().toString(Qt::ISODate);
                                            case QMetaType::QTime: return val.toTime().toString(Qt::ISODate);
                                            case QMetaType::QDateTime: return val.toDateTime().toString(Qt::ISODate);
                                            case QMetaType::QImage: return saveImageVariant(val.value<QImage>());
                                            case QMetaType::QPixmap: return saveImageVariant(val.value<QPixmap>().toImage());
                                            case QMetaType::QBitmap: return saveImageVariant(val.value<QBitmap>().toImage());
                                            default:
                                                return ConvertDocInHTML::variantToString(val);
                                            }
                                        }
                                        void writeHtmlVariant(QXmlStreamWriter& writer, const QVariant& val)
                                        {
                                            if (isImageType(val.type())) {
                                                writer.writeEmptyElement(QStringLiteral("img"));
                                                writer.writeAttribute(QStringLiteral("src"), "data:image/png;base64," + saveVariant(val));
                                                writer.writeAttribute(QStringLiteral("alt"), QStringLiteral("modelimage.png"));
                                                return;
                                            }
                                            writer.writeCharacters(saveVariant(val));
                                        }
                                    
                                    
                                       /* int main(int argc, char **argv) {
                                            QGuiApplication app(argc,argv);
                                            QFile htmlOutPut("TestOutput.html");
                                            if(!htmlOutPut.open(QIODevice::WriteOnly))
                                                return 1;
                                            htmlOutPut.write(QByteArrayLiteral("<!DOCTYPE html>"));
                                            QXmlStreamWriter htmlWriter(&htmlOutPut);
                                            htmlWriter.writeStartElement(QStringLiteral("html"));
                                            htmlWriter.writeAttribute(QStringLiteral("xmlns"),QStringLiteral("http://www.w3.org/1999/xhtml"));
                                            htmlWriter.writeAttribute(QStringLiteral("lang"),QStringLiteral("en"));
                                            htmlWriter.writeAttribute(QStringLiteral("xml:lang"),QStringLiteral("en"));
                                            htmlWriter.writeStartElement(QStringLiteral("head"));
                                            htmlWriter.writeEmptyElement(QStringLiteral("meta"));
                                            htmlWriter.writeAttribute(QStringLiteral("http-equiv"),QStringLiteral("Content-Type"));
                                            htmlWriter.writeAttribute(QStringLiteral("content"),QStringLiteral("text/html; charset=utf-8"));
                                            htmlWriter.writeStartElement(QStringLiteral("title"));
                                            htmlWriter.writeCharacters(QStringLiteral("Testing Variant to Html"));
                                            htmlWriter.writeEndElement(); //title
                                            htmlWriter.writeEndElement(); //head
                                            htmlWriter.writeStartElement(QStringLiteral("body"));
                                            htmlWriter.writeStartElement(QStringLiteral("p"));
                                            writeHtmlVariant(htmlWriter, QStringLiteral("The magic number is: "));
                                            writeHtmlVariant(htmlWriter, 88);
                                            writeHtmlVariant(htmlWriter, QStringLiteral(" and "));
                                            writeHtmlVariant(htmlWriter, 3.21);
                                            htmlWriter.writeEndElement(); //p
                                            QPixmap blueImage(200,200);
                                            blueImage.fill(Qt::blue);
                                            writeHtmlVariant(htmlWriter,blueImage);
                                            htmlWriter.writeEndDocument();
                                            return 0;
                                        }*/
                                    };
                                    
                                    #endif // CONVERTDOCINHTML_H
                                    
                                    

                                    Пробую сделать так:

                                    TextResume.append(words->querySubObject("Item(int)", a)->dynamicCall("Text()").toString());
                                                HTMLQVariant = words->querySubObject("Item(int)", a)->dynamicCall("Text()");
                                                HTMLResume = ConvertDocInHTML::saveVariant(HTMLQVariant);
                                    

                                    Но получаю ошибку :
                                    D:\QTProject\ReaderResume\mainwindow.cpp:1198: ошибка: cannot call member function 'QString ConvertDocInHTML::saveVariant(const QVariant&)' without object
                                    HTMLResume = ConvertDocInHTML::saveVariant(HTMLQVariant);
                                    Не знаете ли Вы как можно воспользоваться этой структурой?

                                      Evgenii Legotckoi
                                      • Jan. 15, 2019, 8:49 a.m.

                                      вы вызываете saveVariant как статический метод, а он таковым не является. Нужно создать объект ConvertDocInHTML, а потом из этого объекта вызывать данный метод.

                                        Михаиллл
                                        • Jan. 15, 2019, 11:53 a.m.

                                        Спасибо, заработало.
                                        Но выдало обычный текст без форатирования HTML.
                                        Придется искать дальше

                                          Comments

                                          Only authorized users can post comments.
                                          Please, Log in or Sign up
                                          AD

                                          C ++ - Test 004. Pointers, Arrays and Loops

                                          • Result:50points,
                                          • Rating points-4
                                          m

                                          C ++ - Test 004. Pointers, Arrays and Loops

                                          • Result:80points,
                                          • Rating points4
                                          m

                                          C ++ - Test 004. Pointers, Arrays and Loops

                                          • Result:20points,
                                          • Rating points-10
                                          Last comments
                                          i
                                          innorwallNov. 15, 2024, 6:30 a.m.
                                          Qt/C++ - Lesson 065. The correspondence of HTTP errors to server response errors in QNetworkAccessManager s Midsummer Classic in Kansas City priligy online pharmacy
                                          i
                                          innorwallNov. 15, 2024, 5:44 a.m.
                                          Qt/C++ - Lesson 039. How to paint stroke in QSqlTableModel by value in the column? Many OPKs would advise users to start using the test strips around day 9 of your cycle, considering day 1 to be the first day of full menstrual flow buy priligy australia
                                          i
                                          innorwallNov. 15, 2024, 2:27 a.m.
                                          Release of C++/Qt and QML application deployment utility CQtDeployer v1.4.0 (Binary Box) optionally substituted alkoxy, optionally substituted alkenyloxy, optionally substituted alkynyloxy, optionally substituted aryloxy, OCH, OC H, OC H, OC H, OC H, OC H, OC H, O C CH, OCH CH OH, O…
                                          i
                                          innorwallNov. 14, 2024, 9:26 p.m.
                                          Qt/C++ - Lesson 031. QCustomPlot – The build of charts with time buy generic priligy We can just chat, and we will not lose too much time anyway
                                          i
                                          innorwallNov. 14, 2024, 7:03 p.m.
                                          Qt/C++ - Lesson 060. Configuring the appearance of the application in runtime I didnt have an issue work colors priligy dapoxetine 60mg revia cost uk August 3, 2022 Reply
                                          Now discuss on the forum
                                          t
                                          tonypeachey1Nov. 15, 2024, 6:04 a.m.
                                          google domain [url=https://google.com/]domain[/url] domain [http://www.example.com link title]
                                          i
                                          innorwallNov. 15, 2024, 5:50 a.m.
                                          добавить qlineseries в функции priligy for sale Gently flush using an ear syringe
                                          i
                                          innorwallNov. 11, 2024, 10:55 a.m.
                                          Всё ещё разбираюсь с кешем. priligy walgreens levitra dulcolax carbs The third ring was found to be made up of ultra relativistic electrons, which are also present in both the outer and inner rings
                                          9
                                          9AnonimOct. 25, 2024, 9:10 a.m.
                                          Машина тьюринга // Начальное состояние 0 0, ,<,1 // Переход в состояние 1 при пустом символе 0,0,>,0 // Остаемся в состоянии 0, двигаясь вправо при встрече 0 0,1,>…

                                          Follow us in social networks