Михаиллл
МихаилллOct. 22, 2018, 8:30 a.m.

Чтение текста и добавление в массив

массив, текст

Здравствуйте.

Хочу сделать чтение доковских файлов разного размера и записывание их куда либо, скорее всего в массив и в файл.

Скажите пожалуйста, как правильно записать такой текстовый массив?


We recommend hosting TIMEWEB
We recommend hosting TIMEWEB
Stable hosting, on which the social network EVILEG is located. For projects on Django we recommend VDS hosting.

Do you like it? Share on social networks!

14
Александр Панюшкин
  • Oct. 22, 2018, 8:34 a.m.

Мне кажется, что вопрос не совсем корректно поставлен. Вордовские файлы - это не только текст.

Можно о задаче подробнее? Что за файлы будут?



    Михаиллл
    • Oct. 22, 2018, 8:52 a.m.

    Текстовый файлы - это резюме. Планирую сделать их чтение, хранение, чтение из массива и поиск.


      Evgenii Legotckoi
      • Oct. 22, 2018, 8:59 a.m.

      резюме подразумевает наличие вёрстки и т.д.?

      Как бы целые огранизации разработчиков, типо разработчиков LibreOffice и OpenOffice, с немаленькими бюджетами и штатами специалистов, а также большим комьюнити вольных разработчиков, которые пытаются помогать развитию этих проектов, до сих пор не смогли сделать 100 процентную поддержку импорта доковских документов, а вы хотите это сделать в одиночку?

      Мне кажется, что вы не осознаёте масштаб проблемы )))

      Что именно хотите читать оттуда? Вся информация содержится в блоках вёрстки с кучей служебной информации, которую просто так не выдрать с документов типа *.doc, *.docx

        Александр Панюшкин
        • Oct. 22, 2018, 9:02 a.m.
        • (edited)

        Я бы начал изучать эту тему с вот этой ссылки - https://wiki.qt.io/Handling_Microsoft_Word_file_format

        Тут совсем не много текста, но очень много информации.

        Но я бы не взялся за такую работу - она, на мой взгляд, не реализуема. Резюме не стандартизованы, не говоря уже об оформлениях и прочем.

        Дешевле посадить девочку, которая это будет копипастить.




          Вот и я о том же )) овчинка выделки не стоит. Проще написать паука, который скачает все открытые резюме на хедхантере, или каком-нибудь ином ресурсе.

            Михаиллл
            • Oct. 22, 2018, 12:42 p.m.

            Спасибо за ссылку.

            Мне нужна довольно простенькая  программка, поэтому справлюсь сам.

            Для меня пока стоит вопрос с чтением.

            Можно ли с помощью ActiveX записывать в QAxContainer и потом как то сохранять и читать этот контейнер?





              Михаиллл
              • Oct. 23, 2018, 9:35 a.m.

              Попробовал добавить

              QT       += core gui qaxcontainer

              Выдает ошибку неизвестного модуля.

              Скажите пожалуйста, у меня не полная версия QT или нужно скачивать какую-то библиотеку?

                Evgenii Legotckoi
                • Oct. 23, 2018, 2:27 p.m.

                В той ссылке на документацию, что вы привели, написано иначе


                CONFIG += qaxcontainer
                  Михаиллл
                  • Oct. 24, 2018, 7:03 a.m.

                  Спасибо. Не заметил. Как оказалось правильно теперь писать так.

                  QT       += core gui axcontainer
                  

                  Но когда пишу так

                   QAxObject   axObject("Word.Application");

                  выдает ошибку

                  D:\QTProject\ReaderResume\main.cpp:9: ошибка: 'QAxObject' was not declared in this scope

                  QAxObject   *documents = axObject.querySubObject("Documents");

                  Не знаете, как правильно прочитать доковский файл используя это?

                    Михаиллл
                    • Oct. 25, 2018, 8:28 a.m.

                    Вот так оказывается можно читать doc  и  docx

                    QAxObject   wordApplication("Word.Application");
                        QAxObject *documents = wordApplication.querySubObject("Documents");
                        QAxObject *document = documents->querySubObject("Open(const QString&, bool)", "C:\\ForResume\\2.docx", true);
                        QAxObject *words = document->querySubObject("Words");
                        QString textResult;
                        int countWord = words->dynamicCall("Count()").toInt();
                        for (int a = 1; a <= countWord; a++){
                        textResult.append(words->querySubObject("Item(int)", a)->dynamicCall("Text()").toString());
                        }
                        qDebug()<<textResult;
                      Evgenii Legotckoi
                      • Oct. 25, 2018, 8:38 a.m.

                      Вы - Молодец!

                      Там получается сплошной текст?

                        Михаиллл
                        • Oct. 25, 2018, 8:52 a.m.

                        Нет, с пробелами и закодированными спец символами..

                        Забыл добавить строчку на закрытие файла

                        document->dynamicCall("Close (boolean)", false);

                        И еще беда, если в тексте картинка есть, то появляется всплывающие окно и нужно нажимать ок, не знаю как убрать...



                          Evgenii Legotckoi
                          • Oct. 25, 2018, 5:18 p.m.

                          К сожалению, тут придётся документацию на ActiveX зачитывать до дыр, как мне кажется (((((

                            Михаиллл
                            • Oct. 29, 2018, 8:37 a.m.
                            • (edited)

                            Еще оказалось, что для адекватной работы нужно делать замену слэшей при запросе имени, иначе не работает

                            void MainWindow::on_AddResumeButton_clicked()  //Function and button Add resume
                            {
                                QString setOpenResumeName=(QFileDialog::getOpenFileName(0, "Открыть резюме в формате ворд", "", "*.doc *.docx *.rtf"));//путь , вариант расширения "*.cpp *.h"    
                            qDebug()<<setOpenResumeName;
                                setOpenResumeName.replace(QRegExp("[/]"), "\\"); //замена символов   
                            qDebug()<<setOpenResumeName;
                                QAxObject   wordApplication("Word.Application");
                                QAxObject *documents = wordApplication.querySubObject("Documents");
                                QAxObject *document = documents->querySubObject("Open(const QString&, bool)", setOpenResumeName, true);
                                QAxObject *words = document->querySubObject("Words");
                                QString TextResume;
                                int countWord = words->dynamicCall("Count()").toInt();
                                for (int a = 1; a <= countWord; a++){
                                    TextResume.append(words->querySubObject("Item(int)", a)->dynamicCall("Text()").toString());
                                }
                                document->dynamicCall("Close (boolean)", false);
                                TextResume.replace(QRegExp("[\r]"), "\r\n"); //замена символов
                                qDebug()<<TextResume;
                            }

                              Comments

                              Only authorized users can post comments.
                              Please, Log in or Sign up
                              B

                              C++ - Test 002. Constants

                              • Result:16points,
                              • Rating points-10
                              B

                              C++ - Test 001. The first program and data types

                              • Result:46points,
                              • Rating points-6
                              FL

                              C++ - Test 006. Enumerations

                              • Result:80points,
                              • Rating points4
                              Last comments
                              k
                              kmssrFeb. 9, 2024, 5:43 a.m.
                              Qt Linux - Lesson 001. Autorun Qt application under Linux как сделать автозапуск для флэтпака, который не даёт создавать файлы в ~/.config - вот это вопрос ))
                              Qt WinAPI - Lesson 007. Working with ICMP Ping in Qt Без строки #include <QRegularExpressionValidator> в заголовочном файле не работает валидатор.
                              EVA
                              EVADec. 25, 2023, 9:30 p.m.
                              Boost - static linking in CMake project under Windows Ошибка LNK1104 часто возникает, когда компоновщик не может найти или открыть файл библиотеки. В вашем случае, это файл libboost_locale-vc142-mt-gd-x64-1_74.lib из библиотеки Boost для C+…
                              J
                              JonnyJoDec. 25, 2023, 7:38 p.m.
                              Boost - static linking in CMake project under Windows Сделал всё по-как у вас, но выдаёт ошибку [build] LINK : fatal error LNK1104: не удается открыть файл "libboost_locale-vc142-mt-gd-x64-1_74.lib" Хоть убей, не могу понять в чём дел…
                              G
                              GvozdikDec. 19, 2023, 8:01 a.m.
                              Qt/C++ - Lesson 056. Connecting the Boost library in Qt for MinGW and MSVC compilers Для решения твой проблемы добавь в файл .pro строчку "LIBS += -lws2_32" она решит проблему , лично мне помогло.
                              Now discuss on the forum
                              AC
                              Alexandru CodreanuJan. 19, 2024, 10:57 p.m.
                              QML Обнулить значения SpinBox Доброго времени суток, не могу разобраться с обнулением значение SpinBox находящего в делегате. import QtQuickimport QtQuick.ControlsWindow { width: 640 height: 480 visible: tr…
                              BlinCT
                              BlinCTDec. 27, 2023, 7:57 p.m.
                              Растягивать Image на парент по высоте Ну и само собою дял включения scrollbar надо чтобы был Flickable. Так что выходит как то так Flickable{ id: root anchors.fill: parent clip: true property url linkFile p…
                              Дмитрий
                              ДмитрийJan. 10, 2024, 3:18 p.m.
                              Qt Creator загружает всю оперативную память Проблема решена. Удалось разобраться с помощью утилиты strace. Запустил ее: strace ./qtcreator Начал выводиться весь лог работы креатора. В один момент он начал считывать фай…
                              Evgenii Legotckoi
                              Evgenii LegotckoiDec. 12, 2023, 5:48 p.m.
                              Побуквенное сравнение двух строк Добрый день. Там случайно не высылается этот сигнал textChanged ещё и при форматировани текста? Если решиать в лоб, то можно просто отключать сигнал/слотовое соединение внутри слота и …

                              Follow us in social networks