Михаиллл
Михаиллл22 жовтня 2018 р. 08:30

Чтение текста и добавление в массив

массив, текст

Здравствуйте.

Хочу сделать чтение доковских файлов разного размера и записывание их куда либо, скорее всего в массив и в файл.

Скажите пожалуйста, как правильно записать такой текстовый массив?


Рекомендуємо хостинг TIMEWEB
Рекомендуємо хостинг TIMEWEB
Стабільний хостинг, на якому розміщується соціальна мережа EVILEG. Для проектів на Django радимо VDS хостинг.

Вам це подобається? Поділіться в соціальних мережах!

14
Александр Панюшкин
  • 22 жовтня 2018 р. 08:34

Мне кажется, что вопрос не совсем корректно поставлен. Вордовские файлы - это не только текст.

Можно о задаче подробнее? Что за файлы будут?



    Михаиллл
    • 22 жовтня 2018 р. 08:52

    Текстовый файлы - это резюме. Планирую сделать их чтение, хранение, чтение из массива и поиск.


      Evgenii Legotckoi
      • 22 жовтня 2018 р. 08:59

      резюме подразумевает наличие вёрстки и т.д.?

      Как бы целые огранизации разработчиков, типо разработчиков LibreOffice и OpenOffice, с немаленькими бюджетами и штатами специалистов, а также большим комьюнити вольных разработчиков, которые пытаются помогать развитию этих проектов, до сих пор не смогли сделать 100 процентную поддержку импорта доковских документов, а вы хотите это сделать в одиночку?

      Мне кажется, что вы не осознаёте масштаб проблемы )))

      Что именно хотите читать оттуда? Вся информация содержится в блоках вёрстки с кучей служебной информации, которую просто так не выдрать с документов типа *.doc, *.docx

        Александр Панюшкин
        • 22 жовтня 2018 р. 09:02
        • (відредаговано)

        Я бы начал изучать эту тему с вот этой ссылки - https://wiki.qt.io/Handling_Microsoft_Word_file_format

        Тут совсем не много текста, но очень много информации.

        Но я бы не взялся за такую работу - она, на мой взгляд, не реализуема. Резюме не стандартизованы, не говоря уже об оформлениях и прочем.

        Дешевле посадить девочку, которая это будет копипастить.




          Вот и я о том же )) овчинка выделки не стоит. Проще написать паука, который скачает все открытые резюме на хедхантере, или каком-нибудь ином ресурсе.

            Михаиллл
            • 22 жовтня 2018 р. 12:42

            Спасибо за ссылку.

            Мне нужна довольно простенькая  программка, поэтому справлюсь сам.

            Для меня пока стоит вопрос с чтением.

            Можно ли с помощью ActiveX записывать в QAxContainer и потом как то сохранять и читать этот контейнер?





              Михаиллл
              • 23 жовтня 2018 р. 09:35

              Попробовал добавить

              QT       += core gui qaxcontainer

              Выдает ошибку неизвестного модуля.

              Скажите пожалуйста, у меня не полная версия QT или нужно скачивать какую-то библиотеку?

                Evgenii Legotckoi
                • 23 жовтня 2018 р. 14:27

                В той ссылке на документацию, что вы привели, написано иначе


                CONFIG += qaxcontainer
                  Михаиллл
                  • 24 жовтня 2018 р. 07:03

                  Спасибо. Не заметил. Как оказалось правильно теперь писать так.

                  QT       += core gui axcontainer
                  

                  Но когда пишу так

                   QAxObject   axObject("Word.Application");

                  выдает ошибку

                  D:\QTProject\ReaderResume\main.cpp:9: ошибка: 'QAxObject' was not declared in this scope

                  QAxObject   *documents = axObject.querySubObject("Documents");

                  Не знаете, как правильно прочитать доковский файл используя это?

                    Михаиллл
                    • 25 жовтня 2018 р. 08:28

                    Вот так оказывается можно читать doc  и  docx

                    QAxObject   wordApplication("Word.Application");
                        QAxObject *documents = wordApplication.querySubObject("Documents");
                        QAxObject *document = documents->querySubObject("Open(const QString&, bool)", "C:\\ForResume\\2.docx", true);
                        QAxObject *words = document->querySubObject("Words");
                        QString textResult;
                        int countWord = words->dynamicCall("Count()").toInt();
                        for (int a = 1; a <= countWord; a++){
                        textResult.append(words->querySubObject("Item(int)", a)->dynamicCall("Text()").toString());
                        }
                        qDebug()<<textResult;
                      Evgenii Legotckoi
                      • 25 жовтня 2018 р. 08:38

                      Вы - Молодец!

                      Там получается сплошной текст?

                        Михаиллл
                        • 25 жовтня 2018 р. 08:52

                        Нет, с пробелами и закодированными спец символами..

                        Забыл добавить строчку на закрытие файла

                        document->dynamicCall("Close (boolean)", false);

                        И еще беда, если в тексте картинка есть, то появляется всплывающие окно и нужно нажимать ок, не знаю как убрать...



                          Evgenii Legotckoi
                          • 25 жовтня 2018 р. 17:18

                          К сожалению, тут придётся документацию на ActiveX зачитывать до дыр, как мне кажется (((((

                            Михаиллл
                            • 29 жовтня 2018 р. 08:37
                            • (відредаговано)

                            Еще оказалось, что для адекватной работы нужно делать замену слэшей при запросе имени, иначе не работает

                            void MainWindow::on_AddResumeButton_clicked()  //Function and button Add resume
                            {
                                QString setOpenResumeName=(QFileDialog::getOpenFileName(0, "Открыть резюме в формате ворд", "", "*.doc *.docx *.rtf"));//путь , вариант расширения "*.cpp *.h"    
                            qDebug()<<setOpenResumeName;
                                setOpenResumeName.replace(QRegExp("[/]"), "\\"); //замена символов   
                            qDebug()<<setOpenResumeName;
                                QAxObject   wordApplication("Word.Application");
                                QAxObject *documents = wordApplication.querySubObject("Documents");
                                QAxObject *document = documents->querySubObject("Open(const QString&, bool)", setOpenResumeName, true);
                                QAxObject *words = document->querySubObject("Words");
                                QString TextResume;
                                int countWord = words->dynamicCall("Count()").toInt();
                                for (int a = 1; a <= countWord; a++){
                                    TextResume.append(words->querySubObject("Item(int)", a)->dynamicCall("Text()").toString());
                                }
                                document->dynamicCall("Close (boolean)", false);
                                TextResume.replace(QRegExp("[\r]"), "\r\n"); //замена символов
                                qDebug()<<TextResume;
                            }

                              Коментарі

                              Only authorized users can post comments.
                              Please, Log in or Sign up
                              sf

                              C++ - Тест 004. Указатели, Массивы и Циклы

                              • Результат:90бали,
                              • Рейтинг балів8
                              МВ

                              Qt - Тест 001. Сигналы и слоты

                              • Результат:68бали,
                              • Рейтинг балів-1
                              ЛС

                              C++ - Тест 001. Первая программа и типы данных

                              • Результат:53бали,
                              • Рейтинг балів-4
                              Останні коментарі
                              A
                              ALO1ZE19 жовтня 2024 р. 05:19
                              Читалка файлів fb3 на Qt Creator Подскажите как это запустить? Я не шарю в программировании и кодинге. Скачал и установаил Qt, но куча ошибок выдается и не запустить. А очень надо fb3 переконвертировать в html
                              ИМ
                              Игорь Максимов05 жовтня 2024 р. 04:51
                              Django - Урок 064. Як написати розширення для Python Markdown Приветствую Евгений! У меня вопрос. Можно ли вставлять свои классы в разметку редактора markdown? Допустим имея стандартную разметку: <ul> <li></li> <li></l…
                              d
                              dblas505 липня 2024 р. 08:02
                              QML - Урок 016. База даних SQLite та робота з нею в QML Qt Здравствуйте, возникает такая проблема (я новичок): ApplicationWindow неизвестный элемент. (М300) для TextField и Button аналогично. Могу предположить, что из-за более новой верси…
                              k
                              kmssr08 лютого 2024 р. 15:43
                              Qt Linux - Урок 001. Автозапуск програми Qt під Linux как сделать автозапуск для флэтпака, который не даёт создавать файлы в ~/.config - вот это вопрос ))
                              АК
                              Анатолий Кононенко04 лютого 2024 р. 22:50
                              Qt WinAPI - Урок 007. Робота з ICMP Ping в Qt Без строки #include <QRegularExpressionValidator> в заголовочном файле не работает валидатор.
                              Тепер обговоріть на форумі
                              J
                              JacobFib17 жовтня 2024 р. 00:27
                              добавить qlineseries в функции Пользователь может получить любые разъяснения по интересующим вопросам, касающимся обработки его персональных данных, обратившись к Оператору с помощью электронной почты https://topdecorpro.ru…
                              ИМ
                              Игорь Максимов03 жовтня 2024 р. 01:05
                              Реализация навигации по разделам Спасибо Евгений!
                              JW
                              Jhon Wick01 жовтня 2024 р. 12:52
                              Indian Food Restaurant In Columbus OH| Layla’s Kitchen Indian Restaurant If you're looking for a truly authentic https://www.laylaskitchenrestaurantohio.com/ , Layla’s Kitchen Indian Restaurant is your go-to destination. Located at 6152 Cleveland Ave, Colu…
                              КГ
                              Кирилл Гусарев27 вересня 2024 р. 06:09
                              Не запускается программа на Qt: точка входа в процедуру не найдена в библиотеке DLL Написал программу на C++ Qt в Qt Creator, сбилдил Release с помощью MinGW 64-bit, бинарнику напихал dll-ки с помощью windeployqt.exe. При попытке запуска моей сбилженной программы выдаёт три оши…
                              F
                              Fynjy22 липня 2024 р. 01:15
                              при создании qml проекта Kits есть но недоступны для выбора Поставил Qt Creator 11.0.2. Qt 6.4.3 При создании проекта Qml не могу выбрать Kits, они все недоступны, хотя настроены и при создании обычного Qt Widget приложения их можно выбрать. В чем может …

                              Слідкуйте за нами в соціальних мережах