Михаиллл
Михаиллл22 октября 2018 г. 18:30

Чтение текста и добавление в массив

массив, текст

Здравствуйте.

Хочу сделать чтение доковских файлов разного размера и записывание их куда либо, скорее всего в массив и в файл.

Скажите пожалуйста, как правильно записать такой текстовый массив?


Рекомендуем хостинг TIMEWEB
Рекомендуем хостинг TIMEWEB
Стабильный хостинг, на котором располагается социальная сеть EVILEG. Для проектов на Django рекомендуем VDS хостинг.

Вам это нравится? Поделитесь в социальных сетях!

14
Александр Панюшкин
  • 22 октября 2018 г. 18:34

Мне кажется, что вопрос не совсем корректно поставлен. Вордовские файлы - это не только текст.

Можно о задаче подробнее? Что за файлы будут?



    Михаиллл
    • 22 октября 2018 г. 18:52

    Текстовый файлы - это резюме. Планирую сделать их чтение, хранение, чтение из массива и поиск.


      Evgenii Legotckoi
      • 22 октября 2018 г. 18:59

      резюме подразумевает наличие вёрстки и т.д.?

      Как бы целые огранизации разработчиков, типо разработчиков LibreOffice и OpenOffice, с немаленькими бюджетами и штатами специалистов, а также большим комьюнити вольных разработчиков, которые пытаются помогать развитию этих проектов, до сих пор не смогли сделать 100 процентную поддержку импорта доковских документов, а вы хотите это сделать в одиночку?

      Мне кажется, что вы не осознаёте масштаб проблемы )))

      Что именно хотите читать оттуда? Вся информация содержится в блоках вёрстки с кучей служебной информации, которую просто так не выдрать с документов типа *.doc, *.docx

        Александр Панюшкин
        • 22 октября 2018 г. 19:02
        • (ред.)

        Я бы начал изучать эту тему с вот этой ссылки - https://wiki.qt.io/Handling_Microsoft_Word_file_format

        Тут совсем не много текста, но очень много информации.

        Но я бы не взялся за такую работу - она, на мой взгляд, не реализуема. Резюме не стандартизованы, не говоря уже об оформлениях и прочем.

        Дешевле посадить девочку, которая это будет копипастить.




          Evgenii Legotckoi
          • 22 октября 2018 г. 19:03

          Вот и я о том же )) овчинка выделки не стоит. Проще написать паука, который скачает все открытые резюме на хедхантере, или каком-нибудь ином ресурсе.

            Михаиллл
            • 22 октября 2018 г. 22:42

            Спасибо за ссылку.

            Мне нужна довольно простенькая  программка, поэтому справлюсь сам.

            Для меня пока стоит вопрос с чтением.

            Можно ли с помощью ActiveX записывать в QAxContainer и потом как то сохранять и читать этот контейнер?





              Михаиллл
              • 23 октября 2018 г. 19:35

              Попробовал добавить

              QT       += core gui qaxcontainer

              Выдает ошибку неизвестного модуля.

              Скажите пожалуйста, у меня не полная версия QT или нужно скачивать какую-то библиотеку?

                Evgenii Legotckoi
                • 24 октября 2018 г. 0:27

                В той ссылке на документацию, что вы привели, написано иначе


                CONFIG += qaxcontainer
                  Михаиллл
                  • 24 октября 2018 г. 17:03

                  Спасибо. Не заметил. Как оказалось правильно теперь писать так.

                  QT       += core gui axcontainer
                  

                  Но когда пишу так

                   QAxObject   axObject("Word.Application");

                  выдает ошибку

                  D:\QTProject\ReaderResume\main.cpp:9: ошибка: 'QAxObject' was not declared in this scope

                  QAxObject   *documents = axObject.querySubObject("Documents");

                  Не знаете, как правильно прочитать доковский файл используя это?

                    Михаиллл
                    • 25 октября 2018 г. 18:28

                    Вот так оказывается можно читать doc  и  docx

                    QAxObject   wordApplication("Word.Application");
                        QAxObject *documents = wordApplication.querySubObject("Documents");
                        QAxObject *document = documents->querySubObject("Open(const QString&, bool)", "C:\\ForResume\\2.docx", true);
                        QAxObject *words = document->querySubObject("Words");
                        QString textResult;
                        int countWord = words->dynamicCall("Count()").toInt();
                        for (int a = 1; a <= countWord; a++){
                        textResult.append(words->querySubObject("Item(int)", a)->dynamicCall("Text()").toString());
                        }
                        qDebug()<<textResult;
                      Evgenii Legotckoi
                      • 25 октября 2018 г. 18:38

                      Вы - Молодец!

                      Там получается сплошной текст?

                        Михаиллл
                        • 25 октября 2018 г. 18:52

                        Нет, с пробелами и закодированными спец символами..

                        Забыл добавить строчку на закрытие файла

                        document->dynamicCall("Close (boolean)", false);

                        И еще беда, если в тексте картинка есть, то появляется всплывающие окно и нужно нажимать ок, не знаю как убрать...



                          Evgenii Legotckoi
                          • 26 октября 2018 г. 3:18

                          К сожалению, тут придётся документацию на ActiveX зачитывать до дыр, как мне кажется (((((

                            Михаиллл
                            • 29 октября 2018 г. 18:37
                            • (ред.)

                            Еще оказалось, что для адекватной работы нужно делать замену слэшей при запросе имени, иначе не работает

                            void MainWindow::on_AddResumeButton_clicked()  //Function and button Add resume
                            {
                                QString setOpenResumeName=(QFileDialog::getOpenFileName(0, "Открыть резюме в формате ворд", "", "*.doc *.docx *.rtf"));//путь , вариант расширения "*.cpp *.h"    
                            qDebug()<<setOpenResumeName;
                                setOpenResumeName.replace(QRegExp("[/]"), "\\"); //замена символов   
                            qDebug()<<setOpenResumeName;
                                QAxObject   wordApplication("Word.Application");
                                QAxObject *documents = wordApplication.querySubObject("Documents");
                                QAxObject *document = documents->querySubObject("Open(const QString&, bool)", setOpenResumeName, true);
                                QAxObject *words = document->querySubObject("Words");
                                QString TextResume;
                                int countWord = words->dynamicCall("Count()").toInt();
                                for (int a = 1; a <= countWord; a++){
                                    TextResume.append(words->querySubObject("Item(int)", a)->dynamicCall("Text()").toString());
                                }
                                document->dynamicCall("Close (boolean)", false);
                                TextResume.replace(QRegExp("[\r]"), "\r\n"); //замена символов
                                qDebug()<<TextResume;
                            }

                              Комментарии

                              Только авторизованные пользователи могут публиковать комментарии.
                              Пожалуйста, авторизуйтесь или зарегистрируйтесь
                              Ua

                              Qt - Тест 001. Сигналы и слоты

                              • Результат:84баллов,
                              • Очки рейтинга4
                              Ua

                              Qt - Тест 001. Сигналы и слоты

                              • Результат:42баллов,
                              • Очки рейтинга-8
                              ОК

                              Qt - Тест 001. Сигналы и слоты

                              • Результат:47баллов,
                              • Очки рейтинга-6
                              Последние комментарии
                              ИМ
                              Игорь Максимов22 ноября 2024 г. 21:51
                              Django - Урок 017. Кастомизированная страница авторизации на Django Добрый вечер Евгений! Я сделал себе авторизацию аналогичную вашей, все работает, кроме возврата к предидущей странице. Редеректит всегда на главную, хотя в логах сервера вижу запросы на правильн…
                              Evgenii Legotckoi
                              Evgenii Legotckoi31 октября 2024 г. 23:37
                              Django - Урок 064. Как написать расширение для Python Markdown Добрый день. Да, можно. Либо через такие же плагины, либо с постобработкой через python библиотеку Beautiful Soup
                              A
                              ALO1ZE19 октября 2024 г. 17:19
                              Читалка fb3-файлов на Qt Creator Подскажите как это запустить? Я не шарю в программировании и кодинге. Скачал и установаил Qt, но куча ошибок выдается и не запустить. А очень надо fb3 переконвертировать в html
                              ИМ
                              Игорь Максимов5 октября 2024 г. 16:51
                              Django - Урок 064. Как написать расширение для Python Markdown Приветствую Евгений! У меня вопрос. Можно ли вставлять свои классы в разметку редактора markdown? Допустим имея стандартную разметку: <ul> <li></li> <li></l…
                              d
                              dblas55 июля 2024 г. 20:02
                              QML - Урок 016. База данных SQLite и работа с ней в QML Qt Здравствуйте, возникает такая проблема (я новичок): ApplicationWindow неизвестный элемент. (М300) для TextField и Button аналогично. Могу предположить, что из-за более новой верси…
                              Сейчас обсуждают на форуме
                              f
                              firstlunoxod15 февраля 2025 г. 13:46
                              Рисование на QGraphicsScene при зажатой кнопке мыши Подскажите, пожалуйста! Как данный класс можно дополнить, чтобы созданные объекты можно было перемещать мышкой по сцене?
                              Дмитрий
                              Дмитрий3 февраля 2025 г. 16:24
                              Создание deb-пакета. Как создать ярлык на рабочем столе после установки собственного deb-пакета? Всем привет. Сделал свой deb-пакет с программой. Всё устанавливается и работает. Ставлю по пути /usr/bin/my_application. Как для пользователя при установке пакета сразу создать ярлык на раб…
                              NW
                              Nayo Wai30 января 2025 г. 19:22
                              не запускается компьютер!!! Не запускается компьютер (точнее работает блок , но сам монитор вообще жесть)В общем я ничего с интернета не скачивала в последнее время. На компе никаких левых пр…
                              n
                              nkly3 января 2025 г. 12:52
                              Нужно запретить перемещение только некоторых итемов, остальные перемещать можно. Вопрос решен. Узнать QModelIndex элемента на который мы перетаскиваем другой элемент, можно с помощью функции indexAt(event->position().toPoint()) представления QTreeViev вызываемой в переопр…
                              M
                              Marsel17 августа 2023 г. 0:26
                              OAuth2.0 через VK, получение email Спасибо большое за помощь и простите за то что отнял время своей невнимательностью.

                              Следите за нами в социальных сетях