Чтение текста и добавление в массив
Здравствуйте.
Хочу сделать чтение доковских файлов разного размера и записывание их куда либо, скорее всего в массив и в файл.
Скажите пожалуйста, как правильно записать такой текстовый массив?
3
252
Вам це подобається? Поділіться в соціальних мережах!
- Останні коментарі
- AK01 квітня 2025 р. 11:41Добрый день. В данный момент работаю над проектом, где необходимо выводить звук из программы в определенное аудиоустройство (колонки, наушники, виртуальный кабель и т.д). Пишу на Qt5.12.12 поско…
- VP09 березня 2025 р. 16:14Здравствуйте! Я устанавливал Qt6 из исходников а также Qt Creator по отдельности. Все компоненты, связанные с разработкой для Android, установлены. Кроме одного... Когда пытаюсь скомпилиров…
- Тепер обговоріть на форумі
- DT14 квітня 2025 р. 15:38Всем привет! На Qt 6.8 MinGW пытаюсь сделать управление подключением WiFi из программы. Пока делаю поддержку Windows, но так же хочу в дальнейшем внедрить и поддержку Linux/MacOS. Для…
- f15 лютого 2025 р. 13:46Подскажите, пожалуйста! Как данный класс можно дополнить, чтобы созданные объекты можно было перемещать мышкой по сцене?
- Не запускается компьютер (точнее работает блок , но сам монитор вообще жесть)В общем я ничего с интернета не скачивала в последнее время. На компе никаких левых пр…
- Вопрос решен. Узнать QModelIndex элемента на который мы перетаскиваем другой элемент, можно с помощью функции indexAt(event->position().toPoint()) представления QTreeViev вызываемой в переопр…
Мне кажется, что вопрос не совсем корректно поставлен. Вордовские файлы - это не только текст.
Можно о задаче подробнее? Что за файлы будут?
Текстовый файлы - это резюме. Планирую сделать их чтение, хранение, чтение из массива и поиск.
резюме подразумевает наличие вёрстки и т.д.?
Как бы целые огранизации разработчиков, типо разработчиков LibreOffice и OpenOffice, с немаленькими бюджетами и штатами специалистов, а также большим комьюнити вольных разработчиков, которые пытаются помогать развитию этих проектов, до сих пор не смогли сделать 100 процентную поддержку импорта доковских документов, а вы хотите это сделать в одиночку?
Мне кажется, что вы не осознаёте масштаб проблемы )))
Что именно хотите читать оттуда? Вся информация содержится в блоках вёрстки с кучей служебной информации, которую просто так не выдрать с документов типа *.doc, *.docx
Я бы начал изучать эту тему с вот этой ссылки - https://wiki.qt.io/Handling_Microsoft_Word_file_format
Тут совсем не много текста, но очень много информации.
Но я бы не взялся за такую работу - она, на мой взгляд, не реализуема. Резюме не стандартизованы, не говоря уже об оформлениях и прочем.
Дешевле посадить девочку, которая это будет копипастить.
Вот и я о том же )) овчинка выделки не стоит. Проще написать паука, который скачает все открытые резюме на хедхантере, или каком-нибудь ином ресурсе.
Спасибо за ссылку.
Мне нужна довольно простенькая программка, поэтому справлюсь сам.
Для меня пока стоит вопрос с чтением.
Можно ли с помощью ActiveX записывать в QAxContainer и потом как то сохранять и читать этот контейнер?
Попробовал добавить
Выдает ошибку неизвестного модуля.
Скажите пожалуйста, у меня не полная версия QT или нужно скачивать какую-то библиотеку?
В той ссылке на документацию, что вы привели, написано иначе
Спасибо. Не заметил. Как оказалось правильно теперь писать так.
Но когда пишу так
выдает ошибку
D:\QTProject\ReaderResume\main.cpp:9: ошибка: 'QAxObject' was not declared in this scope
QAxObject *documents = axObject.querySubObject("Documents");
Не знаете, как правильно прочитать доковский файл используя это?
Вот так оказывается можно читать doc и docx
Вы - Молодец!
Там получается сплошной текст?
Нет, с пробелами и закодированными спец символами..
Забыл добавить строчку на закрытие файла
И еще беда, если в тексте картинка есть, то появляется всплывающие окно и нужно нажимать ок, не знаю как убрать...
К сожалению, тут придётся документацию на ActiveX зачитывать до дыр, как мне кажется (((((
Еще оказалось, что для адекватной работы нужно делать замену слэшей при запросе имени, иначе не работает