Михаиллл22 жовтня 2018 р. 08:30
Чтение текста и добавление в массив
Здравствуйте.
Хочу сделать чтение доковских файлов разного размера и записывание их куда либо, скорее всего в массив и в файл.
Скажите пожалуйста, как правильно записать такой текстовый массив?
Рекомендуємо хостинг TIMEWEB
Стабільний хостинг, на якому розміщується соціальна мережа EVILEG. Для проектів на Django радимо VDS хостинг.Вам це подобається? Поділіться в соціальних мережах!
AD
- Akiv Doros
- 12 листопада 2024 р. 01:58
C++ - Тест 004. Указатели, Массивы и Циклы
- Результат:50бали,
- Рейтинг балів-4
m
- molni99
- 26 жовтня 2024 р. 11:37
C++ - Тест 004. Указатели, Массивы и Циклы
- Результат:80бали,
- Рейтинг балів4
m
- molni99
- 26 жовтня 2024 р. 11:29
C++ - Тест 004. Указатели, Массивы и Циклы
- Результат:20бали,
- Рейтинг балів-10
Останні коментарі
ИМ
Django - Підручник 017. Налаштуйте сторінку входу до Django Добрый вечер Евгений! Я сделал себе авторизацию аналогичную вашей, все работает, кроме возврата к предидущей странице. Редеректит всегда на главную, хотя в логах сервера вижу запросы на правильн…
Игорь Максимов22 листопада 2024 р. 22:51
Evgenii Legotckoi01 листопада 2024 р. 00:37
Читалка файлів fb3 на Qt Creator Подскажите как это запустить? Я не шарю в программировании и кодинге. Скачал и установаил Qt, но куча ошибок выдается и не запустить. А очень надо fb3 переконвертировать в html
ИМ
Django - Урок 064. Як написати розширення для Python Markdown Приветствую Евгений! У меня вопрос. Можно ли вставлять свои классы в разметку редактора markdown? Допустим имея стандартную разметку: <ul> <li></li> <li></l…
Игорь Максимов05 жовтня 2024 р. 17:51
QML - Урок 016. База даних SQLite та робота з нею в QML Qt Здравствуйте, возникает такая проблема (я новичок): ApplicationWindow неизвестный элемент. (М300) для TextField и Button аналогично. Могу предположить, что из-за более новой верси…
Тепер обговоріть на форумі
Evgenii Legotckoi25 червня 2024 р. 01:11
t
google domain [url=https://google.com/]domain[/url] domain [http://www.example.com link title]
tonypeachey115 листопада 2024 р. 17:04
NSProject04 червня 2022 р. 13:49
IscanderChe01 листопада 2024 р. 01:43
Машина тьюринга // Начальное состояние 0 0, ,<,1 // Переход в состояние 1 при пустом символе 0,0,>,0 // Остаемся в состоянии 0, двигаясь вправо при встрече 0 0,1,>…
Мне кажется, что вопрос не совсем корректно поставлен. Вордовские файлы - это не только текст.
Можно о задаче подробнее? Что за файлы будут?
Текстовый файлы - это резюме. Планирую сделать их чтение, хранение, чтение из массива и поиск.
резюме подразумевает наличие вёрстки и т.д.?
Как бы целые огранизации разработчиков, типо разработчиков LibreOffice и OpenOffice, с немаленькими бюджетами и штатами специалистов, а также большим комьюнити вольных разработчиков, которые пытаются помогать развитию этих проектов, до сих пор не смогли сделать 100 процентную поддержку импорта доковских документов, а вы хотите это сделать в одиночку?
Мне кажется, что вы не осознаёте масштаб проблемы )))
Что именно хотите читать оттуда? Вся информация содержится в блоках вёрстки с кучей служебной информации, которую просто так не выдрать с документов типа *.doc, *.docx
Я бы начал изучать эту тему с вот этой ссылки - https://wiki.qt.io/Handling_Microsoft_Word_file_format
Тут совсем не много текста, но очень много информации.
Но я бы не взялся за такую работу - она, на мой взгляд, не реализуема. Резюме не стандартизованы, не говоря уже об оформлениях и прочем.
Дешевле посадить девочку, которая это будет копипастить.
Вот и я о том же )) овчинка выделки не стоит. Проще написать паука, который скачает все открытые резюме на хедхантере, или каком-нибудь ином ресурсе.
Спасибо за ссылку.
Мне нужна довольно простенькая программка, поэтому справлюсь сам.
Для меня пока стоит вопрос с чтением.
Можно ли с помощью ActiveX записывать в QAxContainer и потом как то сохранять и читать этот контейнер?
Попробовал добавить
Выдает ошибку неизвестного модуля.
Скажите пожалуйста, у меня не полная версия QT или нужно скачивать какую-то библиотеку?
В той ссылке на документацию, что вы привели, написано иначе
Спасибо. Не заметил. Как оказалось правильно теперь писать так.
Но когда пишу так
выдает ошибку
D:\QTProject\ReaderResume\main.cpp:9: ошибка: 'QAxObject' was not declared in this scope
QAxObject *documents = axObject.querySubObject("Documents");
Не знаете, как правильно прочитать доковский файл используя это?
Вот так оказывается можно читать doc и docx
Вы - Молодец!
Там получается сплошной текст?
Нет, с пробелами и закодированными спец символами..
Забыл добавить строчку на закрытие файла
И еще беда, если в тексте картинка есть, то появляется всплывающие окно и нужно нажимать ок, не знаю как убрать...
К сожалению, тут придётся документацию на ActiveX зачитывать до дыр, как мне кажется (((((
Еще оказалось, что для адекватной работы нужно делать замену слэшей при запросе имени, иначе не работает