МихаилллҚаз. 22, 2018, 8:30 Т.Ж.
Чтение текста и добавление в массив
Здравствуйте.
Хочу сделать чтение доковских файлов разного размера и записывание их куда либо, скорее всего в массив и в файл.
Скажите пожалуйста, как правильно записать такой текстовый массив?
Рекомендуем хостинг TIMEWEB
Стабильный хостинг, на котором располагается социальная сеть EVILEG. Для проектов на Django рекомендуем VDS хостинг.Ол саған ұнайды ма? Әлеуметтік желілерде бөлісіңіз!
Пікірлер
AD
- Akiv Doros
- Қар. 11, 2024, 11:58 Т.Ж.
C++ - Тест 004. Указатели, Массивы и Циклы
- Нәтиже:50ұпай,
- Бағалау ұпайлары-4
m
- molni99
- Қаз. 25, 2024, 10:37 Т.Қ.
C++ - Тест 004. Указатели, Массивы и Циклы
- Нәтиже:80ұпай,
- Бағалау ұпайлары4
m
- molni99
- Қаз. 25, 2024, 10:29 Т.Қ.
C++ - Тест 004. Указатели, Массивы и Циклы
- Нәтиже:20ұпай,
- Бағалау ұпайлары-10
Соңғы пікірлер
ИМ
Django - Оқулық 017. Теңшелген Django кіру беті Добрый вечер Евгений! Я сделал себе авторизацию аналогичную вашей, все работает, кроме возврата к предидущей странице. Редеректит всегда на главную, хотя в логах сервера вижу запросы на правильн…
Игорь МаксимовҚар. 22, 2024, 8:51 Т.Ж.
Evgenii LegotckoiҚаз. 31, 2024, 11:37 Т.Ж.
Qt Creator көмегімен fb3 файл оқу құралы Подскажите как это запустить? Я не шарю в программировании и кодинге. Скачал и установаил Qt, но куча ошибок выдается и не запустить. А очень надо fb3 переконвертировать в html
ИМ
Django - Сабақ 064. Python Markdown кеңейтімін қалай жазуға болады Приветствую Евгений! У меня вопрос. Можно ли вставлять свои классы в разметку редактора markdown? Допустим имея стандартную разметку: <ul> <li></li> <li></l…
Игорь МаксимовҚаз. 5, 2024, 4:51 Т.Ж.
QML - Сабақ 016. SQLite деректер қоры және онымен QML Qt-та жұмыс істеу Здравствуйте, возникает такая проблема (я новичок): ApplicationWindow неизвестный элемент. (М300) для TextField и Button аналогично. Могу предположить, что из-за более новой верси…
Енді форумда талқылаңыз
Evgenii LegotckoiМаусым 24, 2024, 12:11 Т.Қ.
t
google domain [url=https://google.com/]domain[/url] domain [http://www.example.com link title]
tonypeachey1Қар. 15, 2024, 3:04 Т.Ж.
NSProjectМаусым 4, 2022, 12:49 Т.Ж.
IscanderCheҚаз. 31, 2024, 12:43 Т.Қ.
Машина тьюринга // Начальное состояние 0 0, ,<,1 // Переход в состояние 1 при пустом символе 0,0,>,0 // Остаемся в состоянии 0, двигаясь вправо при встрече 0 0,1,>…
Мне кажется, что вопрос не совсем корректно поставлен. Вордовские файлы - это не только текст.
Можно о задаче подробнее? Что за файлы будут?
Текстовый файлы - это резюме. Планирую сделать их чтение, хранение, чтение из массива и поиск.
резюме подразумевает наличие вёрстки и т.д.?
Как бы целые огранизации разработчиков, типо разработчиков LibreOffice и OpenOffice, с немаленькими бюджетами и штатами специалистов, а также большим комьюнити вольных разработчиков, которые пытаются помогать развитию этих проектов, до сих пор не смогли сделать 100 процентную поддержку импорта доковских документов, а вы хотите это сделать в одиночку?
Мне кажется, что вы не осознаёте масштаб проблемы )))
Что именно хотите читать оттуда? Вся информация содержится в блоках вёрстки с кучей служебной информации, которую просто так не выдрать с документов типа *.doc, *.docx
Я бы начал изучать эту тему с вот этой ссылки - https://wiki.qt.io/Handling_Microsoft_Word_file_format
Тут совсем не много текста, но очень много информации.
Но я бы не взялся за такую работу - она, на мой взгляд, не реализуема. Резюме не стандартизованы, не говоря уже об оформлениях и прочем.
Дешевле посадить девочку, которая это будет копипастить.
Вот и я о том же )) овчинка выделки не стоит. Проще написать паука, который скачает все открытые резюме на хедхантере, или каком-нибудь ином ресурсе.
Спасибо за ссылку.
Мне нужна довольно простенькая программка, поэтому справлюсь сам.
Для меня пока стоит вопрос с чтением.
Можно ли с помощью ActiveX записывать в QAxContainer и потом как то сохранять и читать этот контейнер?
Попробовал добавить
Выдает ошибку неизвестного модуля.
Скажите пожалуйста, у меня не полная версия QT или нужно скачивать какую-то библиотеку?
В той ссылке на документацию, что вы привели, написано иначе
Спасибо. Не заметил. Как оказалось правильно теперь писать так.
Но когда пишу так
выдает ошибку
D:\QTProject\ReaderResume\main.cpp:9: ошибка: 'QAxObject' was not declared in this scope
QAxObject *documents = axObject.querySubObject("Documents");
Не знаете, как правильно прочитать доковский файл используя это?
Вот так оказывается можно читать doc и docx
Вы - Молодец!
Там получается сплошной текст?
Нет, с пробелами и закодированными спец символами..
Забыл добавить строчку на закрытие файла
И еще беда, если в тексте картинка есть, то появляется всплывающие окно и нужно нажимать ок, не знаю как убрать...
К сожалению, тут придётся документацию на ActiveX зачитывать до дыр, как мне кажется (((((
Еще оказалось, что для адекватной работы нужно делать замену слэшей при запросе имени, иначе не работает