Intruder
Intruder4 октября 2019 г. 7:36

XML парсинг сложного тега <tag1> text part 1 <tag2> text </tag2> text part 2 </tag1>

Всем доброго времени суток.
Например есть вот такой тег:

<tag1> any text part 1 <tag2> text </tag2> any text part 2 </tag1>

Как реализовать корректное чтение и запись такой конструкции в объектную модель и модель QDom? С таким тегом сталкиваюсь впервые, поэтому не совсем понятно как действовать в такой ситуации.

Всем спасибо за помощь в решении даннго о вопроса.

Рекомендуем хостинг TIMEWEB
Рекомендуем хостинг TIMEWEB
Стабильный хостинг, на котором располагается социальная сеть EVILEG. Для проектов на Django рекомендуем VDS хостинг.

Вам это нравится? Поделитесь в социальных сетях!

7
Intruder
  • 4 октября 2019 г. 7:52
  • (ред.)

Я там описался, закрывающий последний тег - это

</tag1>
    Evgenii Legotckoi
    • 4 октября 2019 г. 8:47

    Добрый день.
    А какой хотите получить итоговый результат? В том же QDomNode есть метод QDomNode::childNodes(), который возвратит список все вложенных тегов.

    То есть как раз для подобных случаев

    <body>
    <h1>Heading</h1>
    <p>Hello <b>you</b></p>
    </body>
    
      Intruder
      • 4 октября 2019 г. 10:18

      Евгений, задача у меня следующая:
      1. Есть файл XML.
      2. Есть объектная модель, которая соответствует файлу XML.
      Мне нужно прорпарсить xml файл и записать значения в объектную модель.
      Я написал следующий код, примерный:

      #include <iostream>
      #include <QtXml/QDomDocument>
      #include <QFile>
      #include <QTextStream>
      
      int main()
      {
          QDomDocument doc;
          doc.appendChild(doc.createProcessingInstruction("xml", "version=\"1.0\" encoding=\"UTF-8\""));
          QDomElement element = doc.createElement("element");
          element.appendChild(doc.createTextNode("TEXT 1"));
          QDomElement element1 = doc.createElement("element1");
          element1.appendChild(doc.createTextNode("text1"));
          element.appendChild(element1);
          element.appendChild(doc.createTextNode("TEXT 2"));
          doc.appendChild(element);
          QFile file("C:/TEMP/test.xml");
          if(file.open(QIODevice::WriteOnly)){
              QTextStream out(&file);
              out.setCodec("UTF-8");
              out << doc.toString();
              file.close();
          }
          std::cout << "start import" << std::endl;
      
          QDomDocument doc1;
      
          if(!file.open(QIODevice::ReadOnly | QIODevice::Text))
          {
              std::cout << "File not exist";
              return -1;
          }
          if(!doc1.setContent(&file)){
              file.close();
              return -1;
          }
          file.close();
              QDomNode node = doc1.firstChild();
                  while (!node.isNull()) {
                      QDomElement el1 = node.toElement();
                      std::cout << el1.tagName().toStdString() + el1.text().toStdString();
                      if(el1.hasChildNodes()){
                          QDomNode node1 = el1.firstChild();
                          while (!node1.isNull()) {
                              QDomElement el2 = node1.toElement();
                              std::cout << el2.tagName().toStdString() + " " + el2.text().toStdString() << std::endl;
                              node1 = node1.nextSibling();
                          }
                      }
                      node = node.nextSibling();
                  }
          return 0;
      }
      

      Так вот после создания файла XML получаю вот такое содержимое файла:

      <?xml version="1.0" encoding="UTF-8"?>
      <element>TEXT 1<element1>text1</element1>TEXT 2</element>
      


      И у меня вопрос, как это записать в объектную модель. И не только записать, но и при обратном парсинге получить такой же файл, т.е. чтобы теги и значения стояли в тех же местах. На просторах Интернета рассматриваются исключительно тривиальные задачи и нет ничего походего на мой случай.

        Evgenii Legotckoi
        • 6 октября 2019 г. 13:41

        Думаю, что вам также нужно какое-то дерево. Например, какой-нибудь TreeItem, который будет отражать одну ноду, и все child TreeItem будут сохраняться в в вектор, чтобы сохранять порядок элементов в теге.

        Что-нибудь вроде такого

        class TreeItem
        {
        public:
            TreeItem(TreeItem* parent = nullptr)
            {
                if (parent)
                {
                    parent->addChild(this);
                }
            }
        
            void addChild(TreeItem* child)
            {
                m_children.push_back(child);
            }
        
        private:
            TreeItem* m_parent;
            std::vector<TreeItem*> m_children;
        }
        

        QDomDocument - это тоже дерево. Поэтому при прохождении тегов можно составить своё собственное дерево. Но нужно понимать конечную цель.

          Intruder
          • 6 октября 2019 г. 15:18

          Евгений, я думаю, что тут нужно будет разбирать строку. Дерево из QDomElement я построить могу - это не является какой-то сложной задачей. Задача не тривиальная потому, что если текст разбит на части внутри одного тега и эти части могут быть обернуты в дргуие теги, то, если взять значение головного тега, то он вернет строку целиком, т.е. захватит и текст других тегов. Вот в чем задача. Как разобрать строку и вернуть ее обратно именно в той последовательности, которая присутвует в файле. Есть наметки, но нужно проверить.

            Intruder
            • 9 октября 2019 г. 6:52

            Евгений, а можно тогда уточнить вот такой момент. Были ли у вас случаи плана Мама мыла раму ? У меня собственно вопрос именно в этом, как взять и положить текст так в объект класса, чтобы потом модно было посторить обратно вышеописанную последовательность тегов?

              Evgenii Legotckoi
              • 9 октября 2019 г. 15:45

              Добрый день.

              Нет, я таким не сталкивался, но вот таким образом вы можете разбить тот тег, на ноды, и забрать текст в нормально порядке, а потом вам уже не составит труда, как я думаю, записать всё обратно.

              #include <iostream>
              #include <QtXml/QDomDocument>
              #include <QFile>
              #include <QTextStream>
              #include <QDebug>
              
              int main()
              {
                  QDomDocument doc;
                  doc.appendChild(doc.createProcessingInstruction("xml", "version=\"1.0\" encoding=\"UTF-8\""));
                  QDomElement element = doc.createElement("element");
                  element.appendChild(doc.createTextNode("TEXT 1"));
                  QDomElement element1 = doc.createElement("element1");
                  element1.appendChild(doc.createTextNode("text1"));
                  element.appendChild(element1);
                  element.appendChild(doc.createTextNode("TEXT 2"));
                  doc.appendChild(element);
                  QFile file("/home/dekadent/test.xml");
                  if(file.open(QIODevice::WriteOnly)){
                      QTextStream out(&file);
                      out.setCodec("UTF-8");
                      out << doc.toString();
                      file.close();
                  }
                  std::cout << "start import" << std::endl;
              
                  QDomDocument doc1;
              
                  if(!file.open(QIODevice::ReadOnly | QIODevice::Text))
                  {
                      std::cout << "File not exist";
                      return -1;
                  }
                  if(!doc1.setContent(&file)){
                      file.close();
                      return -1;
                  }
              
                  file.close();
                  QDomNode node = doc1.firstChild();
              
                  while (!node.isNull()) {
                      QDomElement el1 = node.toElement();
                      std::cout << el1.tagName().toStdString() << " " << el1.text().toStdString() << std::endl;
                      if(el1.hasChildNodes()){
                          std::cout << "size of child nodes " << el1.childNodes().size() << std::endl;
                          for (int i = 0; i < el1.childNodes().size(); ++i)
                          {
                              std::cout << i << std::endl;
                              QDomNode node2 = el1.childNodes().item(i);
                              if (node2.isText())
                              {
                                  // Это текстовая нода, нужна иная обработка.
                                  std::cout << node2.toText().data().toStdString();
                              }
                              QDomElement el2 =  node2.toElement();
                              std::cout << el2.tagName().toStdString() << " " << el2.text().toStdString() << std::endl;
                          }
                      }
                      node = node.nextSibling();
                  }
                  return 0;
              }
              
              

              Весь прикол в том, что метод nextSibling() , который вы использовали, не работает на текстовые ноды, то есть на QDomText. Я сам об этом не знал. Сейчас только попробовал, поэкспериментировал и догадался, как это дело работает.

                Комментарии

                Только авторизованные пользователи могут публиковать комментарии.
                Пожалуйста, авторизуйтесь или зарегистрируйтесь
                AD

                C++ - Тест 004. Указатели, Массивы и Циклы

                • Результат:50баллов,
                • Очки рейтинга-4
                m
                • molni99
                • 26 октября 2024 г. 11:37

                C++ - Тест 004. Указатели, Массивы и Циклы

                • Результат:80баллов,
                • Очки рейтинга4
                m
                • molni99
                • 26 октября 2024 г. 11:29

                C++ - Тест 004. Указатели, Массивы и Циклы

                • Результат:20баллов,
                • Очки рейтинга-10
                Последние комментарии
                i
                innorwall15 ноября 2024 г. 8:26
                Qt/C++ - Урок 031. QCustomPlot - строим график по времени buy generic priligy We can just chat, and we will not lose too much time anyway
                i
                innorwall15 ноября 2024 г. 6:03
                Qt/C++ - Урок 060. Настройка внешнего вида приложения в рантайме I didnt have an issue work colors priligy dapoxetine 60mg revia cost uk August 3, 2022 Reply
                i
                innorwall14 ноября 2024 г. 22:42
                Как Копировать Файлы в Linux If only females relatives with DZ offspring were considered these percentages were 23 order priligy online uk
                i
                innorwall14 ноября 2024 г. 20:09
                Qt/C++ - Урок 068. Hello World с использованием системы сборки CMAKE в CLion ditropan pristiq dosing With the Yankees leading, 4 3, Rivera jogged in from the bullpen to a standing ovation as he prepared for his final appearance in Chicago buy priligy pakistan
                Сейчас обсуждают на форуме
                i
                innorwall14 ноября 2024 г. 14:39
                добавить qlineseries в функции priligy amazon canada 93 GREB1 protein GREB1 AB011147 6
                i
                innorwall11 ноября 2024 г. 21:55
                Всё ещё разбираюсь с кешем. priligy walgreens levitra dulcolax carbs The third ring was found to be made up of ultra relativistic electrons, which are also present in both the outer and inner rings
                9
                9Anonim25 октября 2024 г. 19:10
                Машина тьюринга // Начальное состояние 0 0, ,<,1 // Переход в состояние 1 при пустом символе 0,0,>,0 // Остаемся в состоянии 0, двигаясь вправо при встрече 0 0,1,>…
                ИМ
                Игорь Максимов3 октября 2024 г. 14:05
                Реализация навигации по разделам Спасибо Евгений!

                Следите за нами в социальных сетях