E
EdiJan. 23, 2020, 6:11 a.m.

QWebPage получить html

QWebPage, QtWebEngineWidgets, QWebEnginePage::toHtml(), QWebEnginePage, QWebEngin, webenginewidgets, QWebPage получить html

Здравствуйте, пытаюсь получить html код страницы, но не появляется ни чего в указанной дирректории, что у меня не правильно? Надо получить вэб страницу не из виджета, а с помощью кода, ее отображение в саймой программе не требуется. Помогите плиз.
QWebEngineProfile m_profile = new QWebEngineProfile;
m_profile->setDownloadPath("my path");
QWebEnginePage
page = new QWebEnginePage(m_profile);
QUrl url("https://domenName");
page->load(url);
page->save("my path", QWebEngineDownloadItem::CompleteHtmlSaveFormat);

We recommend hosting TIMEWEB
We recommend hosting TIMEWEB
Stable hosting, on which the social network EVILEG is located. For projects on Django we recommend VDS hosting.

Do you like it? Share on social networks!

8
E
  • Jan. 23, 2020, 8:24 a.m.
  • (edited)
  • The answer was marked as a solution.

Уже дошло) Оставлю здесь код для следующего поколения новичков) Вместо toHtml() можно вставить toPlainText и получить текст web страницы

QWebEngineProfile *m_profile = new QWebEngineProfile;
m_profile->setDownloadPath("my dir");
QWebEnginePage *page = new QWebEnginePage(m_profile);

page->settings()->setAttribute(QWebEngineSettings::AutoLoadImages, false);
page->settings()->setAttribute(QWebEngineSettings::JavascriptEnabled, true);

QEventLoop *event = new QEventLoop;
connect(page, &QWebEnginePage::loadFinished, event, &QEventLoop::quit);

page->load(QUrl("my url"));

event->exec();

page->toPlainText([this](const QString &result){
   qDebug()<<"html:";
   qDebug()<<result.size();
   ui->textBrowser->append(result);
   });
    Evgenii Legotckoi
    • Jan. 23, 2020, 8:35 a.m.

    Добрый день. Ещё можно использовать просто QNetworkAccessManager, а то использование QWebEngine для получения html текста страницы с сайта может быть просто стрельбой из пушки по воробьям.

    В этой статье есть пример получения JSON файла , но для обычной страницы разницы особой нет.

      E
      • Jan. 23, 2020, 9:08 a.m.

      Нужно получить страницу, на кт после выполнения java скрипта открывается дополнительный контент. С помощью QNetworkRequest можно получить только страницу, а доп. контент нельзя. Сейчас пытаюсь это сделать с помощью QWebEnginePage::runJavaScript(). Правильная же концепция? Вот код:

      QEventLoop *event = new QEventLoop;
      connect(page, &QWebEnginePage::loadFinished, event, &QEventLoop::quit);
      
      page->load(QUrl("my url"));
      
      event->exec();
      
      page->runJavaScript("document.getElementsByTagName(\"script\")[i]");
      
        Evgenii Legotckoi
        • Jan. 23, 2020, 9:33 a.m.
        • (edited)

        Тогда согласен.

        Да, концепция правильная. Нужно только поизвращаться с сигналами и слотами. Там всё это асинхронно работает и поэтому достаточно по дурацки.

        У меня была подобная задача. Добавлял WebView в диалог и уже в диалоге всё обрабатывал.

        Принцип следующий.

        В конструкторе диалога добавляем следующее

        m_webView = new QWebEngineView(this);
        ui->centralWidgetLayout->addWidget(m_webView);
        connect(m_webView, &QWebEngineView::loadFinished, this, &Dialog::onLoadFinished);
        connect(this, &Dialog::getHtml, this, &Dialog::handleHTML);
        

        Далее пишем слот onLoadFinished, который выплёвывает сигнал getHtml

        void Dialog::onLoadFinished()
        {
            m_webView->page()->toHtml([this](const QString& result) mutable { emit getHtml(result); });
        }
        

        И потом уже в handleHTML делаем обработку.

        void WizardMapWebDialog::handleHTML(QString html)
        {
            // ToDo something with html
        }
        

        Заголовочник будет следующий

        class Dialog : public QDialog
        {
            Q_OBJECT
        public:
            explicit Dialog(QWidget* parent = nullptr);
        
            virtual ~Dialog() override;
        
        signals:
            void getHtml(QString html);
        
        private slots:
            void onLoadFinished();
            void handleHTML(QString html);
        
        private:
            Ui::Dialog* ui;
            QWebEngineView* m_webView;
        };
        

        JavaScript можно вызвать с применением callback функции, чтобы ещё и результат сразу полчить из функции

            m_webView->page()->runJavaScript("checkMap()", [this](const QVariant& v)
            {
                if (v.toString() == "true")
                {
                    m_webView->page()->runJavaScript("takeValues();");
                }
                else
                {
                    gui::DMessageBox::showError(this, tr("The mark point is outside the map.<br>Please select a location on the map"));
                }
            });
        

        В примере с запуском JavaScript вызывались функции, которые уже есть на странице сайта, так что если там подключена jQuery, то думаю, что сможете её функционал использовать.

        Другого способа, как получать перезагруженный контент через JavaScript на странице, я не знаю. Любые другие способы у меня не работали. Только таким образом сработало.

          E
          • Jan. 23, 2020, 1:02 p.m.
          • (edited)

          Спасибо) А можно получить скрипты сайта таким образом?

              QWebEngineProfile *m_profile = new QWebEngineProfile;
              QWebEnginePage *page = new QWebEnginePage(m_profile);
              QList<QWebEngineScript> lsc;
              qDebug() << page->scripts().toList().isEmpty();
              lsc = page->scripts().toList();
              qDebug() << lsc;
          

          Что делать с проблемой, когда скрипты сайта подгружаются по http и Qt ругается так:

          js: Mixed Content: The page at was loaded over HTTPS, but requested an insecure script . This request has been blocked; the content must be served over HTTPS.
          js: Mixed Content: The page at was loaded over a secure connection, but contains a form that targets an insecure endpoint . This endpoint should be made available over a secure connection.

          Я пытался получить html по http и в профайле прописал: -no-openssl, но не помогло.

            Evgenii Legotckoi
            • Jan. 24, 2020, 2:37 a.m.

            Не уверен. я бы попробовал выдернуть ссылки и забрать всё через QNetworkAccessManager, если вам не нужно запускать эти скрипты.
            Я с той ошибкой не сталкивался.

              E
              • Jan. 25, 2020, 3 p.m.

              Нашел фикс той ошибки:
              ui->vebEngineView->settings()->setAttribute(QWebEngineSettings::AllowRunningInsecureContent, true);

                E
                • Jan. 26, 2020, 11:42 a.m.

                Другого способа, как получать перезагруженный контент через JavaScript на странице, я не знаю.

                Получилось сделать без QWebEngineView, с помощью QWebEnginePage, runJavaScript работает ассинхронно и надо дождаться пока скрипт выполнится, я установил таймер. В итоге в textBrowser выводился html, измененный скриптом.

                QWebEnginePage *page1 = new QWebEnginePage;
                
                    page1->settings()->setAttribute(QWebEngineSettings::AutoLoadImages, false);
                    page1->settings()->setAttribute(QWebEngineSettings::JavascriptEnabled, true);
                    page1->settings()->setAttribute(QWebEngineSettings::AllowRunningInsecureContent, true);
                
                    QEventLoop *event = new QEventLoop;
                    connect(page1, &QWebEnginePage::loadFinished, event, &QEventLoop::quit);
                
                    page1->load(QUrl("https://..."));
                
                    event->exec();
                
                
                    page1->toHtml([this](const QString &result){
                       ui->textBrowser_2->append(result);
                       });
                
                    page1->runJavaScript("javascript:__doPostBack('...')");
                
                    qDebug() << "run!";
                
                    QEventLoop *event1 = new QEventLoop;
                    QTimer *timer = new QTimer();  
                    connect(timer, &QTimer::timeout, event1, &QEventLoop::quit);
                    timer->start(10000);
                    event1->exec();
                
                
                    page1->toHtml([this](const QString &result){
                       ui->textBrowser->append(result);
                       });
                

                  Comments

                  Only authorized users can post comments.
                  Please, Log in or Sign up
                  d
                  • dsfs
                  • April 26, 2024, 2:56 p.m.

                  C ++ - Test 004. Pointers, Arrays and Loops

                  • Result:80points,
                  • Rating points4
                  d
                  • dsfs
                  • April 26, 2024, 2:45 p.m.

                  C++ - Test 002. Constants

                  • Result:50points,
                  • Rating points-4
                  d
                  • dsfs
                  • April 26, 2024, 2:35 p.m.

                  C++ - Test 001. The first program and data types

                  • Result:73points,
                  • Rating points1
                  Last comments
                  k
                  kmssrFeb. 9, 2024, 5:43 a.m.
                  Qt Linux - Lesson 001. Autorun Qt application under Linux как сделать автозапуск для флэтпака, который не даёт создавать файлы в ~/.config - вот это вопрос ))
                  Qt WinAPI - Lesson 007. Working with ICMP Ping in Qt Без строки #include <QRegularExpressionValidator> в заголовочном файле не работает валидатор.
                  EVA
                  EVADec. 25, 2023, 9:30 p.m.
                  Boost - static linking in CMake project under Windows Ошибка LNK1104 часто возникает, когда компоновщик не может найти или открыть файл библиотеки. В вашем случае, это файл libboost_locale-vc142-mt-gd-x64-1_74.lib из библиотеки Boost для C+…
                  J
                  JonnyJoDec. 25, 2023, 7:38 p.m.
                  Boost - static linking in CMake project under Windows Сделал всё по-как у вас, но выдаёт ошибку [build] LINK : fatal error LNK1104: не удается открыть файл "libboost_locale-vc142-mt-gd-x64-1_74.lib" Хоть убей, не могу понять в чём дел…
                  G
                  GvozdikDec. 19, 2023, 8:01 a.m.
                  Qt/C++ - Lesson 056. Connecting the Boost library in Qt for MinGW and MSVC compilers Для решения твой проблемы добавь в файл .pro строчку "LIBS += -lws2_32" она решит проблему , лично мне помогло.
                  Now discuss on the forum
                  G
                  GarApril 22, 2024, 3:46 p.m.
                  Clipboard Как скопировать окно целиком в clipb?
                  DA
                  Dr Gangil AcademicsApril 20, 2024, 5:45 p.m.
                  Unlock Your Aesthetic Potential: Explore MSC in Facial Aesthetics and Cosmetology in India Embark on a transformative journey with an msc in facial aesthetics and cosmetology in india . Delve into the intricate world of beauty and rejuvenation, guided by expert faculty and …
                  a
                  a_vlasovApril 14, 2024, 4:41 p.m.
                  Мобильное приложение на C++Qt и бэкенд к нему на Django Rest Framework Евгений, добрый день! Такой вопрос. Верно ли следующее утверждение: Любое Android-приложение, написанное на Java/Kotlin чисто теоретически (пусть и с большими трудностями) можно написать и на C+…
                  Павел Дорофеев
                  Павел ДорофеевApril 14, 2024, 12:35 p.m.
                  QTableWidget с 2 заголовками Вот тут есть кастомный QTableView с многорядностью проект поддерживается, обращайтесь
                  f
                  fastrexApril 4, 2024, 2:47 p.m.
                  Вернуть старое поведение QComboBox, не менять индекс при resetModel Добрый день! У нас много проектов в которых используется QComboBox, в версии 5.5.1, когда модель испускает сигнал resetModel, currentIndex не менялся. В версии 5.15 при resetModel происходит try…

                  Follow us in social networks