E
Edi23 січня 2020 р. 06:11

QWebPage получить html

QWebPage, QtWebEngineWidgets, QWebEnginePage::toHtml(), QWebEnginePage, QWebEngin, webenginewidgets, QWebPage получить html

Здравствуйте, пытаюсь получить html код страницы, но не появляется ни чего в указанной дирректории, что у меня не правильно? Надо получить вэб страницу не из виджета, а с помощью кода, ее отображение в саймой программе не требуется. Помогите плиз.
QWebEngineProfile m_profile = new QWebEngineProfile;
m_profile->setDownloadPath("my path");
QWebEnginePage
page = new QWebEnginePage(m_profile);
QUrl url("https://domenName");
page->load(url);
page->save("my path", QWebEngineDownloadItem::CompleteHtmlSaveFormat);

Рекомендуємо хостинг TIMEWEB
Рекомендуємо хостинг TIMEWEB
Стабільний хостинг, на якому розміщується соціальна мережа EVILEG. Для проектів на Django радимо VDS хостинг.

Вам це подобається? Поділіться в соціальних мережах!

8
E
  • 23 січня 2020 р. 08:24
  • (відредаговано)
  • Відповідь була позначена як рішення.

Уже дошло) Оставлю здесь код для следующего поколения новичков) Вместо toHtml() можно вставить toPlainText и получить текст web страницы

QWebEngineProfile *m_profile = new QWebEngineProfile;
m_profile->setDownloadPath("my dir");
QWebEnginePage *page = new QWebEnginePage(m_profile);

page->settings()->setAttribute(QWebEngineSettings::AutoLoadImages, false);
page->settings()->setAttribute(QWebEngineSettings::JavascriptEnabled, true);

QEventLoop *event = new QEventLoop;
connect(page, &QWebEnginePage::loadFinished, event, &QEventLoop::quit);

page->load(QUrl("my url"));

event->exec();

page->toPlainText([this](const QString &result){
   qDebug()<<"html:";
   qDebug()<<result.size();
   ui->textBrowser->append(result);
   });
    Evgenii Legotckoi
    • 23 січня 2020 р. 08:35

    Добрый день. Ещё можно использовать просто QNetworkAccessManager, а то использование QWebEngine для получения html текста страницы с сайта может быть просто стрельбой из пушки по воробьям.

    В этой статье есть пример получения JSON файла , но для обычной страницы разницы особой нет.

      E
      • 23 січня 2020 р. 09:08

      Нужно получить страницу, на кт после выполнения java скрипта открывается дополнительный контент. С помощью QNetworkRequest можно получить только страницу, а доп. контент нельзя. Сейчас пытаюсь это сделать с помощью QWebEnginePage::runJavaScript(). Правильная же концепция? Вот код:

      QEventLoop *event = new QEventLoop;
      connect(page, &QWebEnginePage::loadFinished, event, &QEventLoop::quit);
      
      page->load(QUrl("my url"));
      
      event->exec();
      
      page->runJavaScript("document.getElementsByTagName(\"script\")[i]");
      
        Evgenii Legotckoi
        • 23 січня 2020 р. 09:33
        • (відредаговано)

        Тогда согласен.

        Да, концепция правильная. Нужно только поизвращаться с сигналами и слотами. Там всё это асинхронно работает и поэтому достаточно по дурацки.

        У меня была подобная задача. Добавлял WebView в диалог и уже в диалоге всё обрабатывал.

        Принцип следующий.

        В конструкторе диалога добавляем следующее

        m_webView = new QWebEngineView(this);
        ui->centralWidgetLayout->addWidget(m_webView);
        connect(m_webView, &QWebEngineView::loadFinished, this, &Dialog::onLoadFinished);
        connect(this, &Dialog::getHtml, this, &Dialog::handleHTML);
        

        Далее пишем слот onLoadFinished, который выплёвывает сигнал getHtml

        void Dialog::onLoadFinished()
        {
            m_webView->page()->toHtml([this](const QString& result) mutable { emit getHtml(result); });
        }
        

        И потом уже в handleHTML делаем обработку.

        void WizardMapWebDialog::handleHTML(QString html)
        {
            // ToDo something with html
        }
        

        Заголовочник будет следующий

        class Dialog : public QDialog
        {
            Q_OBJECT
        public:
            explicit Dialog(QWidget* parent = nullptr);
        
            virtual ~Dialog() override;
        
        signals:
            void getHtml(QString html);
        
        private slots:
            void onLoadFinished();
            void handleHTML(QString html);
        
        private:
            Ui::Dialog* ui;
            QWebEngineView* m_webView;
        };
        

        JavaScript можно вызвать с применением callback функции, чтобы ещё и результат сразу полчить из функции

            m_webView->page()->runJavaScript("checkMap()", [this](const QVariant& v)
            {
                if (v.toString() == "true")
                {
                    m_webView->page()->runJavaScript("takeValues();");
                }
                else
                {
                    gui::DMessageBox::showError(this, tr("The mark point is outside the map.<br>Please select a location on the map"));
                }
            });
        

        В примере с запуском JavaScript вызывались функции, которые уже есть на странице сайта, так что если там подключена jQuery, то думаю, что сможете её функционал использовать.

        Другого способа, как получать перезагруженный контент через JavaScript на странице, я не знаю. Любые другие способы у меня не работали. Только таким образом сработало.

          E
          • 23 січня 2020 р. 13:02
          • (відредаговано)

          Спасибо) А можно получить скрипты сайта таким образом?

              QWebEngineProfile *m_profile = new QWebEngineProfile;
              QWebEnginePage *page = new QWebEnginePage(m_profile);
              QList<QWebEngineScript> lsc;
              qDebug() << page->scripts().toList().isEmpty();
              lsc = page->scripts().toList();
              qDebug() << lsc;
          

          Что делать с проблемой, когда скрипты сайта подгружаются по http и Qt ругается так:

          js: Mixed Content: The page at was loaded over HTTPS, but requested an insecure script . This request has been blocked; the content must be served over HTTPS.
          js: Mixed Content: The page at was loaded over a secure connection, but contains a form that targets an insecure endpoint . This endpoint should be made available over a secure connection.

          Я пытался получить html по http и в профайле прописал: -no-openssl, но не помогло.

            Evgenii Legotckoi
            • 24 січня 2020 р. 02:37

            Не уверен. я бы попробовал выдернуть ссылки и забрать всё через QNetworkAccessManager, если вам не нужно запускать эти скрипты.
            Я с той ошибкой не сталкивался.

              E
              • 25 січня 2020 р. 15:00

              Нашел фикс той ошибки:
              ui->vebEngineView->settings()->setAttribute(QWebEngineSettings::AllowRunningInsecureContent, true);

                E
                • 26 січня 2020 р. 11:42

                Другого способа, как получать перезагруженный контент через JavaScript на странице, я не знаю.

                Получилось сделать без QWebEngineView, с помощью QWebEnginePage, runJavaScript работает ассинхронно и надо дождаться пока скрипт выполнится, я установил таймер. В итоге в textBrowser выводился html, измененный скриптом.

                QWebEnginePage *page1 = new QWebEnginePage;
                
                    page1->settings()->setAttribute(QWebEngineSettings::AutoLoadImages, false);
                    page1->settings()->setAttribute(QWebEngineSettings::JavascriptEnabled, true);
                    page1->settings()->setAttribute(QWebEngineSettings::AllowRunningInsecureContent, true);
                
                    QEventLoop *event = new QEventLoop;
                    connect(page1, &QWebEnginePage::loadFinished, event, &QEventLoop::quit);
                
                    page1->load(QUrl("https://..."));
                
                    event->exec();
                
                
                    page1->toHtml([this](const QString &result){
                       ui->textBrowser_2->append(result);
                       });
                
                    page1->runJavaScript("javascript:__doPostBack('...')");
                
                    qDebug() << "run!";
                
                    QEventLoop *event1 = new QEventLoop;
                    QTimer *timer = new QTimer();  
                    connect(timer, &QTimer::timeout, event1, &QEventLoop::quit);
                    timer->start(10000);
                    event1->exec();
                
                
                    page1->toHtml([this](const QString &result){
                       ui->textBrowser->append(result);
                       });
                

                  Коментарі

                  Only authorized users can post comments.
                  Please, Log in or Sign up
                  sf

                  C++ - Тест 004. Указатели, Массивы и Циклы

                  • Результат:90бали,
                  • Рейтинг балів8
                  МВ

                  Qt - Тест 001. Сигналы и слоты

                  • Результат:68бали,
                  • Рейтинг балів-1
                  ЛС

                  C++ - Тест 001. Первая программа и типы данных

                  • Результат:53бали,
                  • Рейтинг балів-4
                  Останні коментарі
                  A
                  ALO1ZE19 жовтня 2024 р. 08:19
                  Читалка файлів fb3 на Qt Creator Подскажите как это запустить? Я не шарю в программировании и кодинге. Скачал и установаил Qt, но куча ошибок выдается и не запустить. А очень надо fb3 переконвертировать в html
                  ИМ
                  Игорь Максимов05 жовтня 2024 р. 07:51
                  Django - Урок 064. Як написати розширення для Python Markdown Приветствую Евгений! У меня вопрос. Можно ли вставлять свои классы в разметку редактора markdown? Допустим имея стандартную разметку: <ul> <li></li> <li></l…
                  d
                  dblas505 липня 2024 р. 11:02
                  QML - Урок 016. База даних SQLite та робота з нею в QML Qt Здравствуйте, возникает такая проблема (я новичок): ApplicationWindow неизвестный элемент. (М300) для TextField и Button аналогично. Могу предположить, что из-за более новой верси…
                  k
                  kmssr08 лютого 2024 р. 18:43
                  Qt Linux - Урок 001. Автозапуск програми Qt під Linux как сделать автозапуск для флэтпака, который не даёт создавать файлы в ~/.config - вот это вопрос ))
                  АК
                  Анатолий Кононенко05 лютого 2024 р. 01:50
                  Qt WinAPI - Урок 007. Робота з ICMP Ping в Qt Без строки #include <QRegularExpressionValidator> в заголовочном файле не работает валидатор.
                  Тепер обговоріть на форумі
                  J
                  JacobFib17 жовтня 2024 р. 03:27
                  добавить qlineseries в функции Пользователь может получить любые разъяснения по интересующим вопросам, касающимся обработки его персональных данных, обратившись к Оператору с помощью электронной почты https://topdecorpro.ru…
                  ИМ
                  Игорь Максимов03 жовтня 2024 р. 04:05
                  Реализация навигации по разделам Спасибо Евгений!
                  JW
                  Jhon Wick01 жовтня 2024 р. 15:52
                  Indian Food Restaurant In Columbus OH| Layla’s Kitchen Indian Restaurant If you're looking for a truly authentic https://www.laylaskitchenrestaurantohio.com/ , Layla’s Kitchen Indian Restaurant is your go-to destination. Located at 6152 Cleveland Ave, Colu…
                  КГ
                  Кирилл Гусарев27 вересня 2024 р. 09:09
                  Не запускается программа на Qt: точка входа в процедуру не найдена в библиотеке DLL Написал программу на C++ Qt в Qt Creator, сбилдил Release с помощью MinGW 64-bit, бинарнику напихал dll-ки с помощью windeployqt.exe. При попытке запуска моей сбилженной программы выдаёт три оши…
                  F
                  Fynjy22 липня 2024 р. 04:15
                  при создании qml проекта Kits есть но недоступны для выбора Поставил Qt Creator 11.0.2. Qt 6.4.3 При создании проекта Qml не могу выбрать Kits, они все недоступны, хотя настроены и при создании обычного Qt Widget приложения их можно выбрать. В чем может …

                  Слідкуйте за нами в соціальних мережах