E
EdiҚаң. 23, 2020, 6:11 Т.Ж.

QWebPage получить html

QWebPage, QtWebEngineWidgets, QWebEnginePage::toHtml(), QWebEnginePage, QWebEngin, webenginewidgets, QWebPage получить html

Здравствуйте, пытаюсь получить html код страницы, но не появляется ни чего в указанной дирректории, что у меня не правильно? Надо получить вэб страницу не из виджета, а с помощью кода, ее отображение в саймой программе не требуется. Помогите плиз.
QWebEngineProfile m_profile = new QWebEngineProfile;
m_profile->setDownloadPath("my path");
QWebEnginePage
page = new QWebEnginePage(m_profile);
QUrl url("https://domenName");
page->load(url);
page->save("my path", QWebEngineDownloadItem::CompleteHtmlSaveFormat);

Рекомендуем хостинг TIMEWEB
Рекомендуем хостинг TIMEWEB
Стабильный хостинг, на котором располагается социальная сеть EVILEG. Для проектов на Django рекомендуем VDS хостинг.

Ол саған ұнайды ма? Әлеуметтік желілерде бөлісіңіз!

8
E
  • Қаң. 23, 2020, 8:24 Т.Ж.
  • (өңделген)
  • Жауап шешім ретінде белгіленді.

Уже дошло) Оставлю здесь код для следующего поколения новичков) Вместо toHtml() можно вставить toPlainText и получить текст web страницы

QWebEngineProfile *m_profile = new QWebEngineProfile;
m_profile->setDownloadPath("my dir");
QWebEnginePage *page = new QWebEnginePage(m_profile);

page->settings()->setAttribute(QWebEngineSettings::AutoLoadImages, false);
page->settings()->setAttribute(QWebEngineSettings::JavascriptEnabled, true);

QEventLoop *event = new QEventLoop;
connect(page, &QWebEnginePage::loadFinished, event, &QEventLoop::quit);

page->load(QUrl("my url"));

event->exec();

page->toPlainText([this](const QString &result){
   qDebug()<<"html:";
   qDebug()<<result.size();
   ui->textBrowser->append(result);
   });
    Evgenii Legotckoi
    • Қаң. 23, 2020, 8:35 Т.Ж.

    Добрый день. Ещё можно использовать просто QNetworkAccessManager, а то использование QWebEngine для получения html текста страницы с сайта может быть просто стрельбой из пушки по воробьям.

    В этой статье есть пример получения JSON файла , но для обычной страницы разницы особой нет.

      E
      • Қаң. 23, 2020, 9:08 Т.Ж.

      Нужно получить страницу, на кт после выполнения java скрипта открывается дополнительный контент. С помощью QNetworkRequest можно получить только страницу, а доп. контент нельзя. Сейчас пытаюсь это сделать с помощью QWebEnginePage::runJavaScript(). Правильная же концепция? Вот код:

      QEventLoop *event = new QEventLoop;
      connect(page, &QWebEnginePage::loadFinished, event, &QEventLoop::quit);
      
      page->load(QUrl("my url"));
      
      event->exec();
      
      page->runJavaScript("document.getElementsByTagName(\"script\")[i]");
      
        Evgenii Legotckoi
        • Қаң. 23, 2020, 9:33 Т.Ж.
        • (өңделген)

        Тогда согласен.

        Да, концепция правильная. Нужно только поизвращаться с сигналами и слотами. Там всё это асинхронно работает и поэтому достаточно по дурацки.

        У меня была подобная задача. Добавлял WebView в диалог и уже в диалоге всё обрабатывал.

        Принцип следующий.

        В конструкторе диалога добавляем следующее

        m_webView = new QWebEngineView(this);
        ui->centralWidgetLayout->addWidget(m_webView);
        connect(m_webView, &QWebEngineView::loadFinished, this, &Dialog::onLoadFinished);
        connect(this, &Dialog::getHtml, this, &Dialog::handleHTML);
        

        Далее пишем слот onLoadFinished, который выплёвывает сигнал getHtml

        void Dialog::onLoadFinished()
        {
            m_webView->page()->toHtml([this](const QString& result) mutable { emit getHtml(result); });
        }
        

        И потом уже в handleHTML делаем обработку.

        void WizardMapWebDialog::handleHTML(QString html)
        {
            // ToDo something with html
        }
        

        Заголовочник будет следующий

        class Dialog : public QDialog
        {
            Q_OBJECT
        public:
            explicit Dialog(QWidget* parent = nullptr);
        
            virtual ~Dialog() override;
        
        signals:
            void getHtml(QString html);
        
        private slots:
            void onLoadFinished();
            void handleHTML(QString html);
        
        private:
            Ui::Dialog* ui;
            QWebEngineView* m_webView;
        };
        

        JavaScript можно вызвать с применением callback функции, чтобы ещё и результат сразу полчить из функции

            m_webView->page()->runJavaScript("checkMap()", [this](const QVariant& v)
            {
                if (v.toString() == "true")
                {
                    m_webView->page()->runJavaScript("takeValues();");
                }
                else
                {
                    gui::DMessageBox::showError(this, tr("The mark point is outside the map.<br>Please select a location on the map"));
                }
            });
        

        В примере с запуском JavaScript вызывались функции, которые уже есть на странице сайта, так что если там подключена jQuery, то думаю, что сможете её функционал использовать.

        Другого способа, как получать перезагруженный контент через JavaScript на странице, я не знаю. Любые другие способы у меня не работали. Только таким образом сработало.

          E
          • Қаң. 23, 2020, 1:02 Т.Қ.
          • (өңделген)

          Спасибо) А можно получить скрипты сайта таким образом?

              QWebEngineProfile *m_profile = new QWebEngineProfile;
              QWebEnginePage *page = new QWebEnginePage(m_profile);
              QList<QWebEngineScript> lsc;
              qDebug() << page->scripts().toList().isEmpty();
              lsc = page->scripts().toList();
              qDebug() << lsc;
          

          Что делать с проблемой, когда скрипты сайта подгружаются по http и Qt ругается так:

          js: Mixed Content: The page at was loaded over HTTPS, but requested an insecure script . This request has been blocked; the content must be served over HTTPS.
          js: Mixed Content: The page at was loaded over a secure connection, but contains a form that targets an insecure endpoint . This endpoint should be made available over a secure connection.

          Я пытался получить html по http и в профайле прописал: -no-openssl, но не помогло.

            Evgenii Legotckoi
            • Қаң. 24, 2020, 2:37 Т.Ж.

            Не уверен. я бы попробовал выдернуть ссылки и забрать всё через QNetworkAccessManager, если вам не нужно запускать эти скрипты.
            Я с той ошибкой не сталкивался.

              E
              • Қаң. 25, 2020, 3 Т.Қ.

              Нашел фикс той ошибки:
              ui->vebEngineView->settings()->setAttribute(QWebEngineSettings::AllowRunningInsecureContent, true);

                E
                • Қаң. 26, 2020, 11:42 Т.Ж.

                Другого способа, как получать перезагруженный контент через JavaScript на странице, я не знаю.

                Получилось сделать без QWebEngineView, с помощью QWebEnginePage, runJavaScript работает ассинхронно и надо дождаться пока скрипт выполнится, я установил таймер. В итоге в textBrowser выводился html, измененный скриптом.

                QWebEnginePage *page1 = new QWebEnginePage;
                
                    page1->settings()->setAttribute(QWebEngineSettings::AutoLoadImages, false);
                    page1->settings()->setAttribute(QWebEngineSettings::JavascriptEnabled, true);
                    page1->settings()->setAttribute(QWebEngineSettings::AllowRunningInsecureContent, true);
                
                    QEventLoop *event = new QEventLoop;
                    connect(page1, &QWebEnginePage::loadFinished, event, &QEventLoop::quit);
                
                    page1->load(QUrl("https://..."));
                
                    event->exec();
                
                
                    page1->toHtml([this](const QString &result){
                       ui->textBrowser_2->append(result);
                       });
                
                    page1->runJavaScript("javascript:__doPostBack('...')");
                
                    qDebug() << "run!";
                
                    QEventLoop *event1 = new QEventLoop;
                    QTimer *timer = new QTimer();  
                    connect(timer, &QTimer::timeout, event1, &QEventLoop::quit);
                    timer->start(10000);
                    event1->exec();
                
                
                    page1->toHtml([this](const QString &result){
                       ui->textBrowser->append(result);
                       });
                

                  Пікірлер

                  Тек рұқсаты бар пайдаланушылар ғана пікір қалдыра алады.
                  Кіріңіз немесе Тіркеліңіз
                  AD

                  C++ - Тест 004. Указатели, Массивы и Циклы

                  • Нәтиже:50ұпай,
                  • Бағалау ұпайлары-4
                  m
                  • molni99
                  • Қаз. 26, 2024, 1:37 Т.Ж.

                  C++ - Тест 004. Указатели, Массивы и Циклы

                  • Нәтиже:80ұпай,
                  • Бағалау ұпайлары4
                  m
                  • molni99
                  • Қаз. 26, 2024, 1:29 Т.Ж.

                  C++ - Тест 004. Указатели, Массивы и Циклы

                  • Нәтиже:20ұпай,
                  • Бағалау ұпайлары-10
                  Соңғы пікірлер
                  ИМ
                  Игорь МаксимовҚар. 22, 2024, 11:51 Т.Ж.
                  Django - Оқулық 017. Теңшелген Django кіру беті Добрый вечер Евгений! Я сделал себе авторизацию аналогичную вашей, все работает, кроме возврата к предидущей странице. Редеректит всегда на главную, хотя в логах сервера вижу запросы на правильн…
                  Evgenii Legotckoi
                  Evgenii LegotckoiҚаз. 31, 2024, 2:37 Т.Қ.
                  Django - Сабақ 064. Python Markdown кеңейтімін қалай жазуға болады Добрый день. Да, можно. Либо через такие же плагины, либо с постобработкой через python библиотеку Beautiful Soup
                  A
                  ALO1ZEҚаз. 19, 2024, 8:19 Т.Ж.
                  Qt Creator көмегімен fb3 файл оқу құралы Подскажите как это запустить? Я не шарю в программировании и кодинге. Скачал и установаил Qt, но куча ошибок выдается и не запустить. А очень надо fb3 переконвертировать в html
                  ИМ
                  Игорь МаксимовҚаз. 5, 2024, 7:51 Т.Ж.
                  Django - Сабақ 064. Python Markdown кеңейтімін қалай жазуға болады Приветствую Евгений! У меня вопрос. Можно ли вставлять свои классы в разметку редактора markdown? Допустим имея стандартную разметку: <ul> <li></li> <li></l…
                  d
                  dblas5Шілде 5, 2024, 11:02 Т.Ж.
                  QML - Сабақ 016. SQLite деректер қоры және онымен QML Qt-та жұмыс істеу Здравствуйте, возникает такая проблема (я новичок): ApplicationWindow неизвестный элемент. (М300) для TextField и Button аналогично. Могу предположить, что из-за более новой верси…
                  Енді форумда талқылаңыз
                  m
                  moogoҚар. 22, 2024, 7:17 Т.Ж.
                  Mosquito Spray System Effective Mosquito Systems for Backyard | Eco-Friendly Misting Control Device & Repellent Spray - Moogo ; Upgrade your backyard with our mosquito-repellent device! Our misters conce…
                  Evgenii Legotckoi
                  Evgenii LegotckoiМаусым 24, 2024, 3:11 Т.Қ.
                  добавить qlineseries в функции Я тут. Работы оень много. Отправил его в бан.
                  t
                  tonypeachey1Қар. 15, 2024, 6:04 Т.Ж.
                  google domain [url=https://google.com/]domain[/url] domain [http://www.example.com link title]
                  NSProject
                  NSProjectМаусым 4, 2022, 3:49 Т.Ж.
                  Всё ещё разбираюсь с кешем. В следствии прочтения данной статьи. Я принял для себя решение сделать кеширование свойств менеджера модели LikeDislike. И так как установка evileg_core для меня не была возможна, ибо он писался…

                  Бізді әлеуметтік желілерде бақылаңыз