Дмитрий
Дмитрий10 липня 2017 р. 03:19

Використання модуля QtTextToSpeech для синтезу мови

Бібліотека Qt 5.8.0 надала програмістам можливість використовувати системний синтезатор мови. Синтезатор мови - це програма, яка перетворює текст в мову. Синтезатори мови є невід'ємною частиною будь-якої сучасної операційної системи: Windows (версії 7 і вище), Mac OS, Linux, iOS і Android. Багатоплатформовий інтерфейс для управління синтезом мови надає модуль QtTextToSpeech бібліотеки Qt.

Для роботи з модулем QtTextToSpeech на ОС Windows необхідно:

  • встановити бібліотеку Qt c модулем QtTextToSpeech для компілятора Visual Studio 2015 або старше (mingw працювати не буде);
  • встановити компілятор Visual Studio 2015;
  • встановити бібліотеку SAPI 5.1 , якщо з якоїсь причини вона відсутня на вашому комп'ютері;
  • встановити голосу для [синтезатора мови] (https://cloud.mail.ru/public/7twT/tG1evtCjX) (якщо у вас вони відсутні).
  • При складанні проекту необхідно використовувати тіньову збірку.

Опис

Якщо при компіляції програми Ви бачите повідомлення

Error loading text-to-speech plug-in "sapi"

то ви зробили щось неправильно.

Якщо ви використовуєте Android, то за замовчуванням у вас працює online синтезатор. За це ви розплатитеся затримкою при синтезі і витраченим трафіком. Якщо це вас не влаштовує, то встановлюйте offline версію. На Android 5.1 для цього необхідно перейти в «настройки» - «більш доступного режиму» - «синтез мови» - «синтезатор мови Google» - «установка голосових даних» - «російський (Росія)» і тиснемо встановити і очікуємо завершення. Крім того, готуємо Qt Creator для створення Android додатків.

Тепер можна приступати до написання програми. За посиланням ви можете скачати проект з вихідним кодом програми, описаної нижче. Створюємо процес новий проект qtwidget. У файл проекту підключає необхідний модуль

QT += texttospeech

Підключаємо бібліотеку синтезатора мови

#include <QtTextToSpeech>

Створюємо покажчик на об'єкт класу QTextToSpeech

QTextToSpeech* speech;

а потім і сам об'єкт

speech = new QtextToSpeech;

Тепер можна генерувати мовні сигнали за допомогою функції say(), в якості аргументу якої потрібно передати вимовний текст. У прикладах створених розробниками Qt Creator наведено простий приклад helloSpeech. Розгляньте його для того, щоб краще зрозуміти можливості розглянутого модуля.

Я перейду до деяких складніших речей. Програма, яку ви можете завантажити за посиланням, містить віджет класу QTextEdit для відтвореного тексту, керуючі кнопки: старт, стоп, вперед назад, ..., вікно для вибору файлів, і вікна для настройки синтезатора.

void MainWindow::start(bool checked)

Запускати на відтворення можна і великі текстові фрагменти. Однак це призводить до необов'язковим затримок, а в разі online синтезатора на Android і до зависання програми. Тому дробимо текст на фрагменти, чим менше, тим краще. Для початку я виділяю з тексту абзац (int activeBlock), а потім розбиваю рядок на лист рядків (QStringList readList) використовую точки як роздільник.

void MainWindow::start(bool checked)
{
    if(checked)
    {
        if(readList.isEmpty())
        {
            readList = ui->textEdit->document()->findBlockByNumber( activeBlock ).text().split(".");
        }
        if(!readList.isEmpty())
        {
            readString = readList.first();
            readList.removeFirst();
            if(!readString.contains(QRegularExpression("[A-Z]|[a-z]|[0-9]|[А-Я]|[а-я]")))
            {
                readString = ".";//windows не читает точки
                if(QSysInfo::productType() == "android")
                    readString = " ";
            }
            speech->say( readString );
            scrollTo();
            ui->textEdit->setReadOnly(true);
        }
    }
    else
    {
        readList.prepend(readString);//
        speech->stop();
        ui->textEdit->setReadOnly(false);
    }
}

void MainWindow::speechStateChange(QTextToSpeech::State state)

На синтезатор передається одна строчка. Після завершення її відтворення speech генерує сигнал stateChanged. Підключений до неї слот speechStateChange відповідає за відтворення чергового рядка.

void MainWindow::speechStateChange( QTextToSpeech::State state)
{
    QString mes;
    switch(state)
    {
    case QTextToSpeech::Ready:
        if(ui->pushButtonStart->isChecked())
        {
            textBlockSelection(colorClean);
            if(readList.isEmpty())
            {
                if( setActiveBlock( activeBlock+1 ) )
                    start();
                else
                    stop();
            }
            else
            {
                start();
            }
        }
        mes = "ready";
        break;
    case QTextToSpeech::Speaking:
        textBlockSelection(Qt::green);
        mes = "speaking";
        break;
    case QTextToSpeech::Paused:
        mes = "paused";
        break;
    case QTextToSpeech::BackendError:
        mes = "error";
        break;
    }
}

допоміжні функції

Для зручності використання програми в якості читалки були написані дві допоміжні функції scrollTo () для прокручування тексту до обраного абзацу та textBlockSelection (QColor) для виділення читаного абзацу кольором фону. Нижче наведено їх вихідний код.

void MainWindow::scrollTo()

void MainWindow::scrollTo()
{
    if(ui->textEdit->verticalScrollBar()->maximum() == 0)
        return;
    QTextDocument *textDoc = ui->textEdit->document();
    int value = 0;
    for(int i = 0; i < activeBlock; i++)
    {
        value +=textDoc->findBlockByNumber(i).layout()->lineCount()
                * textDoc->findBlockByNumber(i).layout()->lineAt(0).height()
                + textDoc->findBlockByNumber(i).blockFormat().bottomMargin();
    }
    if(value <= ui->textEdit->verticalScrollBar()->maximum())
        ui->textEdit->verticalScrollBar()->setValue(value);
}

bool MainWindow::setActiveBlock(int blockNumber, bool scroll)

bool MainWindow::setActiveBlock(int blockNumber, bool scroll)
{
    readList.clear();
    textBlockSelection(colorClean);
    if(blockNumber < 0)
    {
        activeBlock = 0;
        if(scroll)
            scrollTo();
        return false;
    }
    if(blockNumber >= ui->textEdit->document()->blockCount())
    {
        activeBlock = ui->textEdit->document()->blockCount()-1;
        if(scroll)
            scrollTo();
        return false;
    }
    else
    {
        activeBlock = blockNumber;
        if(scroll)
            scrollTo();
        return true;
    }
}

Наголос і Омографи

Суттєвою проблемою для синтезатора мови є наголос. Особливо в тих випадках, коли два слова пишуться однаково, але мають різні наголоси (омографи). В такому випадку, без застосування складних семантичних алгоритмів, наголос може бути виставлено тільки в ручну. І Windows (на відміну від Android) дозволяє це зробити. Для цього потрібно поставити знак «`»(на одній клавіші з буквою е). Однак точного механізму роботи цього інструменту встановити не вдалося.

Рекомендуємо хостинг TIMEWEB
Рекомендуємо хостинг TIMEWEB
Стабільний хостинг, на якому розміщується соціальна мережа EVILEG. Для проектів на Django радимо VDS хостинг.

Вам це подобається? Поділіться в соціальних мережах!

Дмитрий
  • 23 липня 2017 р. 02:52

Если вы знаете простой способ для извлечения текста из pdf или djv файлов напишите в ответе.

Evgenii Legotckoi
  • 23 липня 2017 р. 06:10

Лично я простого не знаю способа. В обоих случаях понадобится использовать сторонние библиотеки.

В случае с pdf - это будет либа, которая работает с pdf, какой-нибудь poppler-qt.
В случае же с djvu - это уже либа по распознаванию текста в изображениях.
Но за пример такой работы ничего не скажу, не занимался таким.

Коментарі

Only authorized users can post comments.
Please, Log in or Sign up
AD

C++ - Тест 004. Указатели, Массивы и Циклы

  • Результат:50бали,
  • Рейтинг балів-4
m
  • molni99
  • 26 жовтня 2024 р. 01:37

C++ - Тест 004. Указатели, Массивы и Циклы

  • Результат:80бали,
  • Рейтинг балів4
m
  • molni99
  • 26 жовтня 2024 р. 01:29

C++ - Тест 004. Указатели, Массивы и Циклы

  • Результат:20бали,
  • Рейтинг балів-10
Останні коментарі
ИМ
Игорь Максимов22 листопада 2024 р. 11:51
Django - Підручник 017. Налаштуйте сторінку входу до Django Добрый вечер Евгений! Я сделал себе авторизацию аналогичную вашей, все работает, кроме возврата к предидущей странице. Редеректит всегда на главную, хотя в логах сервера вижу запросы на правильн…
Evgenii Legotckoi
Evgenii Legotckoi31 жовтня 2024 р. 14:37
Django - Урок 064. Як написати розширення для Python Markdown Добрый день. Да, можно. Либо через такие же плагины, либо с постобработкой через python библиотеку Beautiful Soup
A
ALO1ZE19 жовтня 2024 р. 08:19
Читалка файлів fb3 на Qt Creator Подскажите как это запустить? Я не шарю в программировании и кодинге. Скачал и установаил Qt, но куча ошибок выдается и не запустить. А очень надо fb3 переконвертировать в html
ИМ
Игорь Максимов05 жовтня 2024 р. 07:51
Django - Урок 064. Як написати розширення для Python Markdown Приветствую Евгений! У меня вопрос. Можно ли вставлять свои классы в разметку редактора markdown? Допустим имея стандартную разметку: <ul> <li></li> <li></l…
d
dblas505 липня 2024 р. 11:02
QML - Урок 016. База даних SQLite та робота з нею в QML Qt Здравствуйте, возникает такая проблема (я новичок): ApplicationWindow неизвестный элемент. (М300) для TextField и Button аналогично. Могу предположить, что из-за более новой верси…
Тепер обговоріть на форумі
Evgenii Legotckoi
Evgenii Legotckoi24 червня 2024 р. 15:11
добавить qlineseries в функции Я тут. Работы оень много. Отправил его в бан.
t
tonypeachey115 листопада 2024 р. 06:04
google domain [url=https://google.com/]domain[/url] domain [http://www.example.com link title]
NSProject
NSProject04 червня 2022 р. 03:49
Всё ещё разбираюсь с кешем. В следствии прочтения данной статьи. Я принял для себя решение сделать кеширование свойств менеджера модели LikeDislike. И так как установка evileg_core для меня не была возможна, ибо он писался…
9
9Anonim25 жовтня 2024 р. 09:10
Машина тьюринга // Начальное состояние 0 0, ,<,1 // Переход в состояние 1 при пустом символе 0,0,>,0 // Остаемся в состоянии 0, двигаясь вправо при встрече 0 0,1,>…

Слідкуйте за нами в соціальних мережах