Руслан Волшебник
Руслан ВолшебникDec. 13, 2019, 7:53 a.m.

Как уменьшить количество запросов в Django ORM?

Django, ORM, DataBase

Доброго времени суток.

Задача такая.
Нужно получить QuerySet, который состоит из вопросов разных категорий. Вопросы должны быть разной сложности, а для каждой сложности своё количество. Все вопросы нужно вытащить из бд в случайном порядке.

Есть вот такой код.

# models.py
class Question(models.Model):
    EASY = 1
    MEDIUM = 2
    HARD = 3

    DIFFICULTY_CHOICES = (
        (EASY, 'Легкий'),
        (MEDIUM, 'Средний'),
        (HARD, 'Сложный')
    )

    text = models.TextField(max_length=300, null=True, verbose_name='текст вопроса')
    categories = models.ManyToManyField(Category, related_name="questions", verbose_name='категории')
    difficulty = models.PositiveSmallIntegerField(choices=DIFFICULTY_CHOICES, default=MEDIUM, verbose_name='сложность')
questions = None

for category in categories:
    category_id = category['id']

    easy_question_count = category['easy_question_count']
    medium_question_count = category['medium_question_count']
    hard_question_count = category['hard_question_count']

    easy_questions = Question.objects.filter(categories__id=category_id, difficulty=1)
    medium_questions = Question.objects.filter(categories__id=category_id, difficulty=2)
    hard_questions = Question.objects.filter(categories__id=category_id, difficulty=3)

    q1 = easy_questions.objects.random(easy_question_count)
    q2 = medium_questions.objects.random(medium_question_count)
    q3 = hard_questions.objects.random(hard_question_count)

    if questions:
        questions = questions.union(q1).union(q2).union(q3)
    else:
        questions = q1.union(q2).union(q3)

Метод random взят из библиотеки https://github.com/rremizov/django-random-queryset.git
Это библиотека позволяет получить QuerySet определенной длины, состоящий из элементов в случайном порядке.

Вот скрин запросов.

Это для одной категории, а если категорий, к примеру 10, то получится 60 запросов.
Как это дело оптимизировать? Ломаю голову 3 дня.

Может кто-нибудь подсказать, как мне решить задачу?

We recommend hosting TIMEWEB
We recommend hosting TIMEWEB
Stable hosting, on which the social network EVILEG is located. For projects on Django we recommend VDS hosting.

Do you like it? Share on social networks!

9
Evgenii Legotckoi
  • Dec. 13, 2019, 9 a.m.

Добрый день,

Я правильно понимаю, что вы в итоге сваливаете в кучу все вопросы в объект questions?

Возможно, что стоит это переписать иначе, например так

questions = None

easy_questions = Question.objects.filter(categories__in=categories, difficulty=1)
medium_questions = Question.objects.filter(categories__in=categories, difficulty=2)
hard_questions = Question.objects.filter(categories__in=categories, difficulty=3)

q1 = easy_questions.objects.random(easy_questions.count())
q2 = medium_questions.objects.random(medium_questions.count())
q3 = hard_questions.objects.random(hard_questions.count())

questions = q1.union(q2).union(q3)
    Evgenii Legotckoi
    • Dec. 13, 2019, 9:02 a.m.

    Ну а если вам нужно просто срандомизировать всё в одной куче, то я бы так попробовал написать

    questions = Question.objects.filter(categories__in=categories)
    questions = questions.objects.random(questions.count())
    

      -"Я правильно понимаю, что вы в итоге сваливаете в кучу все вопросы в объект questions?"
      -Да. Это для дальнейших манипуляций) Возможно, переделаю.

      Проблема в том, что для каждой категории нужно разное кол-во вопросов.
      Например:
      Категория биология, 1 легкий вопрос, 2 средних и 3 сложных;
      Категория математика, 2 легких, 2 средних и 2 сложных....и т.д.

        Илья Чичак
        • Dec. 13, 2019, 9:26 a.m.
        • (edited)

        Кстати, сделать случайный порядок можно крайне просто:

        Question.objects.all().order_by('?')
        

        Документация

        Вообще, я слабо понял задачу. Если чуть более понятно сможете описать ее, возможно, смогу помочь

          Руслан Волшебник
          • Dec. 13, 2019, 9:42 a.m.
          • (edited)

          На stackoverflow пишут, что это дорогая операция и лучше по-другому.
          В доках пишут:
          Note: order_by('?') queries may be expensive and slow, depending on the database backend you’re using.

          Я конечно не спец(всего лишь любитель), но я попробую таким способ тоже, может в моем случае будет всё норм.

          На счёт задачи.
          Есть, к примеру, категории: биология, математика, физика...и т.д.
          В каждой категории есть вопросы. У всех вопросов есть сложность от 1 до 3.

          Нужно вот что.
          Из категории физика нужно достать в случайном порядке 3 легких вопроса, 2 средних и 1 сложный;
          Из категории математика 1 легкий, 3 средних, 2 сложных. Тоже в случайном порядке .

          Моя проблема в том, что чем больше категорий, тем больше запросов.
          Если нужно сделать поиск вопросов только по 1-ой категории, то 6 запросов, по 2-ум категориям 12 запросов и т.д.

          Хотелось бы, чтобы при увеличении количества категорий, количество запросов не увеличивалось.

            Руслан, посмотрите исходники той библиотеки, которую вы использовали. Там как раз и используется order_by('?') в конечном итоге, а ещё перед этим используется агрегация id всех объектов в queryset. Метод aggregate , кстати, тоже достаточно дорогой, я стараюсь избегать его или кешировать.

            Так что в методе random , который выполняет данная библиотека используется сразу два дорогостоящих запроса, хорошо хоть там нет distinct , иначе совсем вилы были бы.

            Я вашу задачу понял, но вопрос действительно сложный, пока мыслей нет.

              К слову говоря, этот метод order_by('?') мне кажется относительно рандомным, поскольку он выполняет сортировку по случайному столбцу и в случайном направлении (по алфавиту/ против алфавита), если я правильно понял его суть. В общем он настолько рандомный, сколько у вас полей в модели.

                Руслан Волшебник
                • Dec. 13, 2019, 10:16 a.m.
                • (edited)

                Да, я посмотрел, вы абсолютно правы. Единственное, если я правильно понял, если срабатывает условие

                if (aggregates["max_id"] - aggregates["min_id"]) + 1 == aggregates["count"]:
                    return self.filter(
                        id__in=strategies.min_max(
                            amount,
                            aggregates["min_id"],
                            aggregates["max_id"],
                            aggregates["count"],
                        )
                    )
                

                то он возвращает QuerySet минуя order_by('?').

                  Руслан Волшебник
                  • Dec. 15, 2019, 4:38 a.m.
                  • (edited)

                  В общем, пока что я решил отказаться от этой затеи, и сделал выбор количества легких, средних и сложных вопросов не для каждой категории отдельно, а для всех.

                  И да, после использования union, нельзя юзать filter, а так как мне нужно потом отфильтровать ещё раз, то я сделал так

                  easy_question_count = quiz.easy_question_count
                  medium_question_count = quiz.medium_question_count
                  hard_question_count = quiz.hard_question_count
                  
                  easy_questions = questions.filter(difficulty=1)
                  medium_questions = questions.filter(difficulty=2)
                  hard_questions = questions.filter(difficulty=3)
                  
                  easy_questions = get_random_questions(easy_questions, easy_question_count)
                  medium_questions = get_random_questions(medium_questions, medium_question_count)
                  hard_questions = get_random_questions(hard_questions, hard_question_count)
                  
                  question_ids = easy_questions.union(medium_questions).union(hard_questions).values_list('id', flat=True)
                  questions = questions.filter(id__in=question_ids)
                  
                  

                  А для получения рандомных вопросов нужного мне количества написал вот такую функцию.

                  def get_random_questions(questions, question_count):
                      question_id_array = list(questions.values_list('id', flat=True))
                      random_ids = random.sample(question_id_array, min(len(question_id_array), question_count))
                      questions = questions.filter(id__in=random_ids)
                      return questions
                  

                  Получилось всего 5 запросов.

                  Готов выслушать критику, если есть)

                    Comments

                    Only authorized users can post comments.
                    Please, Log in or Sign up
                    e
                    • ehot
                    • April 1, 2024, 12:29 a.m.

                    C++ - Тест 003. Условия и циклы

                    • Result:78points,
                    • Rating points2
                    B

                    C++ - Test 002. Constants

                    • Result:16points,
                    • Rating points-10
                    B

                    C++ - Test 001. The first program and data types

                    • Result:46points,
                    • Rating points-6
                    Last comments
                    k
                    kmssrFeb. 9, 2024, 5:43 a.m.
                    Qt Linux - Lesson 001. Autorun Qt application under Linux как сделать автозапуск для флэтпака, который не даёт создавать файлы в ~/.config - вот это вопрос ))
                    Qt WinAPI - Lesson 007. Working with ICMP Ping in Qt Без строки #include <QRegularExpressionValidator> в заголовочном файле не работает валидатор.
                    EVA
                    EVADec. 25, 2023, 9:30 p.m.
                    Boost - static linking in CMake project under Windows Ошибка LNK1104 часто возникает, когда компоновщик не может найти или открыть файл библиотеки. В вашем случае, это файл libboost_locale-vc142-mt-gd-x64-1_74.lib из библиотеки Boost для C+…
                    J
                    JonnyJoDec. 25, 2023, 7:38 p.m.
                    Boost - static linking in CMake project under Windows Сделал всё по-как у вас, но выдаёт ошибку [build] LINK : fatal error LNK1104: не удается открыть файл "libboost_locale-vc142-mt-gd-x64-1_74.lib" Хоть убей, не могу понять в чём дел…
                    G
                    GvozdikDec. 19, 2023, 8:01 a.m.
                    Qt/C++ - Lesson 056. Connecting the Boost library in Qt for MinGW and MSVC compilers Для решения твой проблемы добавь в файл .pro строчку "LIBS += -lws2_32" она решит проблему , лично мне помогло.
                    Now discuss on the forum
                    a
                    a_vlasovApril 14, 2024, 4:41 p.m.
                    Мобильное приложение на C++Qt и бэкенд к нему на Django Rest Framework Евгений, добрый день! Такой вопрос. Верно ли следующее утверждение: Любое Android-приложение, написанное на Java/Kotlin чисто теоретически (пусть и с большими трудностями) можно написать и на C+…
                    Павел Дорофеев
                    Павел ДорофеевApril 14, 2024, 12:35 p.m.
                    QTableWidget с 2 заголовками Вот тут есть кастомный QTableView с многорядностью проект поддерживается, обращайтесь
                    f
                    fastrexApril 4, 2024, 2:47 p.m.
                    Вернуть старое поведение QComboBox, не менять индекс при resetModel Добрый день! У нас много проектов в которых используется QComboBox, в версии 5.5.1, когда модель испускает сигнал resetModel, currentIndex не менялся. В версии 5.15 при resetModel происходит try…
                    AC
                    Alexandru CodreanuJan. 19, 2024, 10:57 p.m.
                    QML Обнулить значения SpinBox Доброго времени суток, не могу разобраться с обнулением значение SpinBox находящего в делегате. import QtQuickimport QtQuick.ControlsWindow { width: 640 height: 480 visible: tr…

                    Follow us in social networks