Руслан Волшебник
13 декабря 2019 г. 18:53

Как уменьшить количество запросов в Django ORM?

Django, ORM, DataBase

Доброго времени суток.

Задача такая.
Нужно получить QuerySet, который состоит из вопросов разных категорий. Вопросы должны быть разной сложности, а для каждой сложности своё количество. Все вопросы нужно вытащить из бд в случайном порядке.

Есть вот такой код.

  1. # models.py
  2. class Question(models.Model):
  3. EASY = 1
  4. MEDIUM = 2
  5. HARD = 3
  6.  
  7. DIFFICULTY_CHOICES = (
  8. (EASY, 'Легкий'),
  9. (MEDIUM, 'Средний'),
  10. (HARD, 'Сложный')
  11. )
  12.  
  13. text = models.TextField(max_length=300, null=True, verbose_name='текст вопроса')
  14. categories = models.ManyToManyField(Category, related_name="questions", verbose_name='категории')
  15. difficulty = models.PositiveSmallIntegerField(choices=DIFFICULTY_CHOICES, default=MEDIUM, verbose_name='сложность')
  1. questions = None
  2.  
  3. for category in categories:
  4. category_id = category['id']
  5.  
  6. easy_question_count = category['easy_question_count']
  7. medium_question_count = category['medium_question_count']
  8. hard_question_count = category['hard_question_count']
  9.  
  10. easy_questions = Question.objects.filter(categories__id=category_id, difficulty=1)
  11. medium_questions = Question.objects.filter(categories__id=category_id, difficulty=2)
  12. hard_questions = Question.objects.filter(categories__id=category_id, difficulty=3)
  13.  
  14. q1 = easy_questions.objects.random(easy_question_count)
  15. q2 = medium_questions.objects.random(medium_question_count)
  16. q3 = hard_questions.objects.random(hard_question_count)
  17.  
  18. if questions:
  19. questions = questions.union(q1).union(q2).union(q3)
  20. else:
  21. questions = q1.union(q2).union(q3)

Метод random взят из библиотеки https://github.com/rremizov/django-random-queryset.git
Это библиотека позволяет получить QuerySet определенной длины, состоящий из элементов в случайном порядке.

Вот скрин запросов.

Это для одной категории, а если категорий, к примеру 10, то получится 60 запросов.
Как это дело оптимизировать? Ломаю голову 3 дня.

Может кто-нибудь подсказать, как мне решить задачу?

3

Вам это нравится? Поделитесь в социальных сетях!

9
Evgenii Legotckoi
  • 13 декабря 2019 г. 20:00

Добрый день,

Я правильно понимаю, что вы в итоге сваливаете в кучу все вопросы в объект questions?

Возможно, что стоит это переписать иначе, например так

  1. questions = None
  2.  
  3. easy_questions = Question.objects.filter(categories__in=categories, difficulty=1)
  4. medium_questions = Question.objects.filter(categories__in=categories, difficulty=2)
  5. hard_questions = Question.objects.filter(categories__in=categories, difficulty=3)
  6.  
  7. q1 = easy_questions.objects.random(easy_questions.count())
  8. q2 = medium_questions.objects.random(medium_questions.count())
  9. q3 = hard_questions.objects.random(hard_questions.count())
  10.  
  11. questions = q1.union(q2).union(q3)
    Evgenii Legotckoi
    • 13 декабря 2019 г. 20:02

    Ну а если вам нужно просто срандомизировать всё в одной куче, то я бы так попробовал написать

    1. questions = Question.objects.filter(categories__in=categories)
    2. questions = questions.objects.random(questions.count())
      Руслан Волшебник
      • 13 декабря 2019 г. 20:19

      -"Я правильно понимаю, что вы в итоге сваливаете в кучу все вопросы в объект questions?"
      -Да. Это для дальнейших манипуляций) Возможно, переделаю.

      Проблема в том, что для каждой категории нужно разное кол-во вопросов.
      Например:
      Категория биология, 1 легкий вопрос, 2 средних и 3 сложных;
      Категория математика, 2 легких, 2 средних и 2 сложных....и т.д.

        Илья Чичак
        • 13 декабря 2019 г. 20:26
        • (ред.)

        Кстати, сделать случайный порядок можно крайне просто:

        1. Question.objects.all().order_by('?')

        Документация

        Вообще, я слабо понял задачу. Если чуть более понятно сможете описать ее, возможно, смогу помочь

          Руслан Волшебник
          • 13 декабря 2019 г. 20:42
          • (ред.)

          На stackoverflow пишут, что это дорогая операция и лучше по-другому.
          В доках пишут:
          Note: order_by('?') queries may be expensive and slow, depending on the database backend you’re using.

          Я конечно не спец(всего лишь любитель), но я попробую таким способ тоже, может в моем случае будет всё норм.

          На счёт задачи.
          Есть, к примеру, категории: биология, математика, физика...и т.д.
          В каждой категории есть вопросы. У всех вопросов есть сложность от 1 до 3.

          Нужно вот что.
          Из категории физика нужно достать в случайном порядке 3 легких вопроса, 2 средних и 1 сложный;
          Из категории математика 1 легкий, 3 средних, 2 сложных. Тоже в случайном порядке .

          Моя проблема в том, что чем больше категорий, тем больше запросов.
          Если нужно сделать поиск вопросов только по 1-ой категории, то 6 запросов, по 2-ум категориям 12 запросов и т.д.

          Хотелось бы, чтобы при увеличении количества категорий, количество запросов не увеличивалось.

            Evgenii Legotckoi
            • 13 декабря 2019 г. 20:59

            Руслан, посмотрите исходники той библиотеки, которую вы использовали. Там как раз и используется order_by('?') в конечном итоге, а ещё перед этим используется агрегация id всех объектов в queryset. Метод aggregate , кстати, тоже достаточно дорогой, я стараюсь избегать его или кешировать.

            Так что в методе random , который выполняет данная библиотека используется сразу два дорогостоящих запроса, хорошо хоть там нет distinct , иначе совсем вилы были бы.

            Я вашу задачу понял, но вопрос действительно сложный, пока мыслей нет.

              Evgenii Legotckoi
              • 13 декабря 2019 г. 21:02

              К слову говоря, этот метод order_by('?') мне кажется относительно рандомным, поскольку он выполняет сортировку по случайному столбцу и в случайном направлении (по алфавиту/ против алфавита), если я правильно понял его суть. В общем он настолько рандомный, сколько у вас полей в модели.

                Руслан Волшебник
                • 13 декабря 2019 г. 21:16
                • (ред.)

                Да, я посмотрел, вы абсолютно правы. Единственное, если я правильно понял, если срабатывает условие

                1. if (aggregates["max_id"] - aggregates["min_id"]) + 1 == aggregates["count"]:
                2. return self.filter(
                3. id__in=strategies.min_max(
                4. amount,
                5. aggregates["min_id"],
                6. aggregates["max_id"],
                7. aggregates["count"],
                8. )
                9. )

                то он возвращает QuerySet минуя order_by('?').

                  Руслан Волшебник
                  • 15 декабря 2019 г. 15:38
                  • (ред.)

                  В общем, пока что я решил отказаться от этой затеи, и сделал выбор количества легких, средних и сложных вопросов не для каждой категории отдельно, а для всех.

                  И да, после использования union, нельзя юзать filter, а так как мне нужно потом отфильтровать ещё раз, то я сделал так

                  1. easy_question_count = quiz.easy_question_count
                  2. medium_question_count = quiz.medium_question_count
                  3. hard_question_count = quiz.hard_question_count
                  4.  
                  5. easy_questions = questions.filter(difficulty=1)
                  6. medium_questions = questions.filter(difficulty=2)
                  7. hard_questions = questions.filter(difficulty=3)
                  8.  
                  9. easy_questions = get_random_questions(easy_questions, easy_question_count)
                  10. medium_questions = get_random_questions(medium_questions, medium_question_count)
                  11. hard_questions = get_random_questions(hard_questions, hard_question_count)
                  12.  
                  13. question_ids = easy_questions.union(medium_questions).union(hard_questions).values_list('id', flat=True)
                  14. questions = questions.filter(id__in=question_ids)
                  15.  

                  А для получения рандомных вопросов нужного мне количества написал вот такую функцию.

                  1. def get_random_questions(questions, question_count):
                  2. question_id_array = list(questions.values_list('id', flat=True))
                  3. random_ids = random.sample(question_id_array, min(len(question_id_array), question_count))
                  4. questions = questions.filter(id__in=random_ids)
                  5. return questions

                  Получилось всего 5 запросов.

                  Готов выслушать критику, если есть)

                    Комментарии

                    Только авторизованные пользователи могут публиковать комментарии.
                    Пожалуйста, авторизуйтесь или зарегистрируйтесь
                    • Последние комментарии
                    • Evgenii Legotckoi
                      16 апреля 2025 г. 17:08
                      Благодарю за отзыв. И вам желаю всяческих успехов!
                    • IscanderChe
                      12 апреля 2025 г. 17:12
                      Добрый день. Спасибо Вам за этот проект и отдельно за ответы на форуме, которые мне очень помогли в некоммерческих пет-проектах. Профессиональным программистом я так и не стал, но узнал мно…
                    • AK
                      1 апреля 2025 г. 11:41
                      Добрый день. В данный момент работаю над проектом, где необходимо выводить звук из программы в определенное аудиоустройство (колонки, наушники, виртуальный кабель и т.д). Пишу на Qt5.12.12 поско…
                    • Evgenii Legotckoi
                      9 марта 2025 г. 21:02
                      К сожалению, я этого подсказать не могу, поскольку у меня нет необходимости в обходе блокировок и т.д. Поэтому я и не задавался решением этой проблемы. Ну выглядит так, что вам действитель…
                    • VP
                      9 марта 2025 г. 16:14
                      Здравствуйте! Я устанавливал Qt6 из исходников а также Qt Creator по отдельности. Все компоненты, связанные с разработкой для Android, установлены. Кроме одного... Когда пытаюсь скомпилиров…