Руслан Волшебник
Жел. 13, 2019, 6:53 Т.Қ.

Как уменьшить количество запросов в Django ORM?

Django, ORM, DataBase

Доброго времени суток.

Задача такая.
Нужно получить QuerySet, который состоит из вопросов разных категорий. Вопросы должны быть разной сложности, а для каждой сложности своё количество. Все вопросы нужно вытащить из бд в случайном порядке.

Есть вот такой код.

  1. # models.py
  2. class Question(models.Model):
  3. EASY = 1
  4. MEDIUM = 2
  5. HARD = 3
  6.  
  7. DIFFICULTY_CHOICES = (
  8. (EASY, 'Легкий'),
  9. (MEDIUM, 'Средний'),
  10. (HARD, 'Сложный')
  11. )
  12.  
  13. text = models.TextField(max_length=300, null=True, verbose_name='текст вопроса')
  14. categories = models.ManyToManyField(Category, related_name="questions", verbose_name='категории')
  15. difficulty = models.PositiveSmallIntegerField(choices=DIFFICULTY_CHOICES, default=MEDIUM, verbose_name='сложность')
  1. questions = None
  2.  
  3. for category in categories:
  4. category_id = category['id']
  5.  
  6. easy_question_count = category['easy_question_count']
  7. medium_question_count = category['medium_question_count']
  8. hard_question_count = category['hard_question_count']
  9.  
  10. easy_questions = Question.objects.filter(categories__id=category_id, difficulty=1)
  11. medium_questions = Question.objects.filter(categories__id=category_id, difficulty=2)
  12. hard_questions = Question.objects.filter(categories__id=category_id, difficulty=3)
  13.  
  14. q1 = easy_questions.objects.random(easy_question_count)
  15. q2 = medium_questions.objects.random(medium_question_count)
  16. q3 = hard_questions.objects.random(hard_question_count)
  17.  
  18. if questions:
  19. questions = questions.union(q1).union(q2).union(q3)
  20. else:
  21. questions = q1.union(q2).union(q3)

Метод random взят из библиотеки https://github.com/rremizov/django-random-queryset.git
Это библиотека позволяет получить QuerySet определенной длины, состоящий из элементов в случайном порядке.

Вот скрин запросов.

Это для одной категории, а если категорий, к примеру 10, то получится 60 запросов.
Как это дело оптимизировать? Ломаю голову 3 дня.

Может кто-нибудь подсказать, как мне решить задачу?

3

Ол саған ұнайды ма? Әлеуметтік желілерде бөлісіңіз!

9
Evgenii Legotckoi
  • Жел. 13, 2019, 8 Т.Қ.

Добрый день,

Я правильно понимаю, что вы в итоге сваливаете в кучу все вопросы в объект questions?

Возможно, что стоит это переписать иначе, например так

  1. questions = None
  2.  
  3. easy_questions = Question.objects.filter(categories__in=categories, difficulty=1)
  4. medium_questions = Question.objects.filter(categories__in=categories, difficulty=2)
  5. hard_questions = Question.objects.filter(categories__in=categories, difficulty=3)
  6.  
  7. q1 = easy_questions.objects.random(easy_questions.count())
  8. q2 = medium_questions.objects.random(medium_questions.count())
  9. q3 = hard_questions.objects.random(hard_questions.count())
  10.  
  11. questions = q1.union(q2).union(q3)
    Evgenii Legotckoi
    • Жел. 13, 2019, 8:02 Т.Қ.

    Ну а если вам нужно просто срандомизировать всё в одной куче, то я бы так попробовал написать

    1. questions = Question.objects.filter(categories__in=categories)
    2. questions = questions.objects.random(questions.count())
      Руслан Волшебник
      • Жел. 13, 2019, 8:19 Т.Қ.

      -"Я правильно понимаю, что вы в итоге сваливаете в кучу все вопросы в объект questions?"
      -Да. Это для дальнейших манипуляций) Возможно, переделаю.

      Проблема в том, что для каждой категории нужно разное кол-во вопросов.
      Например:
      Категория биология, 1 легкий вопрос, 2 средних и 3 сложных;
      Категория математика, 2 легких, 2 средних и 2 сложных....и т.д.

        Илья Чичак
        • Жел. 13, 2019, 8:26 Т.Қ.
        • (өңделген)

        Кстати, сделать случайный порядок можно крайне просто:

        1. Question.objects.all().order_by('?')

        Документация

        Вообще, я слабо понял задачу. Если чуть более понятно сможете описать ее, возможно, смогу помочь

          Руслан Волшебник
          • Жел. 13, 2019, 8:42 Т.Қ.
          • (өңделген)

          На stackoverflow пишут, что это дорогая операция и лучше по-другому.
          В доках пишут:
          Note: order_by('?') queries may be expensive and slow, depending on the database backend you’re using.

          Я конечно не спец(всего лишь любитель), но я попробую таким способ тоже, может в моем случае будет всё норм.

          На счёт задачи.
          Есть, к примеру, категории: биология, математика, физика...и т.д.
          В каждой категории есть вопросы. У всех вопросов есть сложность от 1 до 3.

          Нужно вот что.
          Из категории физика нужно достать в случайном порядке 3 легких вопроса, 2 средних и 1 сложный;
          Из категории математика 1 легкий, 3 средних, 2 сложных. Тоже в случайном порядке .

          Моя проблема в том, что чем больше категорий, тем больше запросов.
          Если нужно сделать поиск вопросов только по 1-ой категории, то 6 запросов, по 2-ум категориям 12 запросов и т.д.

          Хотелось бы, чтобы при увеличении количества категорий, количество запросов не увеличивалось.

            Evgenii Legotckoi
            • Жел. 13, 2019, 8:59 Т.Қ.

            Руслан, посмотрите исходники той библиотеки, которую вы использовали. Там как раз и используется order_by('?') в конечном итоге, а ещё перед этим используется агрегация id всех объектов в queryset. Метод aggregate , кстати, тоже достаточно дорогой, я стараюсь избегать его или кешировать.

            Так что в методе random , который выполняет данная библиотека используется сразу два дорогостоящих запроса, хорошо хоть там нет distinct , иначе совсем вилы были бы.

            Я вашу задачу понял, но вопрос действительно сложный, пока мыслей нет.

              Evgenii Legotckoi
              • Жел. 13, 2019, 9:02 Т.Қ.

              К слову говоря, этот метод order_by('?') мне кажется относительно рандомным, поскольку он выполняет сортировку по случайному столбцу и в случайном направлении (по алфавиту/ против алфавита), если я правильно понял его суть. В общем он настолько рандомный, сколько у вас полей в модели.

                Руслан Волшебник
                • Жел. 13, 2019, 9:16 Т.Қ.
                • (өңделген)

                Да, я посмотрел, вы абсолютно правы. Единственное, если я правильно понял, если срабатывает условие

                1. if (aggregates["max_id"] - aggregates["min_id"]) + 1 == aggregates["count"]:
                2. return self.filter(
                3. id__in=strategies.min_max(
                4. amount,
                5. aggregates["min_id"],
                6. aggregates["max_id"],
                7. aggregates["count"],
                8. )
                9. )

                то он возвращает QuerySet минуя order_by('?').

                  Руслан Волшебник
                  • Жел. 15, 2019, 3:38 Т.Қ.
                  • (өңделген)

                  В общем, пока что я решил отказаться от этой затеи, и сделал выбор количества легких, средних и сложных вопросов не для каждой категории отдельно, а для всех.

                  И да, после использования union, нельзя юзать filter, а так как мне нужно потом отфильтровать ещё раз, то я сделал так

                  1. easy_question_count = quiz.easy_question_count
                  2. medium_question_count = quiz.medium_question_count
                  3. hard_question_count = quiz.hard_question_count
                  4.  
                  5. easy_questions = questions.filter(difficulty=1)
                  6. medium_questions = questions.filter(difficulty=2)
                  7. hard_questions = questions.filter(difficulty=3)
                  8.  
                  9. easy_questions = get_random_questions(easy_questions, easy_question_count)
                  10. medium_questions = get_random_questions(medium_questions, medium_question_count)
                  11. hard_questions = get_random_questions(hard_questions, hard_question_count)
                  12.  
                  13. question_ids = easy_questions.union(medium_questions).union(hard_questions).values_list('id', flat=True)
                  14. questions = questions.filter(id__in=question_ids)
                  15.  

                  А для получения рандомных вопросов нужного мне количества написал вот такую функцию.

                  1. def get_random_questions(questions, question_count):
                  2. question_id_array = list(questions.values_list('id', flat=True))
                  3. random_ids = random.sample(question_id_array, min(len(question_id_array), question_count))
                  4. questions = questions.filter(id__in=random_ids)
                  5. return questions

                  Получилось всего 5 запросов.

                  Готов выслушать критику, если есть)

                    Пікірлер

                    Тек рұқсаты бар пайдаланушылар ғана пікір қалдыра алады.
                    Кіріңіз немесе Тіркеліңіз