Evgenii Legotckoi
Evgenii Legotckoi18 апреля 2022 г. 17:39

Django - Урок 058. Разрастание базы данных из-за таблицы django_session

Последнее время я заметил, что близится тот роковой момент, когда ккатастрофически перестанет хватать дискового пространства для сайта на хостинге. А дамп базы данных становится невероятно огромным, хотя очевидных предпосылок для этого никаких нет. Размер контента на сайте не растёт так быстро, да и количество зарегистрированных пользователей также не прибывает так быстро.

После изучения базы данных было обнаружено, что размер таблицы django_session просто гигантский почти 7 Гб, а размер индекса тоже достигает почти 6.5 Гб, при том, что размер самой базы данных 14 Гб.

При этом размер второй по величине таблицы всего 11 Мб и это стороннее приложение со списком городов. А размер третьей таблицы, которая содержит сообщения на форуме всего 8 Мб.

Соответственно было решено разобраться, почему это происходит и как исправлять.

Сейчас я скорее всего не открою ничего нового для тех, кто активно администрирует базы данных на PostgreSQL, но для новичков и тех, кто в основном занимается Django в качестве PET проекта, без профессионального использования, информация может быть полезной.


Как проверить размер таблицы

https://evileg.com/ru/knowledge/article/add/#
Для этого достаточно выполнить следующий запрос в интерфейсе администрирования PostreSQL. И получим отсортированный вывод информации по таблицам базы данных.

select table_name, pg_relation_size(quote_ident(table_name)), pg_size_pretty(pg_relation_size(quote_ident(table_name))) from information_schema.tables where table_schema = 'public' order by 2;

 forum_forumpost                        |          8290304 | 8096 kB
 cities_light_city                      |         11108352 | 11 MB
 django_session                         |       7225204736 | 6890 MB
(110 rows)

Как видите, в моём случае таблица djang_session за 6 лет существования сайта на движке Django разрослась очень сильно.
Спасибо DDOS посетителям, механизму создания ключей сессии для всех анонимных пользователей, а также тому, что по умолчанию PostgreSQL даже при удалении записей не уменьшает размер файла базы данных.

А размер базы данных можно посмотреть так

SELECT pg_size_pretty( pg_database_size('databasename') );
 pg_size_pretty 
----------------
 14 GB
(1 row)

Вот такой неприятный размерчик вышел - 14 GB.

Удаление сессий с истёкшим сроком

Когда сайт подвергается DDOS или просто наплыву пользователей, то создаётся огромное число сессий, которые обычно в Django не удаляются, а также дополнительно растёт индекс таблицы.

Поэтому первое, что нужно сделать, это удалить устаревшие сессии. Для этого в Django есть команда clearsessions .

Поэтому в консоли активируем python среду вашего проекта, переходим в папку с вашим проектом и выполняем следующую команду.

python manage.py clearsessions

Это удалит все старые сессии. Вы также можете настроить выполнение этой команды по расписанию через cron.
Например с помощью батарейки django-session-cleanup , для неё необходимо использование celery .

Запуск сборщика мусора

После того, как вы выполнили удаление старых сессий, вам необходимо освободить пространство занятое базой данных.
Это необходимо потому, что приоритет базы данных - это производительность, а не экономия дискового пространства. Таким образом файл базы данных разрастается за счёт роста индекса, а данных там уже давно нет. А также по умолчанию сборщик мусора не запускается сам по себе, для этого необходимо настраиваеть его запуск по расписанию, например с помощью демона.

Но лично я пока сделал это вручную. Сборщик мусора в PostgreSQL запускается командой vacuum .

vacuum FULL ANALYZE django_session;

После выполнения этой операции снова проверяю размер базы данных и вижу

SELECT pg_size_pretty( pg_database_size('databasename') );
 pg_size_pretty 
----------------
 494 MB
(1 row)

Теперь размер базы данных всего 494 MB, что не может не радовать.

Надо будет со временем настроить запуск сборщика мусора хотя бы раз в неделю, но об этом уже в следующей статье.

Рекомендуем хостинг TIMEWEB
Рекомендуем хостинг TIMEWEB
Стабильный хостинг, на котором располагается социальная сеть EVILEG. Для проектов на Django рекомендуем VDS хостинг.

Вам это нравится? Поделитесь в социальных сетях!

u
  • 15 мая 2022 г. 7:58
  • (ред.)

А если хранить сессии в SESSION_ENGINE = 'django.contrib.sessions.backends.signed_cookies' ?
Интересно стало насколько безопасно хранить сессии в печеньках... стоит оно того или нет?)

Evgenii Legotckoi
  • 15 мая 2022 г. 9:27

Думаю, что скорее всего это будет менее безопасно, но на практике я не проверял.

Комментарии

Только авторизованные пользователи могут публиковать комментарии.
Пожалуйста, авторизуйтесь или зарегистрируйтесь
г
  • ги
  • 23 апреля 2024 г. 12:51

C++ - Тест 005. Структуры и Классы

  • Результат:41баллов,
  • Очки рейтинга-8
l
  • laei
  • 23 апреля 2024 г. 6:19

C++ - Тест 004. Указатели, Массивы и Циклы

  • Результат:10баллов,
  • Очки рейтинга-10
l
  • laei
  • 23 апреля 2024 г. 6:17

C++ - Тест 003. Условия и циклы

  • Результат:50баллов,
  • Очки рейтинга-4
Последние комментарии
k
kmssr8 февраля 2024 г. 15:43
Qt Linux - Урок 001. Автозапуск Qt приложения под Linux как сделать автозапуск для флэтпака, который не даёт создавать файлы в ~/.config - вот это вопрос ))
АК
Анатолий Кононенко4 февраля 2024 г. 22:50
Qt WinAPI - Урок 007. Работаем с ICMP Ping в Qt Без строки #include <QRegularExpressionValidator> в заголовочном файле не работает валидатор.
EVA
EVA25 декабря 2023 г. 7:30
Boost - статическая линковка в CMake проекте под Windows Ошибка LNK1104 часто возникает, когда компоновщик не может найти или открыть файл библиотеки. В вашем случае, это файл libboost_locale-vc142-mt-gd-x64-1_74.lib из библиотеки Boost для C+…
J
JonnyJo25 декабря 2023 г. 5:38
Boost - статическая линковка в CMake проекте под Windows Сделал всё по-как у вас, но выдаёт ошибку [build] LINK : fatal error LNK1104: не удается открыть файл "libboost_locale-vc142-mt-gd-x64-1_74.lib" Хоть убей, не могу понять в чём дел…
G
Gvozdik18 декабря 2023 г. 18:01
Qt/C++ - Урок 056. Подключение библиотеки Boost в Qt для компиляторов MinGW и MSVC Для решения твой проблемы добавь в файл .pro строчку "LIBS += -lws2_32" она решит проблему , лично мне помогло.
Сейчас обсуждают на форуме
G
Gar22 апреля 2024 г. 2:46
Clipboard Как скопировать окно целиком в clipb?
DA
Dr Gangil Academics20 апреля 2024 г. 4:45
Unlock Your Aesthetic Potential: Explore MSC in Facial Aesthetics and Cosmetology in India Embark on a transformative journey with an msc in facial aesthetics and cosmetology in india . Delve into the intricate world of beauty and rejuvenation, guided by expert faculty and …
a
a_vlasov14 апреля 2024 г. 3:41
Мобильное приложение на C++Qt и бэкенд к нему на Django Rest Framework Евгений, добрый день! Такой вопрос. Верно ли следующее утверждение: Любое Android-приложение, написанное на Java/Kotlin чисто теоретически (пусть и с большими трудностями) можно написать и на C+…
Павел Дорофеев
Павел Дорофеев13 апреля 2024 г. 23:35
QTableWidget с 2 заголовками Вот тут есть кастомный QTableView с многорядностью проект поддерживается, обращайтесь
f
fastrex4 апреля 2024 г. 1:47
Вернуть старое поведение QComboBox, не менять индекс при resetModel Добрый день! У нас много проектов в которых используется QComboBox, в версии 5.5.1, когда модель испускает сигнал resetModel, currentIndex не менялся. В версии 5.15 при resetModel происходит try…

Следите за нами в социальных сетях