PostgreSQL *

Свободная объектно-реляционная СУБД

Статьи Посты Новости Авторы Компании

k0rsakov 17 часов назад

CDC на примитивах

Простой

7 мин

724

PostgreSQL*Data Mining*Big Data*Хранилища данных*Data Engineering*

Туториал

CDC вам не "Centers for Disease Control and Prevention" а "Change data capture". В статье рассказано какие есть виды CDC и как реализовать один из CDC при помощи Debezium.

erogov 20 часов назад

«IT-Планета 2024»: задачи второго этапа по PostgreSQL

32 мин

787

Блог компании Postgres ProfessionalНенормальное программирование*PostgreSQL*SQL*

Вдохновившись прошлогодним опытом, мы продолжили начинание и снова проводим конкурс по SQL на международной олимпиаде «IT-Планета».

Конкурс состоит из трех этапов. Заочный теоретический тест собрал почти 3000 человек, из которых на следующий этап мы отобрали примерно 200. Вопросы для этого этапа были подготовлены моим коллегой, Евгением Давыдовым.

Второй этап — также заочный. Здесь участником было предложено подумать над пятью задачами моего авторства, о которых я сегодня и хочу рассказать.

Третий — очный — этап пройдет в конце мая; постараюсь не затягивать с отчетом, но пока храню интригующее молчание.

Поскольку все вводные слова про мотивацию я уже сказал в прошлый раз, сразу приступим к делу.

Приступить к делу

+18

ig_rudenko 21 час назад

PostgreSQL 16. Организация данных. Часть 1

Средний

14 мин

4.2K

Open source*PostgreSQL*Администрирование баз данных*

Из песочницы

PostgreSQL очень популярная СУБД.

Её используют во многих проектах, как новички, так и профессионалы. Однако не все понимают, как именно работает данная система и какое у неё внутренне устройство.

Давайте разберемся вместе на основе книги "PostgreSQL 16 изнутри" и официальной документации!

+17

alexeyminkin 6 мая в 13:36

Древовидные структуры в SQL в одну таблицу

Средний

11 мин

10K

PostgreSQL*SQL*

Из песочницы

Как реализовать хранение и работу каталога папок в PostgreSQL? Есть большое количество вариантов. Но хочется, чтобы реализация выглядела лаконично, не нарушала прозрачность выполняемых операций, не вызывала блокировок, не требовала большого вовлечения клиента в специфику работы и т.д. Потому сегодня попробуем реализовать хранение древовидных структур и работу с ними без использования триггеров, блокировок, дополнительных таблиц (представлений) и внешних инструментов в SQL.

+51

yanushu 3 мая в 16:15

Как аналитик учился java log читать. Часть первая: логи бывают разные

Средний

5 мин

1.7K

PostgreSQL*Java*Groovy & Grails*

Из песочницы

Когда я пришёл работать в компанию GreenData шесть лет назад, мои задачи были достаточно стандартными для аналитика, который работает с low-code решениями. Работа с объектной моделью, написание алгоритмов, настройка визуалов - всё что обычно выполняет начинающий специалист в данной области. Однако в процессе моей работы и роста иногда я сталкивался с необходимостью разбираться в тонкостях работы Java, а именно с ошибками, которые возникали в процессе её исполнения.

Эти встречи с Java сначала были случайностью, но со временем превратились в моё новое профессиональное увлечение. Каждый случай сбоя или нестандартного поведения программы становился для меня вызовом; я понял, что за ошибками стоят не просто коды и сообщения, а целые истории о том, как работает система. Этот интерес постепенно перерос в глубокое погружение в мир Java-логов, благодаря чему я стал одним из ведущих экспертов по анализу программных сбоев в компании.

imzorin 3 мая в 10:38

Цикл статей о Greenplum. Часть 1. GP под капотом

Средний

6 мин

3.7K

Блог компании Axenix (ex-Accenture)PostgreSQL*SQL*Хранилища данных*Data Engineering*

Обзор

Всем привет!

Как вы знаете, многие поставщики ПО ушли с российского рынка ввиду введённых санкций и многие компании столкнулись с необходимость заняться импортозамещением в кратчайшие сроки. Не стал исключением и наш заказчик. Целевой системой, на которое было принято решение мигрировать старое хранилище, стал Greenplum (далее GP) от компании Arenadata.

Этой статьей мы запускаем цикл материалов посвященных Greenplum. В рамках цикла мы разберем, как вообще устроен GP и как выглядит его архитектура. Постараемся выделить must have практики при работе с данным продуктом, а также обсудим, как можно спроектировать хранилище на GP, осуществлять мониторинг эффективности работы и многое другое. Данный цикл статей будет полезен как разработчикам БД, так и аналитикам.

+19

iqu 1 мая в 00:56

Большая иерархия в SQL запросе + PostgreSQL

Средний

6 мин

MySQL*PostgreSQL*SQL*SQLite*

Сначала запрос адаптирован для работы в PostgreSQL 15.6.

Затем работа запроса проверена на достаточно объемной иерархии - в качестве источника данных использована структура архива jdk-master.zip из OpenJDK 22

+17

badcasedaily1 28 апр в 15:29

Асимметричные и симметричные ключи в PostgreSQL

Простой

4 мин

Блог компании OTUSPostgreSQL*

Обзор

Привет, Хабр!

Как мы знаем, защита конфиденциальной информации — это неотъемлемая часть любого проекта. В статье поговорим про шифрование данных в PostgreSQL, а именно про шифрование с использованием как асимметричных, так и симметричных ключей.

Igor_Le 27 апр в 15:12

PGConf.Russia #10 (2024)

13 мин

1.6K

Блог компании Postgres ProfessionalPostgreSQL*

Юбилейная - 10-я - конференция PGConf.Russia опередила юбилей компании (Postgres Professional исполнилось 9 лет). А самая первая - PGConf.Russia 2015 - даже опередила саму компанию: конференция прошла в феврале, а официальный день рождения Postgres Professional 1 апреля 2015.

+18

demonuga1998 25 апр в 19:04

Распознавание, хранение и поиск лиц в базе данных

Средний

3 мин

11K

Python*PostgreSQL*Машинное обучение*Искусственный интеллект

Из песочницы

В этой статье я максимально коротко и просто объясню принцип распознавания, хранения и поиска лиц в базе данных. В качестве примера будет использована библиотека Insightface и база данных PostgreSQL.

+28

varanio 23 апр в 15:41

Пишем поиск семантически похожих текстов (или товаров) за полчаса на Go и Postgres (pgVector)

5 мин

6.4K

Блог компании KarunaВеб-разработка*PostgreSQL*Программирование*Go*

Туториал

Казалось бы, в посгресе и так есть неплохой полнотекстовый поиск (tsvector/tsquery), и вы из коробки можете проиндексировать ваши тексты, а потом поискать по ним. Но на самом деле это не совсем то, что нужно — такой поиск работает лишь по чётким совпадениям слов. Т.е. postgres не догадается, что "кошка гонится за мышью" — это довольно близко к "котёнок охотится на грызуна". Как же победить такую проблему?

TLDR:

Преобразовываем наши тексты в наборы чисел (векторы) при помощи API openAI.
Сохраняем векторы в базе с помощью pgvector.
Легко ищем близкие друг к другу векторы или ищем их по вектору-запросу.
Ускоряем индексами.

Читать дальше →

+24

MGorkov 23 апр в 09:03

Неожиданные последствия запуска PostgreSQL в Docker: замедление запросов в 100 раз

Средний

4 мин

39K

Блог компании ТензорPostgreSQL*

Кейс

У одного из клиентов нашей системы мониторинга PostgreSQL серверов возникла проблема сильного замедления запросов при запуске базы в Docker. В этой статье расскажем о возможных последствиях использования PostgreSQL в Docker с конфигурацией по умолчанию.

+94

koloskovv 22 апр в 15:14

Эффективное использование журнала регистрации и технологического журнала 1С в решении вопросов производительности

Простой

5 мин

3.8K

Блог компании SOFTPOINTВысокая производительность*PostgreSQL*Microsoft SQL Server*1С*

Эта статья носит своей целью продемонстрировать другой подход в анализе проблем производительности в системах 1С:Предприятие с применением журнала регистрации (ЖР) и технологического журнала (ТЖ).

Напомню, что ЖР логирует действия пользователей — кто, когда в каком объекте внес изменения, с какого компьютера, каким сеансом и т. п. ТЖ — это средство для логирования уже самой платформы. Для расследования проблем производительности информация из журналов очень полезна, но основное время уходит на её поиск, сопоставление с другими метриками и счетчиками мониторинга.

При проведении расследований мы сами часто сталкиваемся с проблемой длительной обработки и сопоставления данных журналов 1С с остальными метриками. И вот наконец руки дошли до парсинга журналов. С точки зрения анализа производительности все данные журналов нам не нужны. А какие нужны?

Вот! В этом как раз вся «соль» идеи.

Bright_Translate 21 апр в 13:00

Поиск по коду — это сложно

Простой

5 мин

6.6K

Блог компании RUVDS.comПоисковые технологии*PostgreSQL*Программирование*Поисковая оптимизация*

Обзор

Перевод

Функциональность поиска на Val Town не очень впечатляет. Сейчас в её основе лежит механизм ILIKE Postgres, работающий на основе алгоритма поиска подстроки: если искомое выражение в коде есть, оно выводится в результатах. Этот процесс не включает никакого ранжирования и очень слабо поддерживает запросы из нескольких слов. Более эффективный поиск является одной из самых желанных для нас возможностей.

Читать дальше →

+43

badcasedaily1 19 апр в 08:18

HyperLogLog в PostgreSQL

Простой

3 мин

1.9K

Блог компании OTUSPostgreSQL*

Обзор

HyperLogLog принадлежит к категории вероятностных структур данных, которые позволяют аппроксимировать количество уникальных элементов в больших наборах данных с удивительно низким потреблением памяти. HLL использует логарифмическую память.

В PostgreSQL HyperLogLog предоставляется как расширение, которое можно использовать для оценки уникальности пользователей, событий или любых других элементов.

В этой статье рассмотрим, как реализован HLL в PostgreSQL.

mojojojo 17 апр в 09:25

Безопасный Continuous Deployment БД по принципам DB-First

Средний

12 мин

3.3K

PostgreSQL*Java*Haskell*Администрирование баз данных*Системы сборки*

Туториал

В статье рассматривается Continuous Deployment для БД с бесшовными релизами за счёт обратно-совместимых обновлений и автоматизации проверок совместимости с помощью подхода DB-First.

alexmusyka 15 апр в 12:42

Потенциальные проблемы с автоинкрементным ключом. MySQL <8.0, PostgreSQL

Простой

6 мин

5.2K

MySQL*PostgreSQL*SQL*Администрирование баз данных*

Перевод

В данной публикации я поделюсь двумя основными причинами, по которым я предпочитаю избегать использования автоинкрементных полей в PostgreSQL и MySQL в будущих проектах. Вместо этого я предпочитаю использовать UUID-поля, за исключением случаев, когда есть очень веские аргументы против этого подхода.

+11

Pawga777 14 апр в 13:26

Создание реактивных сервисов Micronaut и Kotlin

Средний

11 мин

Высокая производительность*PostgreSQL*Программирование*Kotlin*Микросервисы*

Туториал

В данной статье обсудим создание REST-сервиса в “реактивном” исполнении. Приведу примеры кода на Kotlin в двух вариантах: Reactor и coroutines

Maksvelis 12 апр в 15:37

Выжимаем максимум из PostgreSQL

Средний

14 мин

16K

Блог компании SelectelPostgreSQL*IT-инфраструктура*Администрирование баз данных*

Обзор

Привет, Хабр! Меня зовут Максим, я работаю тестировщиком оборудования в Selectel Lab. В лаборатории мы занимаемся тестированием нового оборудования для дата-центров. О том, как мы измеряли производительность PostgreSQL на разных конфигурациях — под катом!

Читать дальше →

+66

zZoRexX 10 апр в 13:20

Реализация взаимодействия с БД через Middleware в Telegram-ботах

Простой

6 мин

3.9K

Python*PostgreSQL*

Из песочницы

Когда я начинал писать своих первых ботов с использованием базы данных, их код был очень плохим: он расходовал лишние ресурсы, а также была плохая архитектура проекта. Поэтому я хочу поделиться с вами своими знаниями, чтобы вы не наступали на те грабли, на которые наступал я. В проекте бота, который будет использован в качестве примера в данной статье, я использовал такие технологии, как aiogram, SQLAlchemy, alembic и Docker. В качестве СУБД выступает PostgreSQL. Приятного чтения!

2 3 ...

75 76

PostgreSQL *

CDC на примитивах

Новости

«IT-Планета 2024»: задачи второго этапа по PostgreSQL

PostgreSQL 16. Организация данных. Часть 1

Древовидные структуры в SQL в одну таблицу

Истории

Как аналитик учился java log читать. Часть первая: логи бывают разные

Цикл статей о Greenplum. Часть 1. GP под капотом

Большая иерархия в SQL запросе + PostgreSQL

Асимметричные и симметричные ключи в PostgreSQL

PGConf.Russia #10 (2024)

Распознавание, хранение и поиск лиц в базе данных

Пишем поиск семантически похожих текстов (или товаров) за полчаса на Go и Postgres (pgVector)

Неожиданные последствия запуска PostgreSQL в Docker: замедление запросов в 100 раз

Эффективное использование журнала регистрации и технологического журнала 1С в решении вопросов производительности

Ближайшие события

Поиск по коду — это сложно

HyperLogLog в PostgreSQL

Безопасный Continuous Deployment БД по принципам DB-First

Потенциальные проблемы с автоинкрементным ключом. MySQL <8.0, PostgreSQL

Создание реактивных сервисов Micronaut и Kotlin

Выжимаем максимум из PostgreSQL

Реализация взаимодействия с БД через Middleware в Telegram-ботах

Вклад авторов