Распределённые системы *

Нюансы проектирования распределенных систем

Шардирование баз данных и проектирование систем

6 мин

5.6K

Блог компании Издательский дом «Питер»Высокая производительность*Программирование*Администрирование баз данных*Распределённые системы*

Перевод

Шардирование базы данных — это процесс её разделения на несколько машин, что способствует масштабируемости приложения. Механизм шардирования предполагает разбиение данных на два или более мелких фрагмента, называемых логическими шардами. Затем логические блоки распределяются по отдельным узлам базы данных, называемым физическими блоками, каждый из которых может содержать несколько логических блоков.

Такой подход позволяет избежать проблем с производительностью, возникающих, когда одна из машин работает в условиях перегрузки, и обеспечивает более экономичное и грамотное масштабирование. По мере увеличения объема данных и трафика все чаще возникает необходимость горизонтального масштабирования путем добавления новых машин, а не вертикального путем модернизации одного большого сервера.

Читать дальше →

+11

appp_master 7 мая в 16:00

Unit-тестирование Flink-операторов, Job: Flink MiniCluster

10 мин

558

Блог компании МТСJava*Big Data*Распределённые системы*Data Engineering*

Привет, Хабр! С вами вновь Александр Бобряков, техлид в команде МТС Аналитики. И я с очередной статьёй из цикла про фреймворк Apache Flink.

В предыдущей части я рассказал, как тестировать stateless- и stateful-операторы Flink с использованием вспомогательных TestHarness-абстракций, предоставляемых Flink.

В этой статье напишем тесты на всю джобу с использованием мини-кластера Flink и при помощи JUnit Extension. Ещё мы начнём выделять удобные вспомогательные абстракции для тестов, которые понадобятся позже.

nezhibitskiy 27 апр в 10:59

Остаться в живых (keepalive) feat. HTTP/2, Go & gRPC-Go

Простой

7 мин

4.8K

Блог компании Ozon TechПрограммирование*Сетевые технологии*Go*Распределённые системы*

Привет, Хабр!) Меня зовут Ильяс. В этой статье мы разберём известную идею — keepalive в межсервисном взаимодействии, которая спасла уже не одну компанию в трудное время :). Но чтобы добавить интереса, мы разберём, какие проблемы в keepalive принесли современные технологии (ведь что может пойти не так с этой простой идеей?). Поэтому в статье мы рассмотрим механизмы, которые позволяют проверять стабильность соединения между клиентом и сервером в случае, когда обычные TCP keepalive из-за сложности архитектуры не могут определить состояние сервера.

Остаться в живых

+37

super_botan 16 апр в 15:05

Шардирование (sharding). Эпизод 2: шардирование по гео

Средний

13 мин

1.2K

Высокая производительность*Хранение данных*Распределённые системы*

Viam supervadet vadens (дорогу осилит идущий)

Есть много счастливчиков, которым повезло работать в ситуации, когда объёмы по-настоящему огромны и требования кажутся невыполнимыми. Но есть те, кому по настоящем крупно повезло! Я говорю о тех, кто решал задачи в пространствах, где размерность больше 1.

Давайте разбросаем осколки по всей земле?

Разбрасываем?

romais 9 апр в 09:20

Пет-проект: путь от «простого получения опыта» до «продукта, способного приносить пользу IT сообществу»

Простой

3 мин

2.7K

Анализ и проектирование систем*Развитие стартапаРаспределённые системы*Микросервисы*

Из песочницы

В мире современных технологий и инноваций роль аналитика становится все более важной и востребованной. Однако, каким образом можно развивать свои аналитические навыки и экспертизу, чтобы выделиться среди конкурентов и создать что-то уникальное?

Один из способов – ведение пет-проектов. В этой статье я затронул тему, как пет-проект может стать не только практичным инструментом для развития аналитических навыков, но и возможностью создания полезного продукта, способного удовлетворить потребности рынка.

А также расскажу о своем пет-проекте, который может стать таковым.

npoperechnyi 4 апр в 17:35

Смарт-контракты на WebAssembly: зачем это надо и как работает

Средний

10 мин

2.7K

Блог компании Web3 TechДецентрализованные сети*Rust*Распределённые системы*WebAssembly*

Обзор

В последнее время многие блокчейн-платформы для исполнения смарт-контрактов переключились на WASM — WebAssembly. Мы не стали исключением, и в последнем обновлении тоже добавили WebAssembly как альтернативу привычному Docker. В этом посте мы расскажем, для каких задач нам потребовался именно WASM, что мы достигли с ним на сегодня и как WASM отражается на производительности блокчейна.

+16

super_botan 2 апр в 19:31

Шардирование (sharding). Эпизод 1: Начало и шардирование по идентификатору

Средний

11 мин

6.2K

Высокая производительность*Хранение данных*Распределённые системы*

✏️ Технотекст 2023

Divide et impera (разделяй и властвуй) – древний принцип для управления чем-то большим и сложным.

Многие из нас программируют. Многие из нас делают системы, сложные системы. Но некоторым повезло работать в ситуации, когда объёмы по-настоящему огромны и требования кажутся невыполнимыми. Шардировние – один из излюбленных счастливчиками, которых зовут приключения, приемов.

Что-нибудь разбить на кусочки – это круто! Переходите на сторону шардирования у нас есть печеньки!

За кусочками!!!

+23

vasilisq 29 мар в 14:00

Проектируем микросервисы с Reactive Manifesto: 4 принципа распределенных систем

Средний

12 мин

2.2K

Блог компании Lamoda TechПрограммирование*Проектирование и рефакторинг*Распределённые системы*Микросервисы*

Обзор

Работаете с распределенными системами или только пытаетесь к ним подобраться? Проектировать такие системы с нуля бывает сложно и страшно: чтобы учесть все нюансы, нужен определенный багаж знаний.

На помощь приходит Reactive Manifesto — документ, который обобщил опыт целого ряда компаний по созданию распределенных систем. Манифест формулирует главные принципы, на которые стоит опираться на этапе проектирования и эксплуатации таких систем.

Меня зовут Андрей Василевский, я системный архитектор в Lamoda Tech. В этой статье я на примерах из своей работы покажу, как применять Reactive Manifesto на практике. Статья будет полезна тем, кто только начал изучать распределенные системы, хочет закрепить теорию или тем, кто хочет структурировать проектирование микросервисов в своей компании.

+24

unistory 29 мар в 10:30

Нескучная стеганография, или как мы зашифровали секретные ключи пользователей в джипегах

Средний

10 мин

Криптография*Хранение данных*Хранилища данных*Развитие стартапаРаспределённые системы*

Из песочницы

Рассказываем, как использовать методы стеганографии и шифрования в децентрализованных сервисах на IPFS. Исключаем риски, связанные с централизованным хранением логинов и паролей. Используем метод LSB, «наименьший значащий бит». Внутри статьи — примеры кода на C# и алгоритме AES для шифрования и расшифровки.

ru_vds 27 мар в 16:00

Актуально ли сегодня ООП?

Средний

11 мин

58K

Блог компании RUVDS.comПрограммирование*ООП*Управление разработкой*Распределённые системы*

Мнение

Перевод

Почти каждый день возникают дискуссии с критикой или восхвалением объектно-ориентированного программирования. «Java устарела!», «Java потрясающая!». В этой статье я проведу прагматичное исследование ООП на 2024 год.

Термин объектно-ориентированное программирование придумал Алан Кэй. Кэй был членом команды PARC, которая изобрела графический интерфейс пользователя, сделавший таким полезным современный Интернет, персональные компьютеры, планшеты и смартфоны. Ещё она изобрела некоторые из объектно-ориентированных языков, на которых мы сегодня реализуем эти GUI.

Если отсечь все эмоции, связанные с ООП, то что останется? По-прежнему ли ООП является эффективным инструментом разработки ПО, или оно превратилось в устаревшее увлечение? Профессионалам важно знать ответ на этот вопрос!

Читать дальше →

+65

179

justwack 27 мар в 09:53

Дизайн высоконагруженных приложений будущего. Путешествие без сценария с Мартином Клеппманом

Простой

19 мин

1.3K

Программирование*Администрирование баз данных*Распределённые системы*Интервью

Интервью

Перевод

Jesse Anderson, директор Big Data Institute, и Martin Kleppmann, автор книги «Высоконагруженные приложения. Программирование, масштабирование, поддержка», вместе исследуют меняющийся ландшафт обработки данных. Они начинают с истории создания книги Мартина, подчеркивая важность искусства задавать правильные вопросы. Мартин рассказывает об изменениях, произошедших в отрасли с 2017 года, подчеркивая рост облачных сервисов. Затем беседа приобретает новый поворот, когда Мартин погружается в академические круги, делясь своими соображениями о программном обеспечении для совместной работы на основе локального подхода и увлекательном мире Automerge. Начинающие инженеры‑программисты получат несколько советов о том, как найти тонкий баланс между простотой и гибкостью. В завершение обсуждают о различных карьерных путях в динамичной сфере инженерии данных, что делает разговор полезным для профессионалов на любом этапе их пути.

bitcoin-translated 20 мар в 19:39

Анализ форка Биткоина 2013 года: централизованное принятие решений спасло положение

Средний

14 мин

1.7K

Криптография*Open source*Распределённые системы*Криптовалюты

Ретроспектива

Перевод

28 июля 2015 г.

11 марта 2013 года Биткоин пережил технический кризис. Версии 0.7 и 0.8 программного обеспечения отличались друг от друга в поведении из-за ошибки, что привело к разделению цепочки блоков. Учитывая, насколько катастрофичным может быть хардфорк, кризис был быстро разрешен с удивительно малым ущербом благодаря исключительной компетентности ответственных разработчиков.

appp_master 20 мар в 14:26

Как провести unit-тестирование Flink-операторов: TestHarness

11 мин

553

Блог компании МТСJava*Big Data*Распределённые системы*Data Engineering*

Привет всем, на связи снова Александр Бобряков, техлид в команде МТС Аналитики. Продолжаем цикл статей про фреймворк Apache Flink.

Напомню, в предыдущих частях я рассказывал про построение пайплайна Kafka-to-Kafka с промежуточным разделением потока и дедупликацией событий. Также в предыдущей статье я рассказал, как можно динамически определить выходной Kafka-топик для каждого отправляемого события.

Начиная с этой статьи начнём разбирать, как тестировать всё наше приложение Flink + Spring. Многие описанные подходы вполне применимы и в любом другом обычном Spring-приложении, поэтому, надеюсь, вы найдёте для себя что-то новое.

В данной статье мы рассмотрим, как протестировать stateless- и stateful-операторы Flink с помощью абстракций TestHarness.

eivanov 20 мар в 11:07

Когда одного Postgres'a мало: сравнение производительности PostgreSQL и распределенных СУБД

Сложный

12 мин

11K

Блог компании YDBВысокая производительность*PostgreSQL*Администрирование баз данных*Распределённые системы*

Перевод

Общеизвестно, что PostgreSQL - крайне эффективная СУБД с богатой функциональностью. При этом не секрет, что PostgreSQL масштабируется только вертикально и её производительность ограничена возможностями одного сервера.

Написано много хороших постов, в которых сравнивают архитектуру монолитных и распределенных СУБД. К сожалению, обычно авторы ограничиваются теоретическим сравнением и не приводят конкретные цифры. Данный пост же наоборот основан на эмпирическом исследовании с использованием бенчмарка TPC-C, который является промышленным стандартом для оценки производительности транзакционных СУБД (On-Line Transaction Processing, OLTP).

Мы расскажем, когда именно одного Postgres'a становится мало, и какие возможны компромиссы между производительностью и надежностью. Для тех, кто не готов к компромиссам, мы покажем, что могут предложить такие распределенные СУБД, как CockroachDB и YDB.

+27

EmperorSith 20 мар в 09:30

Как управлять распределённой системой, не привлекая внимания санитаров

Средний

Блог компании 05.ruУправление e-commerce*Распределённые системы*

Из песочницы

Привет! Меня зовут Александр Попов, я tech lead команды маркетплейса 05.ru. Сейчас мы занимаемся бэком маркетплейса и некоторыми другими сервисами на рынке Дагестана.

При разработке серверной части маркетплейса мы сразу решили строить её в распределённой архитектуре. Эта статья о том, как хаос распределённых систем привёл нас к хореографии и почему мы в итоге маршируем в сторону оркестрации. Мы ещё на пути внедрения изменений, но я решил рассказать об этом сейчас, чтобы в следующий раз сделать вторую статью — с результатами. Заодно посмотрим, совпадут ли ожидания с реальностью. По ходу статьи будет много схем без котиков, но вы держитесь.

+12

klauss_z 19 мар в 17:11

Блокчейн для чайников: создаем свой первый распределенный реестр

Простой

9 мин

4.6K

Блог компании Web3 TechДецентрализованные сети*Системное администрирование*Анализ и проектирование систем*Распределённые системы*

Туториал

Привет, Хабр! На связи Николай, главный редактор Web3 Tech. Как можно предположить по должности, опыта в разработке я почти не имею. Год назад закончил мини-курс по Python, сделал об этом пост и с тех пор код не писал. Но недавно набрался смелости, заручился посильной поддержкой коллег и решил создать, пусть и локальную, но все же свою блокчейн-сеть!

В блоге Web3 Tech уже публиковали соответствующий гайд, но в нем отсутствовали некоторые детали, которые могут быть неочевидны пользователям моего уровня. В этом посте я в подробностях опишу весь путь с чистого листа: от чистого компьютера, которого не касалась рука программиста, до рабочей среды с функционирующим блокчейном на три ноды и мониторингом. Постараюсь сохранить все детали, о которые может споткнуться тот, кто первый раз приблизился к разработке.

maestroes 18 мар в 09:06

Лучшие практики для надёжной работы с RabbitMQ

Простой

13 мин

21K

Блог компании ТочкаIT-инфраструктура*Распределённые системы*Микросервисы*

Туториал

Привет, Хабр! Я Женя, архитектор интеграционной платформы в Точке, отвечаю за асинхронный обмен сообщениями между внутренними сервисами, за ESB и за брокеры сообщений.

В этой статье я постарался кратко и последовательно изложить основные моменты, о которых полезно помнить при использовании RabbitMQ, если важны стабильность обмена и сохранность данных.

В первую очередь материал рассчитан на разработчиков, которым ещё не приходилось погружаться в тонкости работы с RabbitMQ или использовать его вообще. Более опытным читателям статья может пригодиться в качестве компактной и упорядоченной выжимки из уже знакомых статей, вебинаров и многочисленных страниц документации.

Следуй за белым кроликом

+59

powerman 15 мар в 12:11

Пиррова победа Domain-Driven Design

Сложный

7 мин

11K

Программирование*Анализ и проектирование систем*Проектирование и рефакторинг*Распределённые системы*Микросервисы*

Мнение

TL;DR: DDD неизбежно ведёт к избыточному (на порядки больше минимально необходимого) количеству саг в проекте, которые, в свою очередь, неизбежно ведут к нарушению целостности данных в БД.

DDD вполне успешно решает поставленную задачу: дать разработчикам инструменты, которые позволят им справиться (корректно реализовать и поддерживать) со сложной предметной областью. Но эта победа оказалась пирровой: инструменты, обеспечивающие корректность данных в памяти, оказались неспособны гарантировать корректность данных в БД. А что толку от изначально корректных данных в памяти, если со временем (после их сохранения в БД и последующего чтения) они перестают быть корректными? По сути, у DDD есть фатальный недостаток: DDD неизбежно приводит к нарушению целостности данных (инварианта бизнес-логики) в БД.

+31

razon 14 мар в 13:00

Покрытие архитектуры as Code тестами

Простой

16 мин

5.3K

Проектирование и рефакторинг*TDD*DevOps*Распределённые системы*Микросервисы*

✏️ Технотекст 2023

💬 На самом деле, моя идея написания тестов на архитектуру настолько проста, легко реализуема и при этом полезна, что я до сих пор толком не понимаю, почему я не встречал материалов на эту тему, и сама тема всё ещё не используется повсеместно 🙂
Статья написана по следам моих докладов на трёх крупных ИТ-конференциях, на каждой из которых ко мне подходили архитекторы и разработчики российских бигтехов, говорили, что я очень точно попал в их боли и предложил суперпрактику, которую они теперь будут внедрять. На всех трёх конференциях я получил высшие оценки от аудитории, а на двух из них доклад был признан лучшим в своей секции. В конце статьи приведена ссылка на видео доклада с одной из конференций.
В статье я поделюсь своей идеей и OpenSource-реализацией решения для написания тестов, разберу примеры тестов на небольшой учебной микросервисной архитектуре, а также расскажу про личный опыт и профит от применения этой практики.
Для разработчиков монолита тоже есть небольшой бонус: в OpenSource-репозитории появилась реализация и примеры тестов на архитектуру модульного монолита.

+22

appp_master 7 мар в 12:01

Apache Flink: динамическое определение выходного топика в Kafka

7 мин

2.6K

Блог компании МТСJava*Big Data*Распределённые системы*Data Engineering*

Всем привет, меня зовут Александр Бобряков. Я техлид в команде МТС Аналитики, занимаюсь Real-Time обработкой данных. Мы начали использовать фреймворк Apache Flink, и я решил поделиться на Хабре своим опытом внедрения этой технологии в цикле статей.

В предыдущей статье — «Apache Flink. Как работает дедупликация данных в потоке Kafka-to-Kafka?» — я рассказывал про построение пайплайна Kafka-to-Kafka с промежуточным разделением потока и дедупликацией событий. Также разобрались, что такое состояние оператора и зачем оно нужно.

В этой статье добавим возможность динамического определения топика в Kafka для каждого события, куда его нужно записать.

2 3 ...

28 29

Распределённые системы *

Шардирование баз данных и проектирование систем

Новости

Unit-тестирование Flink-операторов, Job: Flink MiniCluster

Остаться в живых (keepalive) feat. HTTP/2, Go & gRPC-Go

Шардирование (sharding). Эпизод 2: шардирование по гео

Истории

Пет-проект: путь от «простого получения опыта» до «продукта, способного приносить пользу IT сообществу»

Смарт-контракты на WebAssembly: зачем это надо и как работает

Шардирование (sharding). Эпизод 1: Начало и шардирование по идентификатору

Проектируем микросервисы с Reactive Manifesto: 4 принципа распределенных систем

Нескучная стеганография, или как мы зашифровали секретные ключи пользователей в джипегах

Актуально ли сегодня ООП?

Дизайн высоконагруженных приложений будущего. Путешествие без сценария с Мартином Клеппманом

Анализ форка Биткоина 2013 года: централизованное принятие решений спасло положение

Как провести unit-тестирование Flink-операторов: TestHarness

Ближайшие события

Когда одного Postgres'a мало: сравнение производительности PostgreSQL и распределенных СУБД

Как управлять распределённой системой, не привлекая внимания санитаров

Блокчейн для чайников: создаем свой первый распределенный реестр

Лучшие практики для надёжной работы с RabbitMQ

Пиррова победа Domain-Driven Design

Покрытие архитектуры as Code тестами

Apache Flink: динамическое определение выходного топика в Kafka

Вклад авторов

Работа