avshkol Apr 18 at 01:15

Восхитительная теория [якорных] баз данных от Ларса Рённбека

Medium

10 min

6.3K

Big Data*Mathematics*Data storages*Research and forecasts in IT*Data Engineering*

Opinion

Translation

Comments 21

Stillgray Apr 18 at 04:03

Смущает, но такое случается.

В любой нормальной (в обоих смыслах) реляционной БД такое не случается. Ибо нормализация как раз и направлена на недопущение таких вот моментов.

Думаю, что стоит привести высказывание К. Дж. Дейта:
"База данных в действительности - это множество истинных высказываний"

avshkol Apr 18 at 11:07

Он как раз утверждает (ещё есть по этому поводу ряд статей), что временные метки вносят такую сложность, что возможно всё...

В реляционной БД должно стоять ограничение на уникальность пары "номер - дата", но стоит ли оно? И что если стоит, но поступила такая информация - затирать ли предыдущую? Не записывать?

Stillgray Apr 19 at 07:51

И что если стоит, но поступила такая информация - затирать ли предыдущую? Не записывать?
Что ж вы меня спрашиваете?
Спросите лучше архитектора вашей модели данных.

Собственно, якорное моделирование данных - это 6NF, судя по статье в википедии. Поэтому нет никакого противоречия между РСУБД и якорными БД. Данные якорной модели хранятся в нескольких таблицах в РСУБД по факту.

belonesox Apr 18 at 07:43

Если кто впервые услышал про Anchor Modelling, может показаться, что это что-то свежее, экспериментальное и академическое, но Anchor Modelling давно (больше десяти лет) используется в проде, на хабре десятки статей, вот например от Авито 2014 год, 2017 + …, много еще можно нарыть даже на хабре.

ne-nark Apr 18 at 08:09

С этой точки зрения информация не содержит фактов

Сомнительное утверждение. Если добавить к кортежу вероятностную оценку, то он не перестанет описывать факт, просто теперь этот факт определяется другим предикатом. Что здесь имелось ввиду?

avshkol Apr 18 at 11:12

Это такой субъективный подход к информации- все, что мы получаем из внешних источников, считаем позициями, мнениями, оценками, но не фактами. А чтобы стать фактом, им предстоит ещё пройти проверку на непротиворечивость с другими данными и на соответствие реальности...

avshkol Apr 18 at 11:14

Это такой "подход аудитора": если на документе стоит запись "на складе остатки 500 шт", это не факт. Факт - это увиденные и пересчитанные аудитором лично 500 шт )))

ScratchBoom Apr 19 at 20:49

А если он обсчитался?

avshkol Apr 21 at 18:34

Нужно понимать о субъективности оценки - и аудитор может обсчитаться, но вероятность этого несколько меньше, а вероятность 500 шт, при том, что и склад подтверждает 500 шт, и аудитор насчитал 500 шт - вообще неотличима от 100%...

Если же аудитор обсчитался, мы зафиксируем 2 позиции - аудитора и склада. И зафиксируем противоречие между ними...

murkin-kot Apr 18 at 17:54

А в чём восхитительность очередной (из огромного множества) теории представления данных?

avshkol Apr 18 at 20:41

Разделяются факты и субъективные оценки, вводится оценка вероятности, можно фиксировать противоречия. И всё это привязано ко времени.

knagaev Apr 19 at 17:51

Не сочтите за радикализм, но товарищ с апломбом несёт полный бред, выдаваемый за потрясающую новизну. Подход, формализованный Байесом (в каком году?), здесь подаётся как открытие с глубокомысленной недосказанностью: "Подумайте во так, а может оно и не так, а вот если ещё поменяю контекст, так оно вообще не так, но может и так" Такое ощущение, что высосанная из пальца псевдонаука (главное вовремя придумать новые термины - позиция...), чтобы получить гранты на исследования.

avshkol Apr 21 at 18:39

По крайней мере, это альтернатива существующему (3 нормальная форма) подходу к формированию баз данных. Субъективность против объективности. Внесение еще дополнительных мнений и оценок.

Для применения байесовского подхода нужна статистика, здесь же отмечаются только отдельные позиции, которые могут быть и ошибочными...

knagaev Apr 21 at 18:55

Хорошо, допустим это альтернатива. Но тогда скажите, какая польза может быть от присутствия в БД субъективности? Иначе, если пользы нет, то это просто игра словами.

avshkol Apr 26 at 15:44

Польза в том, чтобы зафиксировать все мнения, оцифровать буйный и сомневающийся мир... А не итоговый единственный факт "на складе 500 шт" ( а аудитор насчитал 499, а 4 штуки наполовину разобраны и фактически их можно превратить в 2 полноценных...)

knagaev Apr 26 at 15:50

Допустим зафиксировали то, что вы описали - что дальше с этим делать? И опять же что восхитительного в этой идее? Разные взгляды - это добавим поле с принадлежностью к автору. Изменение во времени - темпоральные БД. Где та самая новизна, которая даст реально полезный выхлоп? Если просто фиксировать все мнения, то БД превращается в сундук со сказками.

avshkol Apr 26 at 23:27

Наш спор сводится к следующему: должна ли БД отражать только окончательное мнение (например, то, что фиксируется в бухучете) или она должна описывать все высказанные мнения, с субьъективно оцениваемыми вероятностями, и таким образом, быть столь же неоднозначной, как и окружающий мир?

Возможно, данные движутся ко второму варианту...

ScratchBoom Apr 19 at 20:26

Бред какой-то

ScratchBoom Apr 19 at 20:42

В чём теория то состоит? Где тут математика? Не увидел ни в статье на Хабре ни у автора в оригиналах статей.

Я рассчитывал какие-то математические выкладки увидеть, которые позволят эффективно делать запросы к БД.

А тут из теории просто "давайте короч вот так хранить как список списков, не пойми чего, не пойми к чему"

avshkol Apr 26 at 15:41

Поскольку этому теорию выдвинул математик, у него в столе, очевидно, лежат тексты на птичьем языке... эти статьи с сайта рассчитаны на широкую ИТ-публику.

ScratchBoom Apr 26 at 19:37

Что же он их в стол то пишет? Без выкладок пока только ощущение какой-то Фоменковщены. Искал по всем интернетам - статей с выкладками не нашёл.

Show the best of all time