Вносящий вполне себе мог не подозревать что будут последствия посторонним.
Принимающий почтовый сервер совсем не обязан любые списки использовать, его админ решил что авторам списков стоит доверять, попробуйте переубедить.
Пример - я вот периодически через некоторые сервисы кидаю жалобы. Насколько я понимаю - у некоторых из них и есть и свои DNSBL-списки и туда влететь - на раз, по факту прилетевшей жалобы (c заголовками), вылететь тоже на раз - по таймеру если некоторое время не было жалоб. Есть и те откуда так просто не вылезешь.
С моей точки зрения - жалобы обоснованы а что на том же IP что левая рассылка еще всякое полезное есть...а почему это моя проблема, может стоит спам не слать(а если вы считаете что не шлете - убедится что например кнопки отписки реально работают)?. При этом сервис списка даже мою страну разве что по косвенным данным узнает.
Мне вот один мой случай с английским хостером(вроде это goscomb был) вспоминается.
У них (не помню уж - толи VPS толи дедик там у меня был) было (похоже просмотренное мной условие) условие что надо отказ делать чуть ли не за месяц. Я где то за дней за 10 до продления говорю - спасибо, моя уезжать, к вам претензий нет, дело во мне. Пожалуйста не продлевайте и прибейте. Они в ответ - про ту политику. Я в ответ - ах так, логинюсь в альфа-клик и блокирую карту + запрос на перевыпуск, и деньги с этого счета убираю. Начинают прилетать сообщения про проблемы с оплатой (и не все из них - автоматические). Вообще в итоге удалили где то месяца через 3, все это время сервер работал а баланс уходил все глубже в минус. В плане так сказать подхода к удалению мне этот подход очень нравится.
Нужно уметь это админить, как в плане софта так и железа. Хотя бы на минимальном уровне. Возможно частично компенсируется чуть адаптированным железом (та же Synology вот со своими GUI неплохо так позволяет прикидываться таким сервером).
Некоторые задачи вроде почты - по историческим, вполне обоснованным но все же, причинам сделаны так что использование своего сервера домашнего - не очень желательно - тут и блоклисты домашних блоков адресов и то что формальные требования для работы это еще далеко не все, есть еще куча "рекомендаций" без которых толком работать не будет и кривая логика у некоторых крупных сервисов (за mail.ru такое замечалось например) что если почтовый сервер в принципе лежит, подключится к mx'у не получается - повторных попыток доставить письмо тупо не делается а отправителю сразу улетает отлуп, backup-mx-as-service конечно решение вот только что с фильтрацией спама нормальной делать?
Да, все это решается. С той или иной сложностью. но надо знать как.
А бывают и ситуации когда тупо домашний вариант слишком дорого - пример - вот хочется self-hosted языковую модель использовать из тех что считаются более менее приличными по тестам. А это - 70B а то и 120B параметров. Вариант запустить это дома с нормальной производительность это RTX 3090/RTX 4090 и лучше бы - несколько (ну или дешевое (по сравнению несколькими 4090+комп куда их поставить) решение в виде топового MacMini на Apple Silicon). Ну или - колхоз с Tesla P40. Или использовать все же более простые модели и всего то 16Gb VRAM карточки. При этом железо будет по больше части простаивать. Или отказаться от домашнего варианта и использовать openrouter.ai/vsegpt.ru
Собственно цикл про Alice Long у E. William Brown в том числе тоже и про эти проблемы. AGI то там давно запилили, как и загрузку. В процессе правда - встали вопросы - а у ИИ вообще права есть? Какие? Почему? А если ИИ НЕ хочет их сам защищать (потому что тему про aligment разработчики освоили ну очень хорошо)? А собственно как отличить ИИ от человека? Ну кроме читерства вида - смотреть происхождение, у человека всегда есть биологический мозг? Как быть если методы контроля ИИ по людям используют.
А потом встали проблемы с тем что НЕуспешная попытка создать сверхчеловеческий ИИ обычно кончается тем что приходится стекловать то место где это устроили. А успешных - не было. При этом некоторые государства считают что лучше сразу начать если кто-то из соседей. Другое дело что там есть и другой вариант - создавать не сверхИИ, создавать сверхчеловека, проблем с aligment'ом не будет по определению, будут другие.
И можно взять примеры из фантастики как из логичных и хороших вообщем то идей вышло...не очень (с точки зрения пользователей). Или потому что идиот вводил входные данные а ИИ выполнял что сказали (например - "Опаленная колыбель" Тропова - добавил придурок занимавший высокий пост и торжественно задававший данные инструкцию ИИ минимизировать сумму человеческих страданий - ИИ начал выполнять задачу, чем меньше людей тем меньше сумма, хорошо еще что ядерным оружием не хотел пользоваться) или потому что цели то хорошие но не учли мелкие технические проблемы (например - "Берсерки" Злотникова, Единение хочет максимально продлить существование высокооргонизованного разума во вселенной за счет правильной организации ресурсов но вот то КАК это делается...и нет - обсуждать детали вполне можно...если сначала на практике доказать что они могут ошибаться) или просто кто-то чего то не учел (а систему запускал в депрессии, для которой были причины) а потом еще и часть данных была даже не утрачена, не подумали где их стоит искать то и в результате имеем войну человечества с ИИ неизвестного происхождения и пусть понятной но чуждой Объединенному Человечеству архитектурой(например - Виктор Вагнер, "Дети пространства").
Или не из фантастики а из истории, сколько было попыток принести счастье для всех (например в реализации справедливого общества :)) а реализация получалась с некоторыми проблемами
Есть же отдельно исследования на тему как неправильный aligment убирать. Чаще - finetuning. Одна из ситуаций зачем это может быть нужно - использование моделей для творчества литературного (и для ролеплея).
Ну вот у меня тоже. Да, существенно больше ресурсов и надежнее вот только:
это железо надо админить (ну или аутсорс). если там что-то сложное или просто лень с автоматизацией - это может быть проблемой.
и запчасти иметь (ну или быстро закупать если что не так, ну или принять что ситуация когда на proxmox backup server - массив уже неделю degraded потому что сдох диск)
электричество дома вполне могут рубануть на несколько часов. UPS нужен серьезный и не факт что хватит. генератор с АВР в квартире как то не очень
у провайдеров оборудование вполне может вырубаться сразу и толку от UPS у себя? Резерв по сотовой связи?
от домашнего провайдера статический белый IPv4 адрес с настройкой реверс-зоны и с нормальным подключением уже счастье, бывают сильно хуже варианты. Хотя если речь про веб-сайты и Cloudflare нравится - есть такая штука cloudflared (позволяет вообще входящие соединения на свое железо закрыть, на этом железе просто запускается их демон который сам коннектится и прокидывает)
техподдержка домашних провайдеров...тоже вообщем часто все плохо
В теории это могут быть разные услуги. По времени на исправление проблем, по тому - кто будет с тобой эти проблемы решать. По тому - это безлимит 1 Gbit/s* или CIR 1 Gbit/s до городского IX'а, CIR 500 Mbit/s до M9 и SLA 99.999%
И есть подход когда тупо рядом вешаем что-то вроде Stable Diffusion (KoboldCpp с некоторых пор так может, в llava-based модели он конечно тоже может уже)
включаю в дебаг настройках не выключение экран при зарядке
открываю Obsidian и держу включенным...долго. Пока не пройдет
Фокус с неработой нормальной фоновой синхронизации на Android это похоже проблема и Obsidian и Joplin и Evernote - спасибо Electron'у насколько помню (На форуме Joplin'а автору даже патч предлагали насколько помню, ответ был что он работат идеологически не правильно а правильно эта задача не решается)
При таких вот юзкейсах часто и фоновая (а не при включении приложения) синхронизация нужна (а посколькую ее нет на мобилках - приходится танцы с бубном устраивать) и что например все версии Obsidian'а должны иметь единое понимание что является допустимым именем файла и какой оно можно быть длинны на всех устройствах куда синхронизация.
Нет, Syncthing нежелательный вариант - там проблемы с конфликтами при почти одновременном редактировании.
Потратили деньги или хотя бы ресурсы, хотели заработать а кто-то за счет этого сделал клон и мы не заработали.
Вот надо ли бороться и как - вопрос интересный. И с учетом что документы про исключительные авторскими права на весь датасет исходный - никто показать не сможет (хотя бы потому что многое там - давно в public domain) и что на одинаковых исходных данных может выйти похожий результатат.
Патентам ж защиту дают, , как и например литературным произведениям. Пусть с кучей ограничивающих условий и ПРЯМО пишут кое где что для прогресса науки и искусства временная монополия дается (о чем кстати любители поговорить про "интеллектуальную собственность" забывают).
Тут даже вопрос - то что описано это вообще - нарушение?
Потому что очень много слабых моделей дообучают на ChatGPT. Даже и сайт создан (и спокойно живет) был давно https://sharegpt.com/ для всех желающих сливать туда свои логи и определяется сильно проще чем играми в котиков с собаками - когда 7B/30B модель в ответ на вопрос а кто она - говорит что она - ChatGPT - все вообщем то ясно :).
Вспоминается вот статья про (в том числе) некоторые обучающие видео которые почему то не везде любят - https://habr.com/ru/companies/wiseops/articles/791774/ - там именно что строили максимально отказоустойчиваю инфраструктуру потому что прилететь может откуда попало.
Речь про список блокировки спама? DNSBL который?
Вы уверены что они в России?
Вы уверены что вам админ списка скажет кто внес?
Вы уверены что не было оснований?
Вносящий вполне себе мог не подозревать что будут последствия посторонним.
Принимающий почтовый сервер совсем не обязан любые списки использовать, его админ решил что авторам списков стоит доверять, попробуйте переубедить.
Пример - я вот периодически через некоторые сервисы кидаю жалобы. Насколько я понимаю - у некоторых из них и есть и свои DNSBL-списки и туда влететь - на раз, по факту прилетевшей жалобы (c заголовками), вылететь тоже на раз - по таймеру если некоторое время не было жалоб. Есть и те откуда так просто не вылезешь.
С моей точки зрения - жалобы обоснованы а что на том же IP что левая рассылка еще всякое полезное есть...а почему это моя проблема, может стоит спам не слать(а если вы считаете что не шлете - убедится что например кнопки отписки реально работают)?. При этом сервис списка даже мою страну разве что по косвенным данным узнает.
Мне вот один мой случай с английским хостером(вроде это goscomb был) вспоминается.
У них (не помню уж - толи VPS толи дедик там у меня был) было (похоже просмотренное мной условие) условие что надо отказ делать чуть ли не за месяц. Я где то за дней за 10 до продления говорю - спасибо, моя уезжать, к вам претензий нет, дело во мне. Пожалуйста не продлевайте и прибейте. Они в ответ - про ту политику. Я в ответ - ах так, логинюсь в альфа-клик и блокирую карту + запрос на перевыпуск, и деньги с этого счета убираю. Начинают прилетать сообщения про проблемы с оплатой (и не все из них - автоматические). Вообще в итоге удалили где то месяца через 3, все это время сервер работал а баланс уходил все глубже в минус. В плане так сказать подхода к удалению мне этот подход очень нравится.
Нужно уметь это админить, как в плане софта так и железа. Хотя бы на минимальном уровне. Возможно частично компенсируется чуть адаптированным железом (та же Synology вот со своими GUI неплохо так позволяет прикидываться таким сервером).
Некоторые задачи вроде почты - по историческим, вполне обоснованным но все же, причинам сделаны так что использование своего сервера домашнего - не очень желательно - тут и блоклисты домашних блоков адресов и то что формальные требования для работы это еще далеко не все, есть еще куча "рекомендаций" без которых толком работать не будет и кривая логика у некоторых крупных сервисов (за mail.ru такое замечалось например) что если почтовый сервер в принципе лежит, подключится к mx'у не получается - повторных попыток доставить письмо тупо не делается а отправителю сразу улетает отлуп, backup-mx-as-service конечно решение вот только что с фильтрацией спама нормальной делать?
Да, все это решается. С той или иной сложностью. но надо знать как.
А бывают и ситуации когда тупо домашний вариант слишком дорого - пример - вот хочется self-hosted языковую модель использовать из тех что считаются более менее приличными по тестам. А это - 70B а то и 120B параметров. Вариант запустить это дома с нормальной производительность это RTX 3090/RTX 4090 и лучше бы - несколько (ну или дешевое (по сравнению несколькими 4090+комп куда их поставить) решение в виде топового MacMini на Apple Silicon). Ну или - колхоз с Tesla P40. Или использовать все же более простые модели и всего то 16Gb VRAM карточки. При этом железо будет по больше части простаивать. Или отказаться от домашнего варианта и использовать openrouter.ai/vsegpt.ru
Может сильно зависит от ресурса.
Собственно цикл про Alice Long у E. William Brown в том числе тоже и про эти проблемы. AGI то там давно запилили, как и загрузку. В процессе правда - встали вопросы - а у ИИ вообще права есть? Какие? Почему? А если ИИ НЕ хочет их сам защищать (потому что тему про aligment разработчики освоили ну очень хорошо)? А собственно как отличить ИИ от человека? Ну кроме читерства вида - смотреть происхождение, у человека всегда есть биологический мозг? Как быть если методы контроля ИИ по людям используют.
А потом встали проблемы с тем что НЕуспешная попытка создать сверхчеловеческий ИИ обычно кончается тем что приходится стекловать то место где это устроили. А успешных - не было. При этом некоторые государства считают что лучше сразу начать если кто-то из соседей. Другое дело что там есть и другой вариант - создавать не сверхИИ, создавать сверхчеловека, проблем с aligment'ом не будет по определению, будут другие.
И можно взять примеры из фантастики как из логичных и хороших вообщем то идей вышло...не очень (с точки зрения пользователей). Или потому что идиот вводил входные данные а ИИ выполнял что сказали (например - "Опаленная колыбель" Тропова - добавил придурок занимавший высокий пост и торжественно задававший данные инструкцию ИИ минимизировать сумму человеческих страданий - ИИ начал выполнять задачу, чем меньше людей тем меньше сумма, хорошо еще что ядерным оружием не хотел пользоваться) или потому что цели то хорошие но не учли мелкие технические проблемы (например - "Берсерки" Злотникова, Единение хочет максимально продлить существование высокооргонизованного разума во вселенной за счет правильной организации ресурсов но вот то КАК это делается...и нет - обсуждать детали вполне можно...если сначала на практике доказать что они могут ошибаться) или просто кто-то чего то не учел (а систему запускал в депрессии, для которой были причины) а потом еще и часть данных была даже не утрачена, не подумали где их стоит искать то и в результате имеем войну человечества с ИИ неизвестного происхождения и пусть понятной но чуждой Объединенному Человечеству архитектурой(например - Виктор Вагнер, "Дети пространства").
Или не из фантастики а из истории, сколько было попыток принести счастье для всех (например в реализации справедливого общества :)) а реализация получалась с некоторыми проблемами
Есть же отдельно исследования на тему как неправильный aligment убирать. Чаще - finetuning. Одна из ситуаций зачем это может быть нужно - использование моделей для творчества литературного (и для ролеплея).
Но кстати не только finetuning - проблему с "я языковая модель и у меня лапки" оказывается можно решить еще проще - https://www.lesswrong.com/posts/jGuXSZgv6qfdhMCuJ/refusal-in-llms-is-mediated-by-a-single-direction например. Очень простая корректировка модели если она не хочет отвечать чтобы отвечала.
Ну вот у меня тоже. Да, существенно больше ресурсов и надежнее вот только:
это железо надо админить (ну или аутсорс). если там что-то сложное или просто лень с автоматизацией - это может быть проблемой.
и запчасти иметь (ну или быстро закупать если что не так, ну или принять что ситуация когда на proxmox backup server - массив уже неделю degraded потому что сдох диск)
электричество дома вполне могут рубануть на несколько часов. UPS нужен серьезный и не факт что хватит. генератор с АВР в квартире как то не очень
у провайдеров оборудование вполне может вырубаться сразу и толку от UPS у себя? Резерв по сотовой связи?
от домашнего провайдера статический белый IPv4 адрес с настройкой реверс-зоны и с нормальным подключением уже счастье, бывают сильно хуже варианты. Хотя если речь про веб-сайты и Cloudflare нравится - есть такая штука cloudflared (позволяет вообще входящие соединения на свое железо закрыть, на этом железе просто запускается их демон который сам коннектится и прокидывает)
техподдержка домашних провайдеров...тоже вообщем часто все плохо
Все компьютерные игры где есть consumable in-app'ы тоже под полное отслеживание и только по паспорту?
В теории это могут быть разные услуги. По времени на исправление проблем, по тому - кто будет с тобой эти проблемы решать. По тому - это безлимит 1 Gbit/s* или CIR 1 Gbit/s до городского IX'а, CIR 500 Mbit/s до M9 и SLA 99.999%
Смотря что считать мультимодальной. так то https://llava-vl.github.io/ есть (со зрением).
И есть подход когда тупо рядом вешаем что-то вроде Stable Diffusion (KoboldCpp с некоторых пор так может, в llava-based модели он конечно тоже может уже)
Один вопрос - а в чем выгода пользователей ? Отдаем временно 10 ETH, нам дают 6 ETH, надо вернуть 7 ETH а то лишимся 10.
В фиате ж залог не так работат.
Или я что-то не понимаю?
Я для первоначальной синхронизации:
включаю в дебаг настройках не выключение экран при зарядке
открываю Obsidian и держу включенным...долго. Пока не пройдет
Фокус с неработой нормальной фоновой синхронизации на Android это похоже проблема и Obsidian и Joplin и Evernote - спасибо Electron'у насколько помню (На форуме Joplin'а автору даже патч предлагали насколько помню, ответ был что он работат идеологически не правильно а правильно эта задача не решается)
У Joplin лучше поднять docker-контейнер с их Joplin Server. Там чуть докрученный Webdav.
Тормоза на WebDAV у Joplin'а начинаются когда заметок будет хотя бы тысяч 20.
Не достаточно. Бывают...интересные юзкейсы. Не всегда текстовый контент в Obsidian это то что написанно именно этим человеком. Есть например синхронизация с цитатами (и заметками) в Bookfusion - https://support.bookfusion.com/hc/en-us/articles/22095974337677-Syncing-your-highlights-notes-to-Obsidian, есть поддержка синхронизации у Memex'а (https://memex.garden/ который), есть синхронизация у Readwise....
При таких вот юзкейсах часто и фоновая (а не при включении приложения) синхронизация нужна (а посколькую ее нет на мобилках - приходится танцы с бубном устраивать) и что например все версии Obsidian'а должны иметь единое понимание что является допустимым именем файла и какой оно можно быть длинны на всех устройствах куда синхронизация.
Нет, Syncthing нежелательный вариант - там проблемы с конфликтами при почти одновременном редактировании.
А после этого вопроса у меня возник другой :)
Думает ли (бывший) провайдер этого пет-проекта (МЛ Клауд) выполнять 406-ФЗ (который https://habr.com/ru/companies/ispmanager/articles/818525/ в частности, про реестр) ? В реестр в https://rkn.gov.ru/activity/connection/register/p1578/ их нету.
Есть еще третий вариант - заявить что меры были приняты.
Потратили деньги или хотя бы ресурсы, хотели заработать а кто-то за счет этого сделал клон и мы не заработали.
Вот надо ли бороться и как - вопрос интересный. И с учетом что документы про исключительные авторскими права на весь датасет исходный - никто показать не сможет (хотя бы потому что многое там - давно в public domain) и что на одинаковых исходных данных может выйти похожий результатат.
Патентам ж защиту дают, , как и например литературным произведениям. Пусть с кучей ограничивающих условий и ПРЯМО пишут кое где что для прогресса науки и искусства временная монополия дается (о чем кстати любители поговорить про "интеллектуальную собственность" забывают).
Тут даже вопрос - то что описано это вообще - нарушение?
Потому что очень много слабых моделей дообучают на ChatGPT. Даже и сайт создан (и спокойно живет) был давно https://sharegpt.com/ для всех желающих сливать туда свои логи и определяется сильно проще чем играми в котиков с собаками - когда 7B/30B модель в ответ на вопрос а кто она - говорит что она - ChatGPT - все вообщем то ясно :).
Вспоминается вот статья про (в том числе) некоторые обучающие видео которые почему то не везде любят - https://habr.com/ru/companies/wiseops/articles/791774/ - там именно что строили максимально отказоустойчиваю инфраструктуру потому что прилететь может откуда попало.