Алгоритмы *

Все об алгоритмах

Статьи Посты Новости Авторы Компании

Vital18 12 апр в 06:35

Решает ли задачу оптимизации биологическая нейросеть?

Простой

4 мин

755

Алгоритмы*Исследования и прогнозы в IT*Искусственный интеллектФизикаМозг

В предыдущей статье Метрика в машинном обучении сложных систем, алгоритм и программный код предложена формула для отношения сигнала к шуму в сложных нелинейных системах с тенденцией к самоорганизации. С опытом применения в обработке данных электрокардиограмм, землетрясения. Сложной системой является и биологическая нейросеть.

Искусственные нейронные сети возникли в качестве попытки моделировать организацию и функционирование биологических нейронных сетей – сетей нервных клеток живого организма. В существующих алгоритмах искусственного интеллекта ключевым звеном является решение задачи оптимизации и при этом остаётся вопрос - решает ли биологическая нейронная сеть задачу оптимизации? Задача оптимизация - это нахождение экстремумов целевой функции в процессе проектирования параметров системы. Под задачу оптимизации сформировался функциональный подход, который предполагает рассмотрение объекта как комплекса выполняемых им функций, а не как набора элементов и их взаимосвязей.

Ключевым условием в постановке задачи оптимизации является наличие управляющих факторов или заданных внешних правил. Например, выбор оптимального хода по правилам игры в шахматы или в чайнике вода превращается в пар и управляющим фактором выступает температура, где применимы постановки задач оптимизации. При детонации взрывчатых веществ жидкость превращается в газы при отсутствии управляющих факторов. Отсутствуют внешние управляющие факторы в лавинообразных процессах.

Отсутствие управляющих факторов и масштабная инвариантность процессов самоорганизованной критичности (SOC) не являются интуитивно понятными и привычными. Будет очевидной реакция некоторых читателей – «ничего не понимаю», хотя речь идёт об активности нашего собственного мозга.

-4

rebuilder 11 апр в 20:08

Задача о сумме подмножеств

Средний

6 мин

6.2K

Python*Алгоритмы*

Задача о сумме подмножеств в общей формулировке звучит так:

Существует множество S чисел, вопрос состоит в том, будет ли сумма некоторого подмножества от S равна заданному числу Т.

Известно, что данная задача NP-полная.

Мы будем решать эквивалентную задачу, где все числа являются натуральными.

Частным случаем задачи о сумме подмножеств является задача разбиения множества чисел:

Множество чисел S необходимо разбить на два подмножества S1 и S2, где сумма S1 равна сумме S2.

(От задачи о сумме подмножеств текущая отличается только тем, что T = SUM(S1) / 2 = SUM(S2) / 2)

Хочу предложить вам простой и элегантный способ относительно быстрого решения обеих задач методом целочисленного линейного программирования (ЦЛП). Мы получим не только точный ответ на вопрос, но и найдём искомое подмножество.

nrsharip 11 апр в 16:06

Индуктивная статистика: доверительные интервалы, предельные ошибки, размер выборки и проверка гипотез

Средний

15 мин

Python*Алгоритмы*Математика*Статистика в ITИнфографика

Одной из самых распространённых задач аналитики является формирование суждений о большой совокупности (например, о миллионах пользователей приложения), опираясь на данные лишь небольшой части этой совокупности - выборке. Можно ли сделать вывод о миллионной аудитории крупного мобильного приложения, собрав данные 100 пользователей? Или стоит собрать данные о 1000 пользователях? Какую вероятность ошибиться при анализе мы можем допустить: 5% или 1%? Относятся ли две выборки к одной совокупности, или между ними есть ощутимая значимая разница и они относятся к разным совокупностям? Точность прогноза и вероятность ошибки при ответе на эти и другие вопросы поддаются вполне конкретным расчётам и могут корректироваться в зависимости от потребностей продукта и бизнеса на этапе планирования и подготовки эксперимента. Рассмотрим подробнее, как параметры эксперимента и статистические критерии оказывают влияние на результаты анализа и выводы обо всей совокупности, а для этого смоделируем тысячу A/A, A/B и A/B/C/D тестов.

+25

ErmIg 11 апр в 15:08

Теоретическая и реальная производительность Intel AMX

Сложный

11 мин

Высокая производительность*C++*Алгоритмы*Обработка изображений*Искусственный интеллект

Туториал

AMX (Advanced Matrix Extension) - это модуль аппаратного ускорения умножения матриц, который появился в серверных процессорах Intel Xeon Scalable, начиная с 4 поколения (архитектура Sapphire Rapids).

В начале этого года ко мне в руки наконец попал сервер, с данным типом процессора.

Конкретно модель Xeon(R) Gold 5412U - это 24 ядерный процессор с тактовой частотой в 2.1 GHz. При этом 8 приоритетных ядер могут разгонятся до 2.3 GHz, а 1 ядро до 3.9 GHz в Turbo Boost). Кроме того данный процессор поддерживает 8 канальную DDR-5 4400 MT/s.

Мне как человеку, достаточно долгое время посвятившему оптимизации алгоритмов компьютерного зрения и запуска нейронный сетей на CPU (библиотеки Simd и Synet), было интересно: на сколько AMX позволяет реально ускорить вычисления и как извлечь из него максимальную производительность.

Далее я постараюсь максимально подробно ответить на данные вопросы. Прежде все я буду касаться вопросов однопоточной производительности (многопоточную рассмотрю позже).

Далее много кода на С++...

+30

Vital18 11 апр в 09:47

Метрика в машинном обучении сложных систем, алгоритм и программный код

Простой

4 мин

2.1K

Python*Алгоритмы*Математика*Машинное обучение*Физика

Для решения задач машинного обучения предлагается метрика, основанная на формуле отношения сигнала к шуму, SNR:

Awilum 10 апр в 13:07

C# Тренажер

2 мин

12K

Занимательные задачки.NET*Алгоритмы*C#*Учебный процесс в IT

Хочу представить вашему вниманию бесплатный курс C# Тренажер, который недавно опубликовал на платформе Stepik.

Курс включает в себя множество практических задач по программированию на языке C#, которые способствуют повышению вашего уровня навыков в этой области. В ходе обучения вы столкнетесь с разнообразными заданиями, включая как классические, так и те, которые часто встречаются на собеседованиях в ведущих компаниях, таких как Microsoft, EA, Intel, Amazon, Uber и Unity. Это обеспечит разностороннее развитие ваших навыков работы с переменными, типами данных, операторами, циклами, функциями и алгоритмами.

kuznetsoff87 10 апр в 12:12

OmniFusion 1.1: мультимодальность теперь и на русском

Сложный

7 мин

7.8K

Блог компании AIRIАлгоритмы*Обработка изображений*Искусственный интеллектNatural Language Processing*

В прошлом году на конференции AIJ 2023 мы представили первую версию OmniFusion — мультимодальной языковой модели (LLM), способной поддерживать визуальный диалог и отвечать на вопросы по картинкам. Спустя несколько месяцев мы готовы представить обновление — OmniFusion 1.1 — SoTA на ряде бенчмарков (среди моделей схожего размера) и, более того, модель хорошо справляется со сложными задачами и понимает русский язык! Самое главное — всё выкладываем в открытый доступ: веса и даже код обучения.

Ниже расскажем об особенностях модели, процессе обучения и примерах использования. В первую очередь остановимся на архитектуре, а потом отдельно расскажем о проделанных экспериментах как в части архитектурных трюков, так и о работе с данными. Ну а несколько интересных кейсов на англ и русском языках можно посмотреть на палитре ниже.

+20

aio350 10 апр в 11:01

Фильтр Блума

Средний

9 мин

9.9K

Блог компании Timeweb CloudJavaScript*Алгоритмы*

Обзор

Перевод

У каждого разработчика есть набор инструментов для решения различных задач. Однако со временем возникает необходимость расширять этот набор, чтобы эффективно справляться с более сложными задачами. В этой статье я хочу познакомить вас с инструментом, которым вы, скорее всего, раньше не пользовались. И хотя он подходит для решения узкого спектра задач, его использование может оказаться весьма полезным. Знакомьтесь — "фильтр Блума" (Bloom filter).

Читать дальше →

+53

AlekseiPodkletnov 10 апр в 08:55

Как работают алгоритмы музыкальных стримингов. Разбираем на примере

9 мин

9.5K

Алгоритмы*Машинное обучение*Читальный залИскусственный интеллектЗвук

Кажется, что рекомендательный движок музыкального сервиса - это черный ящик. Берет кучу данных на входе, выплевывает идеальную подборку лично для вас на выходе. В целом это и правда так, но что конкретно делают алгоритмы в недрах музыкальных рекомендаций? Разберем основные подходы и техники, иллюстрируя их конкретными примерами.

Начнем с того, что современные музыкальные сервисы не просто так называются стриминговыми. Одна из их ключевых способностей - это выдавать бесконечный поток (stream) треков. А значит, список рекомендаций должен пополняться новыми композициями и никогда не заканчиваться. Нет, безусловно, собственноручно найти свои любимые песни и слушать их тоже никто не запрещает. Но задача стримингов именно в том, чтобы помочь юзеру не потеряться среди миллионов треков. Ведь прослушать такое количество композиций самостоятельно просто физически нереально!

Так как они это делают?

+35

bvv2311 9 апр в 15:04

Поиск с подкреплением на ориентированных взвешенных графах

5 мин

2.2K

Python*Алгоритмы*

Мир абстракции выхолощено чист. Реальность и не полна, и изменяема. Задача статьи показать как можно скрестить поиск с обучением и взвешенные ориентированные графы.

o4ina 9 апр в 13:30

PostgreSQL. Устройство карты свободного пространства

Средний

25 мин

1.9K

Open source*PostgreSQL*Алгоритмы*C*Реверс-инжиниринг*

Из песочницы

СУБД PostgreSQL способна бысто работать с огромными массивами данных благодаря множеству различных механизмов, таких как карта свободного пространства, позволяющая за короткий промежуток времени найти страницу из основного слоя с необходимым свободным пространством для вставки новых версий строк.

В этой статье мы разберемся в устройстве карты свободного пространства, а также познакомимся с алгоритмом получения страницы с необходимым свободным пространством.

+13

tguev 8 апр в 10:36

Разбор задач «Квеста на миллион»

Простой

6 мин

1.5K

Занимательные задачкиPython*Программирование*Алгоритмы*Математика*

Друзья, разбираем задачи прошедшего квеста на миллион. Для простоты, в разборе будем использовать формализованные формулировки задачи. Ознакомиться с исходными формулировками можно в самом квесте. Квест открыт и доступен для прохождения.

iik_812 8 апр в 09:35

Почему я стал использовать Алгоритмические собеседования при подборе команды

Простой

3 мин

21K

Алгоритмы*

Мнение

Эта тема многократно поднимается в сообществах разработчиков, есть те кто поддерживает данный вид собеседований и те кто против. Вот и я, рискуя быть раскритикован сообществом, решил высказаться :)

Признаюсь, сам длительное время не был сторонником данного вида собеседований, мне казалось, что классический подход лучше, когда тебя, ну или ты собеседуешь кандидата проходя от азов до углубленных знаний.

Объективно, где мы используем в работе алгоритмы?

Возможно у кого-то в проекте есть ручное написание сортировок или обходы графов, но как правило разработчики используют стандартные или дополнительные библиотеки, которые закрывают подобные потребности.

Однако, все изменилось в один день) мне потребовалось подобрать пару-тройку разработчиков в команду, и проводя пятое или шестое собеседование мне попался кандидат, который идеально отвечал на все теоретические вопросы (базовые и не очень), однако переходя от темы к теме меня все больше настораживал легкий звук, прибавив громкость наушников я услышал аккуратный шелест листочков....

+13

124

TSjB 7 апр в 17:47

Алгоритм расчёта расстояния между строками

Средний

3 мин

6.5K

Поисковые технологии*Алгоритмы*R*

Кейс

По работе стояла задача оптимизации поиска по адресам (улицы, дома и объекты). Главный критерий - нахождение адреса, если написано с ошибками или не дописан он в полной мере. Bert’ы, косинусные расстояния эмбеддингов и т.д. не подходили, так как они заточены под смысловой поиск, а в адресах смысла нет. TF-IDF c лемматизацией тоже не очень подходил для этой задачи, результаты были плохие.

Для реализации начал использовать расстояние Дамерау-Левенштейна, и в последствие, развил это до собственного алгоритма, который находит расстояние между двумя строками.

Цель данного поста описание только алгоритма.

+16

italankin 5 апр в 16:28

Про решаемость пятнашек

Средний

8 мин

8.4K

Алгоритмы*Математика*Логические игры

Привет, я создатель известного в узких кругах приложения 15 Puzzle для Android.

В статье я расскажу, как я генерирую стартовые позиции для своей игры, а также о том, как я добавлял новые конфигурации головоломки.

+74

Menar 4 апр в 17:17

Использование библиотеки DCMTK для создания DICOM-файлов на C++

8 мин

1.1K

Программирование*C++*Алгоритмы*DevOps*

Из песочницы

Эта статья фокусируется на примере использование библиотеки DCMTK при создании DICOM-файлов. Как говорит Википедия, DICOM - Digital Imaging and Communications in Medicine, это стандарт создания, хранения, передачи и визуализации медицинских изображений. Стандарт включает в себя часть, которая описывает структуру DICOM-файла, и другую, описывающую передачу DICOM-данных по сети.

DCMTK обеспечивает строгую совместимость с DICOM-стандартом, предоставляя широкий спектр функциональности для обработки изображений, текстовой информации и метаданных. Библиотека поддерживает различные форматы изображений, унифицирует данные и обеспечивает эффективный обмен информацией в медицинском сообществе.

Современные МРТ и КТ устройства по умолчанию создают медицинские изображения и передают их на PACS-сервер для хранения, используя стандарт DICOM. Но цифровые медицинские изображения не обязательно должны быть топографическими, а могут быть обычными цветными или черно-белыми фотографиями, например, снимок сетчатки глаза. Такие снимки зачастую хранятся в виде: описание пациента + jpg снимок. Чтобы хранить такие изображения на PACS-серверах, их нужно преобразовать в DICOM.

В данной статье мы углубимся в практическую сторону вопроса, рассмотрев конкретный пример создания файла DICOM из изображения формата *.dcm на языке C++ для последующей его отправки на PACS-сервер.

ProtoPlazmoid 4 апр в 14:04

Алгоритм ESG (Evolution of Social Groups). C#

Простой

6 мин

2.6K

Программирование*Data Mining*Алгоритмы*C#*Математика*

Из песочницы

Представляю вашему вниманию статью, посвященную авторскому алгоритму «Evolution of Social Groups» (ESG) C#. Этот уникальный метод оптимизации, основанный на взаимодействии социальных групп, открывает новые горизонты в области метаэвристики. В статье подробно рассматриваются основные принципы работы алгоритма, его преимущества и области применения. Присоединяйтесь, чтобы узнать больше о мире оптимизации и возможностях, которые он открывает. Поехали…

FirstJohn 4 апр в 11:51

Исследователи приблизились к новому пределу скорости решения задачи коммивояжера

6 мин

2.4K

Блог компании FirstVDSАлгоритмы*Математика*

Перевод

Целочисленное линейное программирование может помочь найти ответ на множество реальных проблем. Теперь исследователи нашли гораздо более быстрый способ это сделать.

Задача коммивояжера — одна из старейших известных вычислительных задач. Она заключается в поиске кратчайшего маршрута через определённый список городов. Несмотря на кажущуюся простоту, проблема, как известно, сложна. И хотя вы можете использовать перебор, чтобы проверить все возможные маршруты, пока не найдете кратчайший путь, такая стратегия становится несостоятельной, уже когда в списке всего лишь несколько городов.

ph_piter 2 апр в 18:00

Книга «Генеративное глубокое обучение. Как не мы рисуем картины, пишем романы и музыку. 2-е межд изд.»

8 мин

4.7K

Блог компании Издательский дом «Питер»Алгоритмы*Профессиональная литература*Машинное обучение*Искусственный интеллект

Привет, Хаброжители!

Генеративное моделирование — одна из самых обсуждаемых тем в области искусственного интеллекта. Машины можно научить рисовать, писать и сочинять музыку. Вы сами можете посадить искусственный интеллект за парту или мольберт, для этого достаточно познакомиться с самыми актуальными примерами генеративных моделей глубокого обучения: вариационными автокодировщиками, генеративно-состязательными сетями, моделями типа кодер-декодер и многим другим.

Дэвид Фостер делает понятными и доступными архитектуру и методы генеративного моделирования, его советы и подсказки сделают ваши модели более творческими и эффективными в обучении. Вы начнете с основ глубокого обучения на базе Keras, а затем перейдете к самым передовым алгоритмам.

Читать дальше →

+12

roman-gorb 2 апр в 10:01

Ускорение инференса LLM

Средний

13 мин

7.3K

Блог компании ЯндексПрограммирование*Алгоритмы*Машинное обучение*Искусственный интеллект

Инференсом ML-модели называют процесс её работы на конечном устройстве. Соответственно, чем больше мы разгоняем инференс, тем быстрее работает модель. Скорость может зависеть от разных условий, например, от архитектуры, которую вы выбрали для модели, или от железа, на котором работает устройство. Кроме того, проблема тяжёлого инференса остро ощущается на больших языковых моделях (LLM) так остро, как ни на каких других моделях.

Меня зовут Роман Горб, я старший ML-разработчик в команде YandexGPT. Тема инференса LLM заинтересовала меня, потому что я занимался R&D в квантовании сеток для CV-задач. Сегодня я расскажу, как безболезненно увеличить скорость инференса. Сперва разберёмся, зачем это нужно, а потом рассмотрим разные методы ускорения и фреймворки, которые могут в этом помочь.

Ускоряемся

+30

1 2

4 5 ...

275 276

Алгоритмы *

Решает ли задачу оптимизации биологическая нейросеть?

Задача о сумме подмножеств

Индуктивная статистика: доверительные интервалы, предельные ошибки, размер выборки и проверка гипотез

Теоретическая и реальная производительность Intel AMX

Метрика в машинном обучении сложных систем, алгоритм и программный код

C# Тренажер

OmniFusion 1.1: мультимодальность теперь и на русском

Фильтр Блума

Как работают алгоритмы музыкальных стримингов. Разбираем на примере

Поиск с подкреплением на ориентированных взвешенных графах

PostgreSQL. Устройство карты свободного пространства

Разбор задач «Квеста на миллион»

Почему я стал использовать Алгоритмические собеседования при подборе команды

Ближайшие события

Алгоритм расчёта расстояния между строками

Про решаемость пятнашек

Использование библиотеки DCMTK для создания DICOM-файлов на C++

Алгоритм ESG (Evolution of Social Groups). C#

Исследователи приблизились к новому пределу скорости решения задачи коммивояжера

Книга «Генеративное глубокое обучение. Как не мы рисуем картины, пишем романы и музыку. 2-е межд изд.»

Ускорение инференса LLM

Вклад авторов