Машинное обучение *

Основа искусственного интеллекта

Статьи Посты Новости Авторы Компании

aansty4U 30 апр в 17:17

Новая эра диагностики: Как с помощью ИИ можно диагностировать рак кожи на ранней стадии

6 мин

1.8K

Блог компании BotHubМашинное обучение*БиотехнологииИскусственный интеллектЗдоровье

Обзор

В последние десятилетия рак кожи считается одним из самых распространенных онкологических заболеваний во всем мире. По оценкам ВОЗ, ежегодно регистрируется около 132 000 случаев меланомы кожи, а смертность достигает 66 000 случаев.

Диагностика рака кожи требует значительных усилий и времени, что может негативно сказаться на течении заболевания и привести к плачевным последствиям.

К счастью, наука не стоит на месте! В данной статье я расскажу о системе раннего автоматизированного выявления рака кожи, с использованием сил ИИ.

Приятного прочтения! :)

+19

koch 30 апр в 12:47

Инструменты AutoML в 2024

Простой

3 мин

1.7K

Машинное обучение*Искусственный интеллект

Обзор

Определимся с терминологией. Можно найти c десяток формулировок «AutoML- это…» с разной степенью детализации. Но все они сведутся к словам «AutoML — автоматизирует и упрощает работу с данными». И вот здесь как раз и начинаются сложности. Границы определения AutoML размыты. Есть фреймворки работающие на «3 строчках» кода, есть с платформы с GUI, есть библиотеки для профессионалов и новичков. Попробуем разобраться..

Squirrelfm 30 апр в 09:07

Фундамент AI: обратное распространение ошибки простыми словами

Простой

7 мин

2.8K

Блог компании RaftМашинное обучение*Искусственный интеллект

Туториал

Что если бы я вам сказал, что без понимания того, что такое backpropagation (обратное распространение ошибки), вы никогда не сможете использовать AI эффективно? Тогда я бы, конечно, соврал. Знать такие детали не требуется для использования AI в прикладных задачах, но, тем не менее, это базовый фундамент ML/AI, и понимать, как все устроено, полезно, ну или как минимум, интересно.

+19

slivka_83 29 апр в 18:34

Подбор гиперпараметров RAG-системы с помощью Optuna

Средний

16 мин

1.4K

Python*Data Mining*Машинное обучение*Искусственный интеллектNatural Language Processing*

Туториал

Сказ о том, как с помощью Opuna’ы сделать вашу RAG-систему чуточку (а может и не чуточку) эффективнее :)

alizar 29 апр в 12:00

Питер Норвиг: автор лучшего в мире учебника по ИИ

Простой

5 мин

13K

Блог компании RUVDS.comМашинное обучение*Карьера в IT-индустрииИскусственный интеллектБиографии гиков

Ретроспектива

Питер Норвиг (Peter Norvig) — выдающийся учёный, один из отцов современной ИИ-разработки. После сингулярности ИИ точно оставит его в живых в знак благодарности.

Норвиг не только хороший программист, но и теоретик программирования, учёный и преподаватель, в длинном резюме перечислено 58 статей, а количество цитирований на сегодняшний день составляет 78 830.

Основное признание Норвиг получил как автор учебника «Искусственный интеллект: современный подход», который в наше время считается самым популярным учебником по ИИ в вузах. Эта фундаментальная работа претерпела уже четыре переиздания.

Читать дальше →

+53

badcasedaily1 29 апр в 10:20

Как обнаружить и устранить мультиколлинеарность с помощью Statsmodels в Питоне

Простой

4 мин

861

Блог компании OTUSPython*Программирование*Машинное обучение*

Обзор

Привет, Хабр!

Мультиколлинеарность возникает, когда в модели множественной регрессии одна из независимых переменных может быть линейно предсказана с помощью других независимых переменных с высокой степенью точности. Это явление приводит к тому, что расчетные коэффициенты регрессии становятся нестабильными и их значения могут сильно изменяться в зависимости от включения или исключения других переменных в модель.

Высокая мультиколлинеарность может привести к значительному изменению коэффициентов при незначительных изменениях в данных или спецификации модели. Это усложняет интерпретацию коэффициентов, поскольку они могут значительно изменяться от одного анализа к другому.

Когда переменные сильно коррелированы, стандартные ошибки оценок коэффициентов увеличиваются. Это ведет к увеличению p-значений, что может ошибочно привести к заключению о том, что переменные не имеют значимого влияния на зависимую переменную, хотя на самом деле это не так.

В статье рассмотрим как обнаружить и устранить мультиколлинеарность с помощью Statsmodels в Питоне.

The-Founder-1 28 апр в 22:04

Как сделать pruning, чтобы потом не плакать

Простой

14 мин

2.2K

Программирование*Машинное обучение*Искусственный интеллект

Туториал

Обрезка нейросетей или же, если вникать в термины, pruning — то, что помогает уменьшить размер нашей модели без потери ее эффективности. Да, это далеко не новинка — в стэнфордских лекциях еще в 2017 году об этом говорили!

Идея проста: мы просто убираем из модели все, что нам не нужно. Как в магазине, когда решил экономить: если в корзине лежат лишние товары, то почему бы их не убрать? Так и здесь — мы убираем избыточные нейроны и связи, которые только занимают место, но не приносят особой пользы.

Принцип обрезки можно применять в разных ситуациях. Например, если у нас есть модель, которая обучена для распознавания ста классов объектов, а нам на самом деле нужно только десять, то почему бы не убрать те девяносто лишних? Это позволит нам сделать модель поменьше, но не менее эффективной. А если мы создаем модель с нуля, то обрезка может помочь нам сразу сделать ее компактнее и эффективнее.

Короче, pruning — это для тех, кто хочет сделать свои модели легче и быстрее без потери качества.

+14

Motoroller_love 28 апр в 17:15

LLM Leaderboard за апрель 2024

Простой

2 мин

3.3K

Open source*Python*Машинное обучение*Natural Language Processing*

Обзор

Привет, Хабр!

Сегодня мы поговорим о том, какие LLM лучше всего работают на бизнес-задачах. AI-хайп находится на локальном пике, похоже, что весь мир только и делает, что внедряет AI-фичи в свои продукты, собирает миллионы на разработку еще одной оболочки для ChatGPT, заполняет свои ряды AI-тулами и, кажется, предоставляет работу роботам, пока сами попивают кофе в старбаксе.

SuvalexR 28 апр в 14:16

Вступление в мир разработки игр

Простой

5 мин

6.3K

Разработка мобильных приложений*Разработка игр*Машинное обучение*Развитие стартапа

Из песочницы

Исследуйте путь профессионала в области машинного обучения и его команды, погружаясь в разработку мобильных игр. Статья рассказывает о переходе от участия в соревнованиях на Kaggle к созданию мобильного приложения «Угадай фильм». Узнайте о проблемах разработки MVP для Android, интеграции техник машинного обучения с использованием OpenCV и различных этапах разработки и публикации приложения. Погрузитесь в процесс использования ИИ для дизайна, выбора кадров из фильмов и включения интересных фактов о фильмах через ChatGPT, завершившись успешным запуском в Google Play.

Muliwe 28 апр в 09:17

LLM-чатбот в основе консьерж-сервиса

Простой

9 мин

Машинное обучение*Искусственный интеллект

Кейс

Из песочницы

Когда мы с командой брались за создание MVP нашего консьерж-сервиса для букинга отелей, казалось, что это область, в которой давно не осталось нерешенных, и при этом значимых проблем, суть лишь в том, чтобы сделать сам процесс гибче и удобнее. Но на практике, разумеется, все оказалось несколько сложнее.

Использование стандартного набора инструментов в сочетании с новыми коммерческими API открыло перед нами не только новые горизонты, но и обеспечило массу подводных камней, вполне традиционных для такого рода технологических стартапов. О том, как мы с ними справлялись, мы и решили написать эту небольшую статью. Надеемся, что наши уроки помогут вам избежать наших ошибок и ускорить разработку вашего прототипа.

antipov_dmitry 27 апр в 16:11

AI-тренер, нейровоспитатель, ассесор, крауд и разметчик — кто все эти люди и в чем разница?

Простой

5 мин

528

Data Mining*Big Data*Машинное обучение*Искусственный интеллектData Engineering*

Обзор

Многие компании в последнее время ввели должность «ИИ-тренера» (AI-тренера), при этом просто разметчики/ассесоры никуда не делись. Что это — просто красивая обертка нейминга над тем же самыми или что-то концептуально новое?

Давайте попробуем в этом разобраться и однозначно ответить на вопрос о различиях.

GVRQ 27 апр в 12:07

GIGA R&D DAY: материалы конференции

Простой

6 мин

831

Блог компании SberDevicesМашинное обучение*Искусственный интеллект

На недавней конференции GIGA R&D DAY, организованной командой R&D SberDevices, участники обсудили последние достижения в разработке GigaChat, NLP, Vision и Audio.

Событие собрало ведущих специалистов и экспертов в области искусственного интеллекта, которые поделились своими идеями и разработками. В день рождения GigaChat'a делимся с вами видеозаписями выступлений и презентациями докладов, которые охватывают широкий спектр тем от мультимодальности и мультиэкспертности до проблем alignment и задач генерации речи.

+23

ilyakashlakov 27 апр в 11:50

Большие языковые модели в финтехе: можно ли доверять им данные

Простой

5 мин

1.5K

Блог компании ЮMoneyИнформационная безопасность*Машинное обучение*

Меня зовут Илья Кашлаков, я руковожу департаментом разработки в ЮMoney. Сегодня расскажу о том, какие задачи финтех может доверить большим языковым моделям (LLM) и как мы в компании следим за безопасностью, чтобы не допускать утечку данных. Также вспомним три самых распространённых уязвимости LLM из топа OWASP и почему выводу обученной модели нельзя доверять без факт-чекинга.

Статья будет полезна тем, кто планирует работать с LLM и пока не знает, какие в них бывают проблемы и риски.

aansty4U 27 апр в 07:15

На пути к полной жизни: Онлайн-синтез речи для людей с неврологическими нарушениями

Средний

8 мин

876

Блог компании BotHubМашинное обучение*Научно-популярноеБиотехнологииЗдоровье

Обзор

Многие люди теряют возможность поддерживать собственную независимость, вести активную социальную жизнь и просто взаимодействовать с окружающей средой, в связи с серьезными неврологическими заболеваниями.

Болезни и состояния, такие как БАС, инсульт, церебральный паралич, множественный склероз, болезнь Паркинсона, последствия черепно-мозговых травм, дистония, могут привести к частичной или полной потере способности к самостоятельному передвижению, речи и выполнению повседневных задач. Восстановить эти функции очень сложно, а в некоторых случаях вовсе невозможно.

Над этой проблемой работают многие исследователи, борясь за улучшение уровня жизни для таких пациентов.

В данной статье я расскажу о тестировании возможности применения технологии имплантируемого интерфейса “мозг-компьютер” (brain–computer interface) для онлайн-синтеза речи с использованием активности мозга, регистрируемой внутричерепными электродами, чтобы проложить путь к новым коммуникационным возможностям для людей, потерявших способность говорить.

Приятного прочтения!

+15

The-Founder-1 26 апр в 18:44

ViT для новичков: как нейросети научились определять зависимости в изображениях

Простой

8 мин

Python*Обработка изображений*Математика*Машинное обучение*

Обзор

В этой статье мы попытаемся рассказать про трансформерную архитектуру VIT и предысторию его формирования. Сегодня не совсем понятно, почему этот "формат" нейронок настолько эффективен. Некоторые говорят механизм внимания, но некоторые практики делают больше ставок в области Computer Vision на MetaFormer. https://github.com/sail-sg/poolformer

Нейросети остаются для нас “теневым” процессом, подобным черному ящику. И изучение Deep Learning уже напоминает больше не математику, а биологию, где мы следим за поведением нашего детища.

phillennium 26 апр в 14:04

Про ML по-серьёзному: что расскажут в докладах на I'ML

7 мин

1.3K

Блог компании JUG Ru GroupМашинное обучение*КонференцииИскусственный интеллектNatural Language Processing*

Слова «доклад про AI/ML» могут звучать словно очередной рассказ про будущее, где вкалывают роботы, а не человек. Такое мы все уже слышали сто раз.

Но на нашей онлайн-конференции I'ML всё будет иначе:
— Она рассчитана на тех, кто лично использует ML в проектах.
— Она не о далёком будущем, а о вопросах, актуальных уже здесь и сейчас.
— Она не об абстрактном («было бы здорово…»), а о конкретном: «как бороться с ML-галлюцинациями», «как рекомендовать размер одежды с помощью ML».
— Она не о том, как «нейросети отберут работу», а наоборот: о ML-работе, которую нейросети нам дали.

В общем, она не для желающих просто пофантазировать, а для специалистов, желающих эффективно работать.

А что именно там будет? До конференции остался месяц, и мы представляем Хабру её программу:

efreelancer 26 апр в 10:00

Обучение модели токсификации текстов с помощью TorchTune, подробное руководство

Средний

11 мин

2.2K

Python*Машинное обучение*Искусственный интеллектNatural Language Processing*

Туториал

Приветствую, хабровчане!

Сегодня пятница, поэтому предлагаю немного пошалить и поговорить о слегка необычном, но весьма забавном проекте обучения нейросетевой модели на базе LLaMA2 7B, которая умеет превращать невинные предложения на русском языке в чуть более "токсичные" их версии.

Но обучать модель мы будем не абы как, а при помощи недавно вышедшего в свет проекта под названием TorchTune, так как надо ведь пробовать новые инструменты, иными словами, предлагаю соединить тему интересную с темой полезной.

Так что пристегнитесь, будет весело и слегка токсично!

+10

demonuga1998 25 апр в 19:04

Распознавание, хранение и поиск лиц в базе данных

Средний

3 мин

Python*PostgreSQL*Машинное обучение*Искусственный интеллект

Из песочницы

В этой статье я максимально коротко и просто объясню принцип распознавания, хранения и поиска лиц в базе данных. В качестве примера будет использована библиотека Insightface и база данных PostgreSQL.

+24

Ilya12c 25 апр в 15:59

ClearML Data Management

15 мин

1.7K

Блог компании Magnus TechData Mining*Администрирование баз данных*Машинное обучение*Искусственный интеллект

Туториал

Очевидный для ML-инженера факт: если на вход модели подать мусор — на выходе тоже будет мусор. Это правило действует всегда, независимо от того, насколько у нас крутая модель. Поэтому важно понимать, как ваши данные будут храниться, использоваться, версионироваться и воспроизведутся ли при этом результаты экспериментов. Для всех перечисленных задач есть множество различных инструментов: DVC, MLflow, W&B, ClearML и другие. Git использовать недостаточно, потому что он не был спроектирован под требования ML. Но есть инструмент, который подходит для версионирования данных и не только — это ClearML. О нем я сегодня и расскажу.

Читать дальше →

+23

mcgrozov 25 апр в 15:51

Attaque a-la russe: атака с помощью промт-инъекций русскоязычных моделей семейства Saiga2

Простой

7 мин

2.4K

Информационная безопасность*Машинное обучение*Искусственный интеллект

Из песочницы

Насколько хорошо защищены открытые большие языковые модели от генерации вредоносного контента? Рассмотрим механизмы атаки с промт-инъекцией на большие языковые модели, а так же рекомендации по защите от них.

2 3 ...

325 326

Машинное обучение *

Новая эра диагностики: Как с помощью ИИ можно диагностировать рак кожи на ранней стадии

Новости

Инструменты AutoML в 2024

Фундамент AI: обратное распространение ошибки простыми словами

Подбор гиперпараметров RAG-системы с помощью Optuna

Питер Норвиг: автор лучшего в мире учебника по ИИ

Как обнаружить и устранить мультиколлинеарность с помощью Statsmodels в Питоне

Как сделать pruning, чтобы потом не плакать

LLM Leaderboard за апрель 2024

Вступление в мир разработки игр

LLM-чатбот в основе консьерж-сервиса

AI-тренер, нейровоспитатель, ассесор, крауд и разметчик — кто все эти люди и в чем разница?

GIGA R&D DAY: материалы конференции

Большие языковые модели в финтехе: можно ли доверять им данные

Ближайшие события

На пути к полной жизни: Онлайн-синтез речи для людей с неврологическими нарушениями

ViT для новичков: как нейросети научились определять зависимости в изображениях

Про ML по-серьёзному: что расскажут в докладах на I'ML

Обучение модели токсификации текстов с помощью TorchTune, подробное руководство

Распознавание, хранение и поиск лиц в базе данных

ClearML Data Management

Attaque a-la russe: атака с помощью промт-инъекций русскоязычных моделей семейства Saiga2

Вклад авторов

Работа