Статьи / Профиль efreelancer / Хабр

Pavel Zloi @efreelancer

Software Developer

Профиль Публикации 4Комментарии 24Закладки 24

efreelancer 2 июн в 17:31

Enbeddrus — обучение независящей от языка эмбеддинг-модели

Средний

11 мин

1.7K

Python*Машинное обучение*Искусственный интеллектNatural Language Processing*

Туториал

Приветствую, хабровчане!

Сегодня я хочу рассказать вам историю о том, как я обучил простую и компактную независящую от языка модель-эмбеддер, которая умеет работать с техническими текстами о PHP и способна извлекать схожие эмбеддинги для параллельных текстов на английском и русском языках.

Основная причина, по которой я решил заняться этим проектом, заключается в том, что мои заметки, код и документация, накопленные за более чем десять лет практики, представляют собой солянку текстов о разных технологиях, языках программирования, пометки о настройке серверов Linux и т.д. на русском и английском языках. Поэтому мне захотелось сделать Retrieval-Augmented Generation (RAG) помогалку, которая сможет принимать запросы пользователя (меня) и эффективно находить информацию в столь разношерстой базе данных, независимо от того на каком языке я сделал запрос и на каком языке написана документация.

Для достижения этой цели необходима независимая от языка модель-эмбеддер, которая будет одинаково хорошо работать с техническими текстами на русском и английском языках.

Ещё одним важным аспектом было то, чтобы модель потребляла как можно меньше ресурсов и, если возможно, чтобы её можно было преобразовать в формат GGUF.

+15

efreelancer 26 апр в 10:00

Обучение модели токсификации текстов с помощью TorchTune, подробное руководство

Средний

11 мин

2.7K

Python*Машинное обучение*Искусственный интеллектNatural Language Processing*

Туториал

Приветствую, хабровчане!

Сегодня пятница, поэтому предлагаю немного пошалить и поговорить о слегка необычном, но весьма забавном проекте обучения нейросетевой модели на базе LLaMA2 7B, которая умеет превращать невинные предложения на русском языке в чуть более "токсичные" их версии.

Но обучать модель мы будем не абы как, а при помощи недавно вышедшего в свет проекта под названием TorchTune, так как надо ведь пробовать новые инструменты, иными словами, предлагаю соединить тему интересную с темой полезной.

Так что пристегнитесь, будет весело и слегка токсично!

+10

efreelancer 8 окт 2023 в 20:40

Дообучение ruGPT-3.5 13B с LoRA

Средний

10 мин

17K

Программирование*Машинное обучение*Искусственный интеллектNatural Language Processing*

Туториал

Добрый день, уважаемые читатели и авторы Хабра!

Сегодня я рад представить вам подробное руководство по обучению модели ruGPT-3.5 13B с использованием датасетов модели Saiga-2/GigaSaiga, технологии Peft/LoRA и технологии GGML. Эта статья призвана стать полезным и практичным ресурсом для всех, кто интересуется машинным обучением, искусственным интеллектом и глубоким обучением, а также для тех, кто стремится глубже понять и освоить процесс обучения одной из самых мощных и перспективных русскоязычных моделей.

В данной публикации мы разберем каждый этап обучения модели, начиная от подготовки данных и заканчивая конвертацией в формат GGML. Буду рад, если мой опыт и знания помогут вам в вашем исследовании и экспериментах в этой захватывающей области!

+30

efreelancer 19 апр 2020 в 19:31

Mikrotik RouterOS в Docker с помощью Qemu

9 мин

21K

Open source**nix*DevOps*

Из песочницы

Всем доброго времени суток! В данной статье я хочу рассказать об одном OpenSource проекте под названием Docker RouterOS, изначально он был создан в качестве полигона для прогонки интеграционных тестов и ничего более, но со временем, по просьбе пользователей, был добавлен ряд улучшений расширяющих спектр возможностей.

Рассказывать буду о причинах появления проекта, его первоначальных итерациях, а так же о проблемах с которыми пришлось столкнуться.

Продолжение под катом.

Читать дальше →

+16

Enbeddrus — обучение независящей от языка эмбеддинг-модели

Обучение модели токсификации текстов с помощью TorchTune, подробное руководство

Дообучение ruGPT-3.5 13B с LoRA

Mikrotik RouterOS в Docker с помощью Qemu

Информация

Специализация