efreelancer 26 апр в 10:00

Обучение модели токсификации текстов с помощью TorchTune, подробное руководство

Средний

11 мин

2.5K

Python*Машинное обучение*Искусственный интеллектNatural Language Processing*

Туториал

+10

Комментарии 17

vaniacer 26 апр в 10:55

*** полёт мысли, сразу видно что вы *** талантливый ***.

Хоть первыми буквами намекните, даже интересно стало что ваш 4090 напридумывал)

Evgenym 26 апр в 11:29

Да, с примерами работы негусто.

efreelancer 26 апр в 11:48

Отличное замечание, сейчас займусь скриптиком.

efreelancer 26 апр в 12:32

Вот результаты тестов на 100 образцах текста из сплита dev датасета toxicator-ru.

gxcreator 26 апр в 11:47

Народ требует примеров, милорд!

efreelancer 26 апр в 12:31

Примеры тут.

vaniacer 26 апр в 15:52

5) По примерам больше похоже на матюгатор а не на токсонизатор) Токсичность это же не мат, да, нет? Например вы спрашиваете у прохожего "который час?" А он в ответ: "по солнцу не видишь?" или просто проходит мимо... А тут получается какая-то "гопотичность" а не токсичность)

efreelancer 26 апр в 16:50

У MTS была публикация про детоксикатор, в этой работе они как-раз создали модель, которая удаляет из сообщений "токсичность". А ещё есть метрика MERA под названием ruDetox, которая оценивает насколько хорошо русскоязычные модели справляются с задачами удаления ругательств из текста.

Так что в контексте языковых моделей под токсичностью имеют ввиду именно нецензурные выражения.

Ну а шуточная модель которую я обучил делает строго противоположную работу, отсюда и название "токсикатор" :)

riv9231 27 апр в 08:00

Я бы назвал это грубостью. Ваша модель будет удалять грубость, а не токсичность. Токсичность, на мой вгляд, тоньше. Что-то мне подсказывает, что именно с этой задачей (убирать или добавлять грубость или токсичность, как и другие оттенки эмоционального окраса) нейросети потенциально, могут очень хорошо. Это подходящая для них задача, в отличие от решения математических задач. По этому, я попросл привести примеры бота на основе чат-жи-пи-ти

Обычная фраза: "Ты сегодня выглядишь отлично!"   Токсичный аналог: "Ну наконец-то ты решил(а) приложить усилия к своему внешнему виду!"
2. Обычная фраза: "Спасибо за твою помощь в проекте."
   Токсичный аналог: "О, ты ведь тоже пытался(ась) помочь? Не заметил(а)."
3. Обычная фраза: "Ты справился(ась) с задачей очень хорошо."
   Токсичный аналог: "Ну вот, даже ты можешь быть полезным(ой), когда захочешь."
4. Обычная фраза: "Твоё мнение действительно важно для нас."
   Токсичный аналог: "Да, конечно, расскажи нам ещё о своих уникальных взглядах на мир."
5. Обычная фраза: "Ты сегодня опоздал(а), все бывает."
   Токсичный аналог: "Мы всегда можем рассчитывать на твою непунктуальность."

Как видите, бот справился. Я даже увлекся эксперементируя... Кстати, таким же образом можно сразу датасет собрать.

vaniacer 26 апр в 15:57

Про "полет мысли..." не нашел, эх)

efreelancer 26 апр в 16:56

Добавил чуть больше букв в том месте где была цитата, чтобы было понятно, что там модель нагенерила.

vaniacer 26 апр в 11:58

А можно на выход детокс модель подключить и сравнивать вернула она оригинальный инпут или нет? Или стравить две модели как-нибудь, чтоб они "пообщались" друг с другом?)

efreelancer 26 апр в 12:35

Конечно можно, если соединить токсикатор и детоксикатор то может получиться неплохой бенчмарк, сейчас попробую собрать нечто подобное.

ihouser 26 апр в 12:55

А как отличить токсичные высказывания от просто эмоциональных с не нормативной лексикой?

efreelancer 26 апр в 13:08

Правильного ответа на данный вопрос к сожалению не знаю. Мне кажется, что различить подобное крайне сложно, лично у меня градация во время сборки датасета была простая: есть мат - токсичное, нет - обычное. Насколько это оптимальная градация думаю лучше у специалистов из области психологии или лингвистики уточнить.

riv9231 27 апр в 08:09

Я думаю, не надо их отличать, нужно просто достаточно большую модель попросить сделать текст вежливее. А маленькую можно на сгенерированных примерах большой модели обучить. Это же и есть "дистиляция" знаний.

Однажды, моя бухгалтерия не выставляла счета в течении года контрагенту. В результате возникла щекотливая ситуация, в которой виноваты были мы, а требовать возврата долга нужно было у контрагента. Я прокрастинировал с деловым письмом неделю, а потом описал ситуацию и попросли чатжипити сформулировать за меня письмо "в вежливом деловом стиле, не отрицая нашей вины, извиниться и, тем не менее, твердо потребовать закрыть задолженность до конца года".

Результат превзошел все ожидания! Получилось и вежливо и уместно и в тоже время твердо, но так что прям стыдно не заплатить.

ThingCrimson 26 апр в 20:48

Что-то вспомнился анекдот (вольный пересказ по памяти):

У нас в коллективе большие проблемы со скрытой агрессией. Поэтому было принято решение во всех корпоративных средствах коммуникации дополнять обращение строкой «, п***р!» А с открытой агрессией справляться мы уже научились!

И никаких RTX-4090!

Зарегистрируйтесь на Хабре, чтобы оставить комментарий

Показать лучшие за всё время

Обучение модели токсификации текстов с помощью TorchTune, подробное руководство

Комментарии 17

Публикации

Истории