Как стать автором
Обновить

Обучение модели токсификации текстов с помощью TorchTune, подробное руководство

Уровень сложностиСредний
Время на прочтение11 мин
Количество просмотров2.5K
Всего голосов 10: ↑10 и ↓0+10
Комментарии17

Комментарии 17

*** полёт мысли, сразу видно что вы *** талантливый ***.

Хоть первыми буквами намекните, даже интересно стало что ваш 4090 напридумывал)

Да, с примерами работы негусто.

Отличное замечание, сейчас займусь скриптиком.

Вот результаты тестов на 100 образцах текста из сплита dev датасета toxicator-ru.

Народ требует примеров, милорд!

Примеры тут.

5) По примерам больше похоже на матюгатор а не на токсонизатор) Токсичность это же не мат, да, нет? Например вы спрашиваете у прохожего "который час?" А он в ответ: "по солнцу не видишь?" или просто проходит мимо... А тут получается какая-то "гопотичность" а не токсичность)

У MTS была публикация про детоксикатор, в этой работе они как-раз создали модель, которая удаляет из сообщений "токсичность". А ещё есть метрика MERA под названием ruDetox, которая оценивает насколько хорошо русскоязычные модели справляются с задачами удаления ругательств из текста.

Так что в контексте языковых моделей под токсичностью имеют ввиду именно нецензурные выражения.

Ну а шуточная модель которую я обучил делает строго противоположную работу, отсюда и название "токсикатор" :)

Я бы назвал это грубостью. Ваша модель будет удалять грубость, а не токсичность. Токсичность, на мой вгляд, тоньше. Что-то мне подсказывает, что именно с этой задачей (убирать или добавлять грубость или токсичность, как и другие оттенки эмоционального окраса) нейросети потенциально, могут очень хорошо. Это подходящая для них задача, в отличие от решения математических задач. По этому, я попросл привести примеры бота на основе чат-жи-пи-ти

  1. Обычная фраза: "Ты сегодня выглядишь отлично!"   Токсичный аналог: "Ну наконец-то ты решил(а) приложить усилия к своему внешнему виду!"

    2. Обычная фраза: "Спасибо за твою помощь в проекте."
       Токсичный аналог: "О, ты ведь тоже пытался(ась) помочь? Не заметил(а)."

    3. Обычная фраза: "Ты справился(ась) с задачей очень хорошо."
       Токсичный аналог: "Ну вот, даже ты можешь быть полезным(ой), когда захочешь."

    4. Обычная фраза: "Твоё мнение действительно важно для нас."
       Токсичный аналог: "Да, конечно, расскажи нам ещё о своих уникальных взглядах на мир."

    5. Обычная фраза: "Ты сегодня опоздал(а), все бывает."
       Токсичный аналог: "Мы всегда можем рассчитывать на твою непунктуальность."

Как видите, бот справился. Я даже увлекся эксперементируя... Кстати, таким же образом можно сразу датасет собрать.

Про "полет мысли..." не нашел, эх)

Добавил чуть больше букв в том месте где была цитата, чтобы было понятно, что там модель нагенерила.

А можно на выход детокс модель подключить и сравнивать вернула она оригинальный инпут или нет? Или стравить две модели как-нибудь, чтоб они "пообщались" друг с другом?)

Конечно можно, если соединить токсикатор и детоксикатор то может получиться неплохой бенчмарк, сейчас попробую собрать нечто подобное.

А как отличить токсичные высказывания от просто эмоциональных с не нормативной лексикой?

Правильного ответа на данный вопрос к сожалению не знаю. Мне кажется, что различить подобное крайне сложно, лично у меня градация во время сборки датасета была простая: есть мат - токсичное, нет - обычное. Насколько это оптимальная градация думаю лучше у специалистов из области психологии или лингвистики уточнить.

Я думаю, не надо их отличать, нужно просто достаточно большую модель попросить сделать текст вежливее. А маленькую можно на сгенерированных примерах большой модели обучить. Это же и есть "дистиляция" знаний.

Однажды, моя бухгалтерия не выставляла счета в течении года контрагенту. В результате возникла щекотливая ситуация, в которой виноваты были мы, а требовать возврата долга нужно было у контрагента. Я прокрастинировал с деловым письмом неделю, а потом описал ситуацию и попросли чатжипити сформулировать за меня письмо "в вежливом деловом стиле, не отрицая нашей вины, извиниться и, тем не менее, твердо потребовать закрыть задолженность до конца года".

Результат превзошел все ожидания! Получилось и вежливо и уместно и в тоже время твердо, но так что прям стыдно не заплатить.

Что-то вспомнился анекдот (вольный пересказ по памяти):

У нас в коллективе большие проблемы со скрытой агрессией. Поэтому было принято решение во всех корпоративных средствах коммуникации дополнять обращение строкой «, п***р!» А с открытой агрессией справляться мы уже научились!

И никаких RTX-4090!

Зарегистрируйтесь на Хабре, чтобы оставить комментарий

Публикации

Истории