Как стать автором
Обновить

Комментарии 27

Сейчас последняя версия v3, интересно смотреть качество в динамике и v3 реально пробила некий порог когда это воспринималось как забавая, но не очень серьёзная игрушка, то сейчас вполне готовый продукт, особенно на английском. Интересно слушать варианты созданные на совершенно не предназначенных для этого текстах, типа инструкции для драйвера мыши или что-то подобное.

Дальше будут двигать к студийному качеству, плюс добавят редактирование - типа не понравилась часть трека, сказал заменить и оценил получилось лучше или хуже предыдущей версии, тебе дали новый вариант с учётом пожеланий.

Судя по скорости генерации, не так чтобы и ресурсоёмкий процесс, может кто и опенсоурс варианты выпустит.

PS. Спасибо, очень крутая статья, не очень понятно почему через час после публикации, оценки всё ещё по нулям.

Самое хреновое, что нет запоминания итерации. Я например хочу что-то добавить в понравившейся мне стилистике, или сделать другую песню в таком же стиле. Но нет, каждый раз новое. И в последнее время качество генераций очень сильно упало. По тому же запросу выдается абсолютно разный, а иногда и очень кривой результат. Даже неделю назад мне нравились 50% генераций, а сейчас качественных 20%, но не то, что мне нужно, хотя запрос тот же.

 >Даже неделю назад мне нравились 50% генераций, а сейчас качественных 20%, но не то, что мне нужно, хотя запрос тот же.

Мне кажется тут есть еще фактор насмотренности (наслушанности), могу сказать то же, что и вы, но у меня это случилось месяц назад после оформления PRO и большого количества экспериментов - через пару дней начал критичнее относиться к оценке результатов генераций

Можно продолжить песню с другим текстом.

Нагенерил 10 песен в похожем стиле. Через неделю снова его использовал и совсем другой результат.

Да, тоже заметил, что качество генераций сильно упало. Более того, когда делаешь продолжение понравившегося результата, начала резать качество "рендера" звука. Такое ощущение, что битрейт падает до 64 кб/с.
Я думаю, это для бесплатных аккаунтов сделали такое.
Платить и проверять некогда.

Спасибо за подробный гайд, суно — диавольская песочница, позволяющая творить музыкальные эксперименты. Самый любимый пример Дабстеп в стиле 20-х.

Загляните в плейлист, там есть "Lorem ipsum" исполненный хором и речь идущего к реке под драм-н-бэйс. Закидываю туда всякую дичь.

6 шагов загрузки Линукс - шедеврально! Так можно любой мануал или вообще любую книгу превратить в речитатив под музыку :)

Нейронка, к сожалению, иногда пропускает слова и даже фразы.

Самый любимый пример Дабстеп в стиле 20-х.

Супер. От 20х там примерно первая минута, с 1:20 что-то резко более современое, а где-то на 3:10 чистый Skrillex.

Suno генерирует, правильную, качественную, профессионально звучащую музыку

Ну как профессионально звучащую... как будто ее прогнали через GSM кодек =) И стереобазу выпилили, заменив на псевдостерео фазовращателем из 90-х ) И звучание инструментов тоже разнообразием не блещет. Чем больше треков слушаешь, тем больше напоминает предыдущие.
Вау-эффект поначалу есть, но непонятно, что с такой музыкой делать. Генерировать одноразовые смешные песенки для свадеб и корпоративов? Да, это можно.
Добавить в плэйлист? Нет, это вряд ли. Тут нейросети предстоит еще долго совершенствоваться. Искусство звукорежиссуры для меня выглядит одним из самых сложных и загадочных.

Генерировать фон для видеоблогеров, чтобы не агрился алгоритм правообладателей на youtube.

Да, уже видел на youtube. Заменитель музыки, идентичный натуральной.

Поёт нейронка, видеоряд с МКС. Не знаю как вам, а меня до мурашек.

Тут смотря о каких жанрах речь.. мой любимый ска панк просто неотличим от многоженства команд))

Вкусы у людей разные. Кто-то музыку на улице с телефона слушает ) Без наушников )) А кому-то обязательно HiFi система нужна.

Можно, как вариант, сгенерировать что-то интересное, в плане инструментала, потом перебить это в любимой DAW, используя нормальные семплы, подправить аранжировку, ну и для вокала нанять артиста или самому спеть. В общем, есть над чем подумать.

Как вы указали в lyric ударения?

И еще, пользуйтесь тегами, типа [Break], очень помогает разделить предложения, которые их алгоритм связывает 'на одном дыхании'

Советую еше попробовать Udio. Некоторым больше нравится и на бесплатном плане доступно 600 генераций в месяц.

У Суно под капотом диффузная модель, если я правильно понимаю. Никакого миди и пересборки треков там нет. Т. е. буквально модель типа Stable Diffusion, только обученная на мел-спектрограммах вместо картинок с котиками.

На HF лежит их предыдущая разработка - Bark TTS. При обучении Bark они обнаружили, что помимо речи модель неплохо умеет генерировать музыку, хотя не предназначалась для этого. Тогда они создали новую модель - Chirp - специально заточенную под генерацию музыки. За её развитием мы сейчас и наблюдаем.

Я сам долго использовал Bark в своих проектах. Подкупала простота локального запуска, естественный эмоциональный голос и возможность клонировать и "трансмутировать" голоса.

Диффузный подход, правда, накладывает ограничения - можно сгенерировать только кусок аудио определенной длины, около 11 секунд. Ни длиннее, ни короче нельзя. Соответственно, велика задержка.

Вторая проблема - модель не всегда следует промту и может выдавать белиберду.

Для TTS диффузный подход оказался не лучшим, зато нашел своё применение в генерации музыки. Надеюсь открытые модели появятся в ближайшем будущем.

Спасибо, становиться чуть понятнее! Вопросов много, только не могу сейчас этим заняться :-(, может через мес, другой

Ценная информация.

И есть шанс получить а-ля локальный Chirp? Ну гонять у себя, как stable Diffusion и всякие LLM.

Попользовал Suno и Udio.

Udio лучше накладывает слова на мелодию. Голос и музыка качественней. Больше возможностей дополнять песню (вступление, конец, блоки спереди/сзади) Но иногда кажется что мелодию делает достаточно однообразную. Очень плохо смешивает различные жанры, особенно несочетаемые, получается мешанина. Но Suno в плане смешивания различных жанров в том числе несочетаемых очень хорош, иногда получается очень неплохие вещи.

Как выяснилось, область применения Suno шире, чем можно было представить:

Hidden text

https://vk.com/wall-38946994_153129

Я использую Suno как помощника, когда детям задают выучить стихотворение, делаю из него песню в стиле котором им нравиться. Учиться ли так быстрее не знаю, но точно веселее.

какие жанры лучше заходят детям именно чтобы выучить стих?

Pop, различная электронная музыка и иногда gangsta-rap

Нажми на кнопку - получишь результат,
И твоя мечта осуществится.
Нажми на кнопку, но что же ты не рад?
Тебе больше не к чему стремиться...


В общем, напророчили.

Зарегистрируйтесь на Хабре, чтобы оставить комментарий

Публикации

Истории