AlexHanguery 24 апр в 17:51

Suno есть, скрипач не нужен!?

Средний

15 мин

3.7K

Искусственный интеллектБудущее здесь

Мнение

+25

Комментарии 27

TommyG 24 апр в 18:28

Сейчас последняя версия v3, интересно смотреть качество в динамике и v3 реально пробила некий порог когда это воспринималось как забавая, но не очень серьёзная игрушка, то сейчас вполне готовый продукт, особенно на английском. Интересно слушать варианты созданные на совершенно не предназначенных для этого текстах, типа инструкции для драйвера мыши или что-то подобное.

Дальше будут двигать к студийному качеству, плюс добавят редактирование - типа не понравилась часть трека, сказал заменить и оценил получилось лучше или хуже предыдущей версии, тебе дали новый вариант с учётом пожеланий.

Судя по скорости генерации, не так чтобы и ресурсоёмкий процесс, может кто и опенсоурс варианты выпустит.

PS. Спасибо, очень крутая статья, не очень понятно почему через час после публикации, оценки всё ещё по нулям.

sterr 25 апр в 00:08

Самое хреновое, что нет запоминания итерации. Я например хочу что-то добавить в понравившейся мне стилистике, или сделать другую песню в таком же стиле. Но нет, каждый раз новое. И в последнее время качество генераций очень сильно упало. По тому же запросу выдается абсолютно разный, а иногда и очень кривой результат. Даже неделю назад мне нравились 50% генераций, а сейчас качественных 20%, но не то, что мне нужно, хотя запрос тот же.

positroid 25 апр в 09:07

>Даже неделю назад мне нравились 50% генераций, а сейчас качественных 20%, но не то, что мне нужно, хотя запрос тот же.

Мне кажется тут есть еще фактор насмотренности (наслушанности), могу сказать то же, что и вы, но у меня это случилось месяц назад после оформления PRO и большого количества экспериментов - через пару дней начал критичнее относиться к оценке результатов генераций

kasiopei 25 апр в 14:42

Можно продолжить песню с другим текстом.

Нагенерил 10 песен в похожем стиле. Через неделю снова его использовал и совсем другой результат.

AlexKub 2 мая в 08:14

Да, тоже заметил, что качество генераций сильно упало. Более того, когда делаешь продолжение понравившегося результата, начала резать качество "рендера" звука. Такое ощущение, что битрейт падает до 64 кб/с.
Я думаю, это для бесплатных аккаунтов сделали такое.
Платить и проверять некогда.

engine9 24 апр в 19:50

Спасибо за подробный гайд, суно — диавольская песочница, позволяющая творить музыкальные эксперименты. Самый любимый пример Дабстеп в стиле 20-х.

Загляните в плейлист, там есть "Lorem ipsum" исполненный хором и речь идущего к реке под драм-н-бэйс. Закидываю туда всякую дичь.

iShrimp 25 апр в 16:46

6 шагов загрузки Линукс - шедеврально! Так можно любой мануал или вообще любую книгу превратить в речитатив под музыку :)

engine9 25 апр в 21:40

Нейронка, к сожалению, иногда пропускает слова и даже фразы.

vros 26 апр в 08:59

Самый любимый пример Дабстеп в стиле 20-х.

Супер. От 20х там примерно первая минута, с 1:20 что-то резко более современое, а где-то на 3:10 чистый Skrillex.

engine9 26 апр в 21:34

Ага, самый сок вначале, потом накал трека проседает.

uhf 24 апр в 19:58

Suno генерирует, правильную, качественную, профессионально звучащую музыку

Ну как профессионально звучащую... как будто ее прогнали через GSM кодек =) И стереобазу выпилили, заменив на псевдостерео фазовращателем из 90-х ) И звучание инструментов тоже разнообразием не блещет. Чем больше треков слушаешь, тем больше напоминает предыдущие.
Вау-эффект поначалу есть, но непонятно, что с такой музыкой делать. Генерировать одноразовые смешные песенки для свадеб и корпоративов? Да, это можно.
Добавить в плэйлист? Нет, это вряд ли. Тут нейросети предстоит еще долго совершенствоваться. Искусство звукорежиссуры для меня выглядит одним из самых сложных и загадочных.

rPman 24 апр в 22:21

Генерировать фон для видеоблогеров, чтобы не агрился алгоритм правообладателей на youtube.

uhf 24 апр в 22:38

Да, уже видел на youtube. Заменитель музыки, идентичный натуральной.

engine9 26 апр в 22:09

Поёт нейронка, видеоряд с МКС. Не знаю как вам, а меня до мурашек.

jurikobe 26 апр в 08:58

Тут смотря о каких жанрах речь.. мой любимый ска панк просто неотличим от многоженства команд))

uhf 26 апр в 11:40

Вкусы у людей разные. Кто-то музыку на улице с телефона слушает ) Без наушников )) А кому-то обязательно HiFi система нужна.

maxsaf 24 апр в 20:29

Можно, как вариант, сгенерировать что-то интересное, в плане инструментала, потом перебить это в любимой DAW, используя нормальные семплы, подправить аранжировку, ну и для вокала нанять артиста или самому спеть. В общем, есть над чем подумать.

rPman 24 апр в 22:25

Как вы указали в lyric ударения?

И еще, пользуйтесь тегами, типа [Break], очень помогает разделить предложения, которые их алгоритм связывает 'на одном дыхании'

EugeneH 24 апр в 23:21

Советую еше попробовать Udio. Некоторым больше нравится и на бесплатном плане доступно 600 генераций в месяц.

У Суно под капотом диффузная модель, если я правильно понимаю. Никакого миди и пересборки треков там нет. Т. е. буквально модель типа Stable Diffusion, только обученная на мел-спектрограммах вместо картинок с котиками.

На HF лежит их предыдущая разработка - Bark TTS. При обучении Bark они обнаружили, что помимо речи модель неплохо умеет генерировать музыку, хотя не предназначалась для этого. Тогда они создали новую модель - Chirp - специально заточенную под генерацию музыки. За её развитием мы сейчас и наблюдаем.

Я сам долго использовал Bark в своих проектах. Подкупала простота локального запуска, естественный эмоциональный голос и возможность клонировать и "трансмутировать" голоса.

Диффузный подход, правда, накладывает ограничения - можно сгенерировать только кусок аудио определенной длины, около 11 секунд. Ни длиннее, ни короче нельзя. Соответственно, велика задержка.

Вторая проблема - модель не всегда следует промту и может выдавать белиберду.

Для TTS диффузный подход оказался не лучшим, зато нашел своё применение в генерации музыки. Надеюсь открытые модели появятся в ближайшем будущем.

AlexHanguery 24 апр в 23:39

Спасибо, становиться чуть понятнее! Вопросов много, только не могу сейчас этим заняться :-(, может через мес, другой

Antra 25 апр в 11:21

Ценная информация.

И есть шанс получить а-ля локальный Chirp? Ну гонять у себя, как stable Diffusion и всякие LLM.

GennPen 25 апр в 00:51

Попользовал Suno и Udio.

Udio лучше накладывает слова на мелодию. Голос и музыка качественней. Больше возможностей дополнять песню (вступление, конец, блоки спереди/сзади) Но иногда кажется что мелодию делает достаточно однообразную. Очень плохо смешивает различные жанры, особенно несочетаемые, получается мешанина. Но Suno в плане смешивания различных жанров в том числе несочетаемых очень хорош, иногда получается очень неплохие вещи.

Dewey 25 апр в 01:25

Как выяснилось, область применения Suno шире, чем можно было представить:

Hidden text

https://vk.com/wall-38946994_153129

z-sis-z 25 апр в 15:26

Я использую Suno как помощника, когда детям задают выучить стихотворение, делаю из него песню в стиле котором им нравиться. Учиться ли так быстрее не знаю, но точно веселее.

rPman 25 апр в 20:02

какие жанры лучше заходят детям именно чтобы выучить стих?

z-sis-z 26 апр в 15:25

Pop, различная электронная музыка и иногда gangsta-rap

vvche69 28 апр в 08:02

Нажми на кнопку - получишь результат,
И твоя мечта осуществится.
Нажми на кнопку, но что же ты не рад?
Тебе больше не к чему стремиться...

В общем, напророчили.

Зарегистрируйтесь на Хабре, чтобы оставить комментарий

Показать лучшие за всё время

Suno есть, скрипач не нужен!?

Комментарии 27

Публикации

Истории