Яндекс, Москва - Как мы делаем Яндекс / Статьи / Хабр

Профиль Статьи 1.9KПосты 10Новости 35Подписчики 207K

Как мы готовим RL для Alignment в больших языковых моделях: опыт команды YandexGPT

28 мин

6.3K

Блог компании ЯндексАлгоритмы*Машинное обучение*Искусственный интеллектNatural Language Processing*

Сегодня через API стала доступна новая модель YandexGPT 3 Lite. Одним из ключевых этапов её обучения, как и в случае с другими недавними моделями, стал этап выравнивания (Alignment), включающий в том числе стадию обучения с подкреплением (RL). Пожалуй, без этого этапа мы бы не смогли добиться такого роста в качестве, который был необходим для запуска новых возможностей и сервисов (например, Нейро). Поэтому эту статью мы полностью посвятим особенностям выравнивания моделей.

На тему Alignment и RL было написано уже немало статей. Кажется, любой ML-инженер уже, так или иначе, сталкивался или читал о них. Поэтому мы хоть и напомним базовую информацию, но всё же сфокусируемся на тех деталях реализации, которые не на слуху.

+56

20 ноя 2023 в 10:02

Что ты такое, dhclient?

19 мин

39K

Кейс

✏️ Технотекст 2023

+221

27 сен 2023 в 10:00

Хороший ретрай, плохой ретрай, или История одного падения

Средний

17 мин

39K

+152

14 мар в 10:00

Как работает кнопка Mute на Яндекс Станции. Подробный разбор логики и схем

Средний

7 мин

40K

+108

195

NatalieVT 24 мая в 10:18

Как устроен рекомендательный сервис, который выдерживает 700 тысяч запросов в секунду. Доклад Яндекса

11 мин

9.5K

Блог компании ЯндексВысокая производительность*Анализ и проектирование систем*Машинное обучение*

«Баннерная крутилка» — один из самых высоконагруженных сервисов в Яндексе. Он умеет переживать 700 тысяч RPS, а иногда и больше. Каждый раз, когда приходит запрос, крутилка должна просмотреть базу из миллиарда документов и выбрать из них самые релевантные для пользователя. При этом выдерживаются весьма жесткие временные рамки: 99% всех запросов обрабатываются менее чем за 200 миллисекунд.

Какими принципами стоит руководствоваться при построении подобных высоконагруженных систем? Как устроены стадии отбора документов? Какое участие в ранжировании принимает ML? Обо всём этом на недавнем мероприятии для разработчиков в Ереване рассказал Артём Ваншулин, руководитель разработки ранжирования в команде баннерной системы. Сегодня мы делимся с сообществом текстовой версией его доклада. Передаём ему слово.

+30

antoshkka 16 мая в 11:02

userver 2.0 — большой релиз фреймворка для IO-bound программ

6 мин

Блог компании ЯндексВысокая производительность*Open source*C++*Микросервисы*

С момента прошлого релиза фреймворка 🐙 userver для С++ прошло чуть больше полугода. За это время мы многое сделали:

сильно оптимизировали работу фреймворка и обогнали основных конкурентов в бенчмарках высокопроизводительных фреймворков;
значительно упростили конфигурирование;
обзавелись install, докер-образами, Yandex Cloud-образом и DEB-пакетами;
обросли новой функциональностью, включая серверные мидлвари для HTTP, и YDB-драйвером;
перешли на новую ежемесячную схему релизов и упростили версионирование.

Добро пожаловать под кат за подробностями

+54

mana-y 15 мая в 15:26

DivKit теперь и для Flutter. Рассказываем об особенностях BDUI-фреймворка Яндекса

Средний

14 мин

Блог компании ЯндексOpen source*Разработка мобильных приложений*Интерфейсы*Flutter*

Обзор

Полтора года назад мы выпустили в опенсорс DivKit — фреймворк для отрисовки интерфейсов из ответа сервера. На тот момент он уже прошёл проверку временем внутри компании и применялся в приложении Яндекс, Алисе, Маркете, Едадиле и других сервисах. С тех пор инструмент прошёл длинный путь. И сегодня у нас по-настоящему важная новость: мы выпускаем в свободный доступ долгожданный клиент для Flutter.

В статье расскажем об особенностях вёрстки в DivKit и нашей реализации UI. Вы узнаете, какие фичи и компоненты Flutter поддерживаются во фреймворке на текущий момент. Покажем, как начать пользоваться клиентом уже сейчас.

+29

YandexCloudEditor 8 мая в 10:00

Удалённое исполнение кода в ML: подходы и инструменты. Доклад Яндекса

9 мин

1.8K

Блог компании ЯндексБлог компании Yandex Cloud & Yandex InfrastructureOpen source*IT-инфраструктура*Машинное обучение*

Всем привет. На связи Артём Гойлик @ArtoLord и Владислав Волох @Chillintano из команды DataSphere в Yandex Cloud. Мы создаём инфраструктуру для ML-разработчиков. И сегодня расскажем про одну задачу, которая, как и многие другие, начиналась с болей наших пользователей.

+13

bobermaniac 27 апр в 12:45

«Когда будет готово?». Декомпозируем задачи и оцениваем сроки без фатальных ошибок

Средний

11 мин

13K

Блог компании ЯндексБлог компании Яндекс 360Управление разработкой*Управление проектами*

Мнение

Всем привет! Я Виктор Брыксин, руковожу разработкой Яндекс Телемоста. В статье поговорим про декомпозицию задач в проекте и как можно получить реальные сроки его выполнения.

Спойлер: вы все равно ошибетесь, прогнозируя сроки. Но что можно сделать? Минимизировать шанс на ошибки и сделать их менее фатальными. Я расскажу про рабочие инструменты, которые помогли мне в свое время, — брать их на вооружение или нет, решайте сами. Если вы не знаете, как подступиться к декомпозиции сложного проекта и с чего начать, — эта статья вам в помощь.

+41

aozeritsky 24 апр в 10:00

Эволюция обработки данных: от MapReduce к стриминговому движку

7 мин

6.5K

Блог компании ЯндексБлог компании Yandex Cloud & Yandex InfrastructureSQL*Администрирование баз данных*Хранение данных*

Кейс

Yandex Query Language (YQL) — универсальный декларативный язык запросов к системам хранения и обработки данных, разработанный в Яндексе. А ещё это один из самых нагруженных сервисов: YQL ежедневно обрабатывает около 800 петабайт данных и 600 000 SQL-запросов, и эти показатели постоянно растут.

Изначально YQL основывался на операциях MapReduce, которые эффективны для больших данных. Но для средних объёмов данных (до 50 Гб, которые составляют около 60% запросов) этот подход оказался неоптимальным, потому что нужно было обмениваться данными между операциями через диск. Поэтому разработчики создали новый более гибкий стриминговый движок, который значительно ускоряет обработку данных за счёт выполнения всех вычислений в памяти.

В этой статье я хочу рассказать о подходах и технологиях в разработке систем для обработки данных на примере YQL. Основное внимание я уделил переходу от MapReduce к стриминговому движку, который обеспечивает более эффективную обработку данных, вмещающихся в память, и который доступен в опенсорсе.

+39

Strannii 23 апр в 10:02

Домик Алисы, светлячки и огурчики. Какие пасхалки есть в Яндекс Станциях

Простой

5 мин

23K

Блог компании ЯндексСхемотехника*Производство и разработка электроники*ГаджетыКомпьютерное железо

Привет! Это Алексей Фоменко, инженер-электронщик Алисы и умных устройств. Я руковожу группой аппаратной разработки, но время от времени делаю платы и своими руками.

Наши инженеры с огромным трепетом относятся к каждой плате, которую они создают, уделяя внимание мельчайшим деталям. Можно сказать, вкладывают в каждую Станцию частичку себя. Проведя с проектом платы огромное количество часов, хочется оставить какое-то невинное и милое послание прямо от создателя к самому искушённому пользователю. Такие послания ещё называют «пасхалками». И да, они есть и в наших Станциях. Покажу несколько под катом.

+93

aldrchist 19 апр в 11:01

Как мы тестируем беспилотные автомобили с помощью симуляций

Простой

12 мин

4.2K

Блог компании ЯндексБлог компании Конференции Олега Бунина (Онтико)Машинное обучение*Искусственный интеллектТранспорт

Всем привет! Это Александр Чистяков из команды беспилотных автомобилей Яндекса. Мой доклад посвящён симуляторам: что это, зачем, как это устроено изнутри и какие в симуляции есть подводные камни, неожиданные парадоксы. Также расскажу, с помощью каких алгоритмических или архитектурных решений мы со всеми этими парадоксами боремся.

+27

zergood 18 апр в 13:00

Как найти баланс между интересами покупателей и продавцов: опыт разработчиков Яндекс Маркета

7 мин

2.2K

Блог компании ЯндексАлгоритмы*Машинное обучение*Интернет-маркетинг*Контекстная реклама*

Привет, Хабр! Меня зовут Илья Ненахов, я руковожу разработкой платформы для продвижения товаров на Яндекс Маркете. Предлагаю взглянуть на площадку немного с другой стороны, а именно — как на механизм, который пытается найти оптимальную точку в пространстве с тремя измерениями: интересы пользователя, интересы магазинов и интересы самого сервиса.

В этой статье я расскажу о том, как мы поддерживаем этот баланс с помощью технологий Яндекса. Поговорим про метрики, ранжирование и устройство рантайма. Наш опыт может быть полезен тем разработчикам, которые работают над похожими задачами в других компаниях.

+16

sipayrt 18 апр в 10:00

Testplane в опенсорсе: автоматизируем пользовательские сценарии в веб-интерфейсах

5 мин

Блог компании ЯндексВеб-разработка*Open source*Интерфейсы*Тестирование веб-сервисов*

Привет! Меня зовут Евгений Константинов. Я занимаюсь разработкой инструментов автоматического тестирования в Яндексе. В этой статье хочу рассказать про историю создания инструмента Testplane

Testplane поможет вам:

- протестировать разные сценарии в любом браузере;

- проверить вёрстку с помощью скриншотного тестирования;

- выполнить тестирование ваших React-компонентов;

- запустить клиентские unit-тесты в контексте браузера.

+33

hommforever 16 апр в 13:01

Яндекс запустил Нейро. Рассказываем, как он работает

Средний

14 мин

54K

Блог компании ЯндексПоисковые технологии*Алгоритмы*Машинное обучение*Искусственный интеллект

Сегодня мы запустили новый сервис Нейро — новый способ поиска ответов на вопросы. Пользователь может задать Нейро любой вопрос, а тот сам подберёт подходящие материалы в Поиске, проанализирует их и соберёт найденную информацию в одном ответе, подкрепив его ссылками на источники. Нейро объединил опыт Яндекса в создании поисковых технологий и больших языковых моделей.

Меня зовут Андрей Сюткин, и я отвечаю за ML-трек в Нейро. В этой статье покажу, как выглядит архитектура Нейро и как формируются ответы на технологическом уровне. Ну и, конечно же, поговорим о нейросетях, в том числе о YandexGPT 3, без обучения которых новый сервис просто не увидел бы свет.

+91

143

MikeLukashin 15 апр в 10:00

Как и зачем мы строили 3D-модели достопримечательностей на Картах

15 мин

5.6K

Блог компании ЯндексРабота с 3D-графикой*Геоинформационные сервисы*ДизайнУрбанизм

За последний год мы добавили много нового на Яндекс Карты: например, высокодетализированные дороги с подробной разметкой, растительность, а ещё совершенно новые, цветные и детальные 3D-модели достопримечательностей. Их можно увидеть, приблизив, например, Пушкинский музей, главное здание МГУ, Казанский собор и другие известные места во многих городах России и мира.

Привет, меня зовут Миша, я старший дизайнер продукта в Яндекс Картах. В этой статье я расскажу об особенностях запуска 3D-моделей достопримечательностей на Картах, о том, как они помогают пользователям, и, конечно, о тонкостях процесса дизайна и производства.

+31

iltsarev 11 апр в 11:30

Может ли мобильный-разработчик стать CTO?

Простой

20 мин

8.5K

Блог компании ЯндексРазработка мобильных приложений*Управление разработкой*Карьера в IT-индустрии

Мнение

Да, может. На этом статью можно было бы закончить. Спасибо, что дочитали до конца, приходите поделиться своим опытом в комментариях.

Если серьёзно, карьера мобильного разработчика, который хочет вырасти в большого руководителя, может складываться по-разному. Например, мой путь начался в 2013 году, и за это время я успел поработать и в маленьких стартапах, и в больших корпорациях. Сейчас я Director of Engineering в Яндекс Go. Последние шесть лет я управляю разными командами разного размера: от 5 до 200+ человек.

В этой статье я хочу рассказать, какие есть пути развития в мобильной разработке, что делать, если ты уже тимлид, кто такие крутые Individual Contributors (топовые разработчики) и как стать одним из них. Обо всём этом читайте под катом: попробуем разобраться, как расти и куда это может завести.

+28

Limows 10 апр в 10:00

История ритм-игр: от «Саймона» до Just Dance

Простой

12 мин

1.5K

Блог компании ЯндексРазработка игр*История ITСтарое железоИгры и игровые консоли

Не помню, в какую первую ритм-игру мне удалось сыграть. Был ли это Dance Dance Revolution в аркадном зале или Patapon на PSP? А вообще, кажется, это были мини-игры в «Рататуе» на PlayStation 2 (помните этого маленького крыса?). Так или иначе, ещё до этого я часто выстукивал или насвистывал всякие ритмы из услышанных мною песен. И как-то так получилось, что с возрастом эта любовь к видеоиграм в целом и ритм-играм в частности только росла.

Когда открылся Яндекс Музей на Павелецкой, там сразу была доступна ритм-игра Taiko — совершенно новое для меня развлечение. Потом я сам принёс Wii с гитарами, подтянулись игры на PlayStation 2 и 3… Короче, мой кругозор относительно этого жанра серьёзно расширился.

А так как я, знаете ли, тоже своего рода историк, мне стало интересно, откуда вообще появились ритм-игры. Возможно, какая-то из них была самой самой первой и зародила жанр. Да и когда были выпущены известные нам сегодня аркадные и домашние проекты?

С этими вопросами я отправился в интернет. Оказалось, что русскоязычной информации довольно мало и как обычно пришлось глубоко закапываться в иностранные версии Википедии и веб-архив. Итогом моего исследования стала эта статья. И сегодня я хочу рассказать вам о том, как началась история ритм-игр. Мы коснёмся далеко не всех представителей жанра, но постараемся проследить процесс его становления и развития.

+16

snk4tr 9 апр в 10:15

Открываем YandexART API и рассказываем, как мы учили нейросеть создавать картинки, которые понравятся людям

16 мин

13K

Блог компании ЯндексБлог компании Yandex Cloud & Yandex InfrastructureОбработка изображений*Машинное обучение*Искусственный интеллект

В Yandex Cloud с сегодняшнего дня открыт доступ к тестированию API YandexART — нейросети для генерации изображений и анимаций, которая лежит в основе приложения Шедеврум. Протестировать API можно в сервисе Foundation Models, в котором доступно несколько моделей машинного обучения, включая YandexGPT для генерации текстов и эмбеддинги для задач семантического поиска.

+37

vadvolo 4 апр в 10:30

Автоматизируем сеть Яндекса с Милошем: сервис конфигураций оборудования

19 мин

7.8K

Блог компании ЯндексБлог компании Yandex Cloud & Yandex InfrastructureIT-инфраструктура*Сетевые технологии*Сетевое оборудование

Задумывались ли вы о том, как изменить конфигурацию сразу на нескольких сетевых устройствах? Что, если нужно сделать это на всей сети с сотнями и тысячами единиц оборудования? А что, если приходится делать это каждый месяц на железе от пяти разных производителей? Очевидное решение для подобных задач — автоматизация. Но реализовать её можно не одним способом, а в процессе наткнуться не на одни грабли.

Меня зовут Вадим Воловик, и я руковожу проектами разработки в Yandex Infrastructure. Наша команда NOCDEV отвечает за автоматизацию сетей всего Яндекса. Давно хотелось рассказать о задачах такого масштаба, но по ходу написания материала стало понятно, что тема тянет на целый цикл. Так что мы с коллегами расскажем о самых интересных примерах автоматизации в отдельных постах.

В этой статье проведём небольшую экскурсию по нашему сетевому «хозяйству» в десятки тысяч устройств и остановимся подробнее на том, как при таком объёме мы автоматически обновляем конфигурации.

+26

sergiorussia 3 апр в 10:00

Как мы переехали с Oracle на PostgreSQL в нагруженном сервисе без даунтайма

Средний

30 мин

24K

Блог компании ЯндексOracle*PostgreSQL*Администрирование баз данных*

Кейс

Всем привет! Я Сергей, работаю в B2B-команде Яндекс Маркета последние 3,5 года. Как уже понятно из заголовка, сейчас я вам расскажу про yet-another-миграцию с базы на базу, которая началась в середине 2021 года и заняла почти год. Получается, мемуары.

Вас ждёт рассказ о том, как мы:

- несколько месяцев чинили тесты и делали трансформер;

- десятки раз переливали данные;

- чинили баги незаметно для пользователей;

- заставили сервис работать на PostgreSQL быстрее, чем он работал на Oracle.

+92

roman-gorb 2 апр в 10:01

Ускорение инференса LLM

Средний

13 мин

7.8K

Блог компании ЯндексПрограммирование*Алгоритмы*Машинное обучение*Искусственный интеллект

Инференсом ML-модели называют процесс её работы на конечном устройстве. Соответственно, чем больше мы разгоняем инференс, тем быстрее работает модель. Скорость может зависеть от разных условий, например, от архитектуры, которую вы выбрали для модели, или от железа, на котором работает устройство. Кроме того, проблема тяжёлого инференса остро ощущается на больших языковых моделях (LLM) так остро, как ни на каких других моделях.

Меня зовут Роман Горб, я старший ML-разработчик в команде YandexGPT. Тема инференса LLM заинтересовала меня, потому что я занимался R&D в квантовании сеток для CV-задач. Сегодня я расскажу, как безболезненно увеличить скорость инференса. Сперва разберёмся, зачем это нужно, а потом рассмотрим разные методы ускорения и фреймворки, которые могут в этом помочь.

Ускоряемся

+30

levdikpavel 29 мар в 10:00

Внутри S3. Доклад Яндекса

12 мин

19K

Блог компании ЯндексБлог компании Yandex Cloud & Yandex InfrastructureВысокая производительность*PostgreSQL*Go*

Привет, я Паша, разработчик в Yandex Infrastructure, и я катаю гусей. С 2019 года я развиваю S3-хранилище как для внутренних пользователей Яндекса, так и для клиентов Yandex Cloud. А «гусём» называется наш бэкенд S3 API: он написан на Go, а из словосочетания Go + S3 получился goose. Возможно, вы также слышали про GeeseFS — это наш высокопроизводительный FUSE-клиент для S3. C его помощью вы можете на своём ноутбуке или виртуалке подмонтировать папку, которая будет работать с бакетом S3.

Для чего нам «гуси» и прочая орнитология? Яндексовая инсталляция хранилища S3 хранит миллиарды файлов. Это огромные объёмы данных, а также метаданных. Для хранения метаданных мы научились использовать умное шардирование, и теперь сами управляем распределением занятого места и нагрузкой между шардами баз.

Так что сегодня я расскажу, как сделать так, чтобы ни один клиент, даже с самым неудобным паттерном нагрузки, не положил сервис.

+84

2 3 ...

95 96

Как мы готовим RL для Alignment в больших языковых моделях: опыт команды YandexGPT

Полезные ссылки

Что ты такое, dhclient?

Хороший ретрай, плохой ретрай, или История одного падения

Как работает кнопка Mute на Яндекс Станции. Подробный разбор логики и схем

Как устроен рекомендательный сервис, который выдерживает 700 тысяч запросов в секунду. Доклад Яндекса

userver 2.0 — большой релиз фреймворка для IO-bound программ

DivKit теперь и для Flutter. Рассказываем об особенностях BDUI-фреймворка Яндекса

Удалённое исполнение кода в ML: подходы и инструменты. Доклад Яндекса

«Когда будет готово?». Декомпозируем задачи и оцениваем сроки без фатальных ошибок

Эволюция обработки данных: от MapReduce к стриминговому движку

Домик Алисы, светлячки и огурчики. Какие пасхалки есть в Яндекс Станциях

Как мы тестируем беспилотные автомобили с помощью симуляций

Как найти баланс между интересами покупателей и продавцов: опыт разработчиков Яндекс Маркета

Testplane в опенсорсе: автоматизируем пользовательские сценарии в веб-интерфейсах

Яндекс запустил Нейро. Рассказываем, как он работает

Как и зачем мы строили 3D-модели достопримечательностей на Картах

Может ли мобильный-разработчик стать CTO?

История ритм-игр: от «Саймона» до Just Dance

Открываем YandexART API и рассказываем, как мы учили нейросеть создавать картинки, которые понравятся людям

Автоматизируем сеть Яндекса с Милошем: сервис конфигураций оборудования

Как мы переехали с Oracle на PostgreSQL в нагруженном сервисе без даунтайма

Ускорение инференса LLM

Внутри S3. Доклад Яндекса

Информация