Машинное обучение *

Основа искусственного интеллекта

Статьи Посты Новости Авторы Компании

El_Gato_Grande 10 мая в 11:46

Заставляем ChatGPT быть эгоистичным и решать дилемму заключенного, в которой есть котики

10 мин

7.3K

Блог компании SelectelАлгоритмы*Машинное обучение*Научно-популярное

Успехи машинного обучения наталкивают на мысль, что ИИ, стоящий в развитии на пару ступеней выше человека, уже не за горами. Станет он нам новым лучшим другом или скорее чем-то вроде Скайнета? Мы не знаем будущего, но можем проверить, насколько железный мозг дружелюбен в настоящем.

Привет! Мы в Selectel часто используем ИИ и знаем, что это хороший помощник, которому можно доверить часть рутины. А как насчет человеческих качеств? Чтобы выяснить это, сыграем с ним в классическую математическую игру, с помощью которой ученые уже больше 70 лет исследуют альтруизм и эгоизм, способность к эмпатии и готовность предать — характеристики, присущие человеку.

Читать дальше →

+38

feanoref 9 мая в 10:58

Зачем компаниям ML? Разбираемся на примере Netflix

Простой

10 мин

6.8K

Блог компании SelectelBig Data*Машинное обучение*Научно-популярноеIT-компании

Привет, Хабр! Я Ефим, MLOps-инженер в отделе Data- и ML-продуктов Selectel. В последнее время, куда ни глянешь, только и разговоров, что про ML. Но всегда хочется увидеть результаты работы на практике. Если с IT-гигантами все понятно, то зачем ML, скажем, компаниям из индустрии развлечений? В статье попробуем разобраться с этим (насколько позволят открытые источники) на примере Netflix.

Читать дальше →

+35

rajce 8 мая в 18:27

Обзор бесплатных чат-ботов ChatGPT в телеграме 2024

6 мин

19K

Блог компании BotHubМессенджеры*Машинное обучение*Искусственный интеллект

Обзор

Запуск инновационных технологий, таких как Midjourney и Chat GPT, значительно повысил интерес к искусственному интеллекту, что, в свою очередь, способствовало появлению в Телеграме специализированных чат-ботов. Эти боты предоставляют возможность использовать функции популярных нейросетей без необходимости регистрации и, зачастую, бесплатно.

Предлагаю рассмотреть некоторых ботов и оценить их функционал. Приятного прочтения! (:

+20

digitalsibur 8 мая в 16:49

Это база машинного обучения

Простой

4 мин

8.1K

Блог компании Цифровой СИБУРМашинное обучение*

FAQ

Рассказать всё о машинном обучении на двух страницах текста — невыполнимая задача. Именно сложность и многообразие темы могут отталкивать тех, кто только начинает знакомство с ней. Однако мы хотим помочь на этом пути и дать упрощённое введение в машинное обучение, чтобы каждый смог уловить его базовые принципы и понять, где его можно применять. Мы будем рады, если после прочтения кому-нибудь станут интересны нюансы и детали. А пока начнём с обобщений.

В самом общем смысле, машинное обучение можно описать как метод автоматизации, позволяющий компьютерам анализировать данные и делать на их основе какие-то выводы. Зачастую эти выводы используются для создания прогнозов о будущих событиях.

Можно, конечно, попытаться обойтись и без машинного обучения. Самый простой подход — проанализировать данные и составить понятный набор правил формата if-else (если-то). Между прочим, это применяется в реальной жизни, например, при анализе потребительской корзины. Составляется набор ассоциативных правил вида {хлеб, чай} → {молоко}. Это означает, что если покупатель приобретает хлеб и чай, то, скорее всего, он также купит молоко. Вуаля — мы сделали прогноз на будущее.

Aqice 8 мая в 13:03

Раскрываем тайны: как мы контролируем работу ML-моделей

Средний

6 мин

1.5K

Блог компании X5 TechIT-инфраструктура*Машинное обучение*IT-компании

Кейс

Привет, Хабр! На связи команда ad-hoc аналитики и модельного риска X5 Tech. В прошлой статье про модельный риск мы познакомились с концепцией risk-management’а для моделей машинного обучения в корпорации и оценили, какую пользу может принести модельный риск как для команд-разработчиков и аналитиков, так и для компании в целом.

В этой статье мы продолжим тему модельного риска, раскроем чуть больше секретов о том, как это устроено в X5 Tech и обсудим некоторые технические аспекты реализации подобной системы.

allseeteam 8 мая в 11:00

YandexGPT API быстро и без труда с Python SDK. Делимся опытом интеграции

Средний

25 мин

7.3K

Open source*Python*API*Яндекс API*Машинное обучение*

Кейс

YandexGPT API — сервис для доступа к генеративным языковым моделям, хоть и является мощным инструментом во многих задачах, однако может озадачить разработчика, решившего внедрить его в свои проекты отсутствием официального SDK, разнообразием способов авторизации, видов моделей и эндпоинтов API. В данной статье я рассказываю, как мы внедряли YandexGPT в свои проекты, а в конце делюсь всеми наработками.

+10

YandexCloudEditor 8 мая в 10:00

Удалённое исполнение кода в ML: подходы и инструменты. Доклад Яндекса

9 мин

1.5K

Блог компании ЯндексБлог компании Yandex Cloud & Yandex InfrastructureOpen source*IT-инфраструктура*Машинное обучение*

Всем привет. На связи Артём Гойлик @ArtoLord и Владислав Волох @Chillintano из команды DataSphere в Yandex Cloud. Мы создаём инфраструктуру для ML-разработчиков. И сегодня расскажем про одну задачу, которая, как и многие другие, начиналась с болей наших пользователей.

+11

FreightOne 7 мая в 16:43

Когда достаточно простого класса Python — взять и начать управлять ML-экспериментами

Средний

7 мин

4.7K

Блог компании Первая грузовая компания (ПГК)Python*Машинное обучение*Учебный процесс в IT

Мы в ПГК занимаемся грузоперевозками, причем решаем различные транспортные задачи не только методами математической оптимизации, но и с помощью моделей машинного обучения. Наши дата-сайентисты проводят десятки экспериментов — в том числе и без необходимости прибегать к инструментам логирования вроде MLflow. В этом им помогает компактный Python-класс. Расскажем, как он устроен, и поделимся кодом.

odmin227 7 мая в 12:00

Откуда Deezer знает, какая музыка нравится новым пользователям?

Сложный

9 мин

2.9K

Алгоритмы*Big Data*Машинное обучение*Научно-популярноеЗвук

Обзор

Привет, Хабр! Меня зовут Данил Картушов. 👋

В этом посте я расскажу, как музыкальная платформа Deezer, используя метаданные, с первых секунд научилась рекомендовать персонализированные треки новым пользователям!

▶️ Начнем!

Sber 7 мая в 10:51

Проблема «галлюцинирования» в больших языковых моделях на примере чат-ботов

Средний

14 мин

2.1K

Блог компании СберМашинное обучение*Искусственный интеллект

Мнение

Добрый день, уважаемые читатели Хабр. По роду деятельности, я уже некоторое время занимаюсь вопросами NLP, в частности, генеративными большими языковыми моделями и, реализованными, на них чат-ботами. При этом, очень часто в их разработке возникает ряд проблем, с которыми приходится постоянно бороться. Одна из них — «галлюцинирование» моделей, то есть выдача неточной информации на поступающие запросы от пользователя, и, в целом, некорректное поведение модели при длительном ведении диалогов различной степени направленности, специфики, глубины рассуждений, оценки фактов и правдивости выдаваемых ответов.

Исходя из этого, я решил систематизировать все имеющиеся по этой теме сведения. Сразу оговорюсь, статья носит обзорный характер и я ставлю своей целью обобщение фактов, причин и признаков такого поведения. Поиск возможных вариантов, методик и подходов для решения данной проблемы будут рассмотрены в следующей статье. Здесь, не будет кода и строгих выкладок, лишь, наблюдения, аналитика, способы оценки, выявленные закономерности и оценка работы в общем.

В качестве результата исследования, предлагается описание общей ситуации с обнаруженными возможными проявлениями феномена «галлюцинирования». На целостность и завершенность обзора, при описании полученных вариаций и проявлений данного факта, не претендую. Это результаты моего поиска и анализа. Информация собиралась, буквально по крупицам, так как все сведения сильно разрознены, проявления их в «дикой природе» не всегда можно заметить и четко классифицировать, либо они начинают проявляться спустя большое количество тестов, диалогов, рассуждений, запросов, вариантов подачи подсказок и уточнений на поставленные запросы и исходных текстов. Кроме всего прочего, градация распределения этих аномалий по степени отслеживания, так же, сильно разнится. Есть те, которые проявляются весьма быстро, а есть крайне редкие, для которых нужен специфических, очень тонкий подход. Ниже я представлю данный перечень с подробными пояснениями, так что всех прошу под кат.

+21

divolko3 7 мая в 10:41

Язык программирования Mojo: что нового в версии 24.3?

4 мин

2.9K

Блог компании МТСPython*Программирование*Машинное обучение*Искусственный интеллект

На днях была опубликована новая версия языка программирования Mojo, теперь это 24.3. Новинка получила несколько важных компонентов, которые требуются для создания приложений на этом языке. Например, компилятор, интерактивная REPL-оболочка для сборки и запуска программ, отладчик, дополнение к редактору кода Visual Studio Code (VS Code) и т. п.

Стоит отметить, что исходники открыты под лицензией Apache 2.0. После того как будет завершено проектирование внутренней архитектуры, разработчики откроют и код компилятора. Ну а подробности изменений и дополнений — под катом.

+13

jstmeowme 7 мая в 10:24

Топ-5 инструментов c AI для начинающих (или не очень) разработчиков

Простой

5 мин

7.1K

Блог компании BotHubМашинное обучение*Искусственный интеллект

Дайджест

Однозначного ответа на вопрос «заменит ли ИИ человека» нет до сих пор. Ясно лишь одно — человек, умеющий правильно использовать искусственный интеллект, рано или поздно сместит того, кто ИИ пользоваться не умеет.

Мы собрали подборку из 5 AI-инструментов, которые могут быть полезны при разработке. Приятного чтения!

AntonSoroka 7 мая в 09:40

CADE — интересный способ поиска аномалий в многомерных данных

Простой

8 мин

1.5K

Python*Data Mining*Машинное обучение*Статистика в IT

CADE () - метод для приближения плотности вероятности, который можно эффективно использовать для поиска аномалий в данных. В этой статье я расскажу про этот метод, а также предоставлю пример реализации CADE на Python.

albonemo 7 мая в 08:08

Как AI-стартапу сэкономить копеечку: синтез речи из палок и веток для low-resource языков

Средний

5 мин

1.3K

Блог компании RaftМашинное обучение*Искусственный интеллект

Кейс

Идущие майские учат нас, что шашлык сам себя не пожарит…но это лишь до поры до времени – не далек тот час, когда ИИ автоматизация наверняка придет и сюда! Но пока светлое будущее еще не наступило, поэтому давайте поговорим … ~~о котиках~~ о лошадках 🐴

Слышали ли вы, как скачет конь по монгольской степи? Если нет, то в этой статье мы исправим это упущение и расскажем, как за 'недорого' натренировать облегчённую TTS (Time-to-speech) модель для воспроизведения речи на монгольском языке, очень непривычно звучащим для русского уха и практически непроизносимом для языка 🚑

тыг-дык-тыг-дык… тыг-дык-тыг-дык…ии-го-го … Примерно такого аудио ряда мы ждем на выходе у нашего эксперимента... Чтобы узнать, как мы дошли до такой жизни, что у нас в итого получилось и насколько оно бьется с ожиданиями, поскакали под кат! 😜🚀

Поскакать

Lithium_vn 6 мая в 18:28

Как пользоваться Claude: знакомство с главным конкурентом ChatGPT и базовые правила его использования

Простой

14 мин

16K

Блог компании BotHubМашинное обучение*Искусственный интеллект

Обзор

В последние годы мы стали свидетелями стремительного развития и роста популярности чат-ботов на базе искусственного интеллекта. Одним из наиболее известных и широко используемых чат-ботов стал ChatGPT от компании OpenAI, который продемонстрировал впечатляющие возможности в общении и решении разнообразных задач.

Однако ChatGPT - далеко не единственный продвинутый чат-бот, доступный сегодня. Не так давно компания Anthropic представила миру Claude v.3 Opus - ИИ-ассистента нового поколения, который во многом превосходит возможности ChatGPT и имеет ряд значимых отличий. И хотя на первый взгляд Claude может показаться похожим на своего более известного "коллегу", при ближайшем рассмотрении становятся видны существенные различия в архитектуре, возможностях и особенностях взаимодействия с пользователем.

В этой статье мы рассмотрим ключевые отличия Claude от ChatGPT, дадим практические рекомендации по эффективной работе с этим ИИ-помощником и обсудим перспективы дальнейшего развития подобных систем. Наша цель - предоставить полезное руководство, которое поможет вам в полной мере освоить и применять Claude, избегая распространенных ошибок и открывая новые горизонты в решении задач с помощью ИИ. Конечно, в этой статье не получится рассказать все, но самое основное - однозначно.

Приятного прочтения!:)

+15

APPKODE 6 мая в 17:31

ИИ-технологии потребляют слишком много энергии: правда или миф

8 мин

1.8K

Машинное обучение*Искусственный интеллектБудущее здесь

Мнение

Перевод

Как и обо всех новых технологиях, об искусственном интеллекте уже успело сформироваться немало легенд. Например, о том, что сложные ИИ-модели вроде GPT-3 или DALLE оставляют огромный углеродный след и оказывают разрушительное воздействие на окружающую среду. В поисках истины мы нашли материал с интересной точкой зрения и перевели ее для вас. И кстати, 10 мая в Светлогорске мы обсудим технологии будущего на фестивале KODE Waves.

В последние годы заголовки в СМИ часто пугали читателей количеством электроэнергии, нужной для развития цифровых технологий. Например, когда в 2019 году Apple, Disney и HBO и другие видеостриминговые сервисы анонсировали платные подписки для конкуренции с Netflix, Amazon и YouTube, СМИ написали, что «согласно заявлению Французского аналитического центра, получасовой просмотр Netflix генерирует такой же выброс CO₂, как проезд на машине 6,5 километров». Год спустя аналитический центр обнаружил ошибку в вычислениях и подсчитал, что получасовой просмотр Netflix по количеству CO₂ сопоставим скорее с проездом на машине от 10 до 100 метров, но об этом СМИ не написали.

anpalmak 6 мая в 12:47

Практические аспекты ранжирования ответов виртуального ассистента Салют

Средний

7 мин

1.3K

Блог компании SberDevicesМашинное обучение*Искусственный интеллект

Всем привет! Меня зовут Аня Максимова, я занимаюсь NLP в команде Нейронные сети продукта Собеседник! 5 апреля проходила конференция Giga R&D Day, где мой коллега — Артем Снегирев рассказывал про практические аспекты ранжирования ответов виртуального ассистента Салют.

В этой статье мы подробнее расскажем вам, как делаем ранжирование ответов на примере собеседника, который является частью ассистентов Салют.

У ассистента есть три голоса — Сбер, Афина и Джой. Собеседник отвечает за общение на различные темы, ответы на фактологические вопросы и за развлекательный контент. Как правило, ассистент отвечает генеративными моделями, но есть сценарии, где используются заготовленные реплики, и их достаточно много, поэтому мы используем поиск — это классический retrieval-based подход.

+17

dvgureev 5 мая в 18:08

«В чем сила?» — ищем ответ среди афоризмов. Сравнение 6 моделей для векторного поиска и так ли хорош OpenAi Large

Простой

4 мин

1.5K

Data Mining*Машинное обучение*Искусственный интеллектData Engineering*

Обзор

Сравниваем между собой качество 6 различных токенайзеров, включая новейший OpenAi Large|Small и E5 от Microsoft на задаче векторного поиска:

Ищем ответ на вопрос: В чем сила? в сборнике афоризмов и цитат.

Рассматриваются модели

text-embedding-ada-002
text-embedding-3-large
text-embedding-3-small
intfloat/multilingual-e5-large
ai-forever/ruBert-large
ai-forever/sbert_large_mt_nlu_ru

P.S. Бонусом сравнение как влияет токенайзер на качество задачи по классификации текста (30 классов).

+15

modmash 5 мая в 17:41

Очень краткий словарь числового программного управления. Часть 1

9 мин

4.7K

Машинное обучение*Производство и разработка электроники*Научно-популярноеЭлектроника для начинающих

Из песочницы

Каждый раз, когда появляются новые, нетипичные для нашей обыденной деятельности задачи, мы начинаем общаться со специалистами по их решению. И каждый раз это общение начинается с непонимания или недопонимания. Нам кажется, что мы недооценили сложность проблемы, что нам не хватает каких-то фундаментальных доступных знаний, однако, этому узкому кругу профессионалов, которые, при всем их дружелюбии, не спешат снизойти до нашего уровня.

Ситуация выглядит зеркально, когда обращаются к нам. Нам непонятно, почему эти неглупые и технически грамотные люди нуждаются в подробном объяснении элементарных вещей и задают детские вопросы.

Проходит время, и всё становится ясно. Мы приобрели новые знания? Нет, скорее, освоили терминологию. Любой круг специалистов создаёт собственный язык. Не для изоляции от непосвящённых, не из щегольства – так проще и удобнее. Специалист пользуется массой стандартных решений, верность которых когда-то была раз и навсегда ему доказана, не задумываясь об их неочевидности для других. Цель данного словаря – облегчить освоение терминологии, связанной с числовым программным управлением станками (ЧПУ).

+13

tech_priestess 4 мая в 20:30

Главные отличия PCA от UMAP и t-SNE

Средний

10 мин

4.5K

Математика*Визуализация данных*Машинное обучение*Data Engineering*

Туториал

Здесь будет рассказано о главных отличиях самого старого и базового алгоритма снижения размерности - PCA от его популярных современных коллег - UMAP и t-SNE. Предполагается, что читатель уже предварительно что-то слышал про эти алгоритмы, поэтому подробного объяснения каждого из них в отдельности приведено не будет. Вместо этого будут объяснены самые важные для практики свойства этих алгоритмов и то, на какие связанные с ними подводные камни можно налететь при неосторожности. Все особенности будут описаны на примерах, с минимумом теории; те пытливые умы, что почувствуют в процессе чтения жажду математической строгости, смогут удовлетворить её в литературе, ссылки на которую будут даны по ходу дела и в конце статьи.

+43

3 4 ...

327 328

Машинное обучение *

Заставляем ChatGPT быть эгоистичным и решать дилемму заключенного, в которой есть котики

Зачем компаниям ML? Разбираемся на примере Netflix

Обзор бесплатных чат-ботов ChatGPT в телеграме 2024

Это база машинного обучения

Раскрываем тайны: как мы контролируем работу ML-моделей

YandexGPT API быстро и без труда с Python SDK. Делимся опытом интеграции

Удалённое исполнение кода в ML: подходы и инструменты. Доклад Яндекса

Когда достаточно простого класса Python — взять и начать управлять ML-экспериментами

Откуда Deezer знает, какая музыка нравится новым пользователям?

Проблема «галлюцинирования» в больших языковых моделях на примере чат-ботов

Язык программирования Mojo: что нового в версии 24.3?

Топ-5 инструментов c AI для начинающих (или не очень) разработчиков

CADE — интересный способ поиска аномалий в многомерных данных

Ближайшие события

Как AI-стартапу сэкономить копеечку: синтез речи из палок и веток для low-resource языков

Как пользоваться Claude: знакомство с главным конкурентом ChatGPT и базовые правила его использования

ИИ-технологии потребляют слишком много энергии: правда или миф

Практические аспекты ранжирования ответов виртуального ассистента Салют

«В чем сила?» — ищем ответ среди афоризмов. Сравнение 6 моделей для векторного поиска и так ли хорош OpenAi Large

Очень краткий словарь числового программного управления. Часть 1

Главные отличия PCA от UMAP и t-SNE

Вклад авторов

Работа