Как стать автором
Обновить
465.12

Искусственный интеллект

AI, ANN и иные формы искусственного разума

Сначала показывать
Порог рейтинга

«Яндекс» изучил поисковые запросы программистов и составил карту технических навыков, которые регулярно используют ML-разработчики. Этот проект показывает, какие ML-технологии и методы сейчас особенно популярны, как они связаны между собой и как менялся к ним интерес. 

Размер навыка на карте соответствует его популярности у ML-разработчиков. Положение навыков относительно друг друга определяется сходством контекста: чем чаще два навыка соседствуют с одними и теми же тегами на Stack Overflow, тем меньше расстояние между ними на карте.

Для оценки близости контекста в «Яндексе» рассчитали векторы совстречаемости каждого навыка со всеми остальными, затем нормализовали метрикой TF-IDF. Для укладки навыков на карте использовали алгоритм UMAP.

В дополнение к карте технических навыков «Яндекс» опубликовал рейтинги навыков, интерес к которым сильно вырос в 2023 году по сравнению с 2022 годом. Это десять самых актуальных библиотек и фреймворков и десять ML-технологий и методов. Большинство из них связаны с генеративными моделями и нейросетями для распознавания объектов.

Библиотеки и фреймворки:

  1. langchain;

  2. python-polars;

  3. faiss;

  4. sentence-transformers;

  5. huggingface-datasets;

  6. jax;

  7. stable-baselines;

  8. onnxruntime;

  9. huggingface-transformers;

  10. pytorch-geometric.

ML-технологии и методы:

  1. large-language-model;

  2. stable-diffusion;

  3. openai-api;

  4. gpt-3;

  5. fine-tune;

  6. generative-art;

  7. text-parsing;

  8. hdbscan;

  9. transformer-model;

  10. nlp-question-answering.

Теги:
Всего голосов 6: ↑5 и ↓1+4
Комментарии3

Приложение «Шедеврум» от «Яндекса» вошло в тройку ведущих мировых приложений с генеративным искусственным интеллектом по данным на конец 2023 года. Информацию об этом опубликовала аналитическая компания Data.ai (прежнее название — App Annie) в своём ежегодном исследовании глобального рынка мобильных приложений.

В составленном Data.ai рейтинге приложений с генеративным ИИ «Шедеврум» занимает третью строчку с итоговой оценкой в 95 баллов из 100. Для оценки приложений Data.ai использует собственную метрику — Mobile Performance Score (MPS). При изучении приложений категории, в которую включён «Шедеврум», она учитывает три параметра: количество загрузок и пользователей (acquisition), вовлечённость аудитории (engagement) и оценки пользователей (sentiment). Алгоритмы искусственного интеллекта Data.ai выставляют от 1 до 100 баллов по каждому из них и формируют среднюю оценку.

«Шедеврум» — это мобильное приложение «Яндекса», в котором пользователи могут создавать видео, изображения и тексты с помощью нейросетей. Нейросеть YandexART генерирует картинки и анимацию, а ИИ-система YandexGPT позволяет получать содержательные посты с заголовком и подходящей по смыслу иллюстрацией.

После запуска в апреле 2023 года проект «Шедеврум» попал на первые места по популярности в российских магазинах приложений App Store и Google Play. C тех пор его установили почти 8,5 миллионов пользователей.

Теги:
Всего голосов 2: ↑2 и ↓0+2
Комментарии2

Nikon разработала систему на базе искусственного интеллекта, предназначенную для предупреждения фермеров о приближающихся родах коров. Технология компании анализирует движения животных при помощи камер, установленных на фермах. Система должна упростить работу фермеров, которым необходимо проводить регулярные проверки беременных коров за несколько недель до родов. 

Стоимость системы составляет $6,2 тыс. в год для фермы со 100 коровами. Её продажи в Японии стартуют позже в январе. Технология использует специальное приложение для смартфона, чтобы отправлять уведомления о скором появлении телёнка.

Производитель объясняет, что у беременной коровы примерно за пять часов до родов начинают появляться типичные признаки скорого отёла, включающие беспокойное поведение и частичное выделение амниотического мешка, в котором находится телёнок.

Nikon собирает данные для обучения ИИ с осени 2021 года, а с февраля 2023 года компания проводит эксперименты по проверке концепции на четырёх фермах в префектуре Кумамото на юго-западе Японии. Представитель Nikon Кадзухиро Хирано рассказал, что в будущем компания планирует усовершенствовать систему для определения течки и других моделей поведения коровы при помощи ИИ.

Теги:
Всего голосов 4: ↑4 и ↓0+4
Комментарии0

Пару месяцев назад я упоминал codeium — бесплатную альтернативу копайлоту. На новогодних праздниках наконец-то попробовал его на своём пет-проекте, и довольно часто он действительно ускоряет разработку.

В текущих реалиях нужно включать VPN, чтобы работать с ChatGPT из России, здесь же есть встроенный чат, который работает без VPN 👍.

Хабр позволяет добавлять только одну картинку в посты, поэтому остальные примеры здесь.

Теги:
Всего голосов 6: ↑5 и ↓1+4
Комментарии0

Cамый Нижний Уровень Абстракции и Галлюцинации ИИ

Дщцуые думуд ща фиыекфсешщт - это фраза на кириллице, которая означает "Душе моя, думай о том, что важно". Она является переводом известной арабской пословицы "القلب ينبض بالحب والعقل ينبض بالتفكير، فالقلب ينبض بالحياة والعقل ينبض بالحكمة".

Эта пословица напоминает нам о важности баланса между сердцем и разумом. Сердце - это источник любви, эмоций и интуиции. Разум - это источник логики, анализа и принятия решений. Когда мы думаем о том, что важно, мы соединяем эти две части себя в единое целое.

Это может означать разные вещи для разных людей. Для кого-то это может быть о том, чтобы сосредоточиться на своих ценностях и целях. Для кого-то это может быть о том, чтобы быть благодарным за то, что у вас есть. Для кого-то это может быть о том, чтобы помогать другим.

В конечном счете, суть в том, чтобы найти то, что приносит вам смысл и удовлетворение в жизни. Когда мы думаем о том, что важно, мы живем более полной и осмысленной жизнью.

___

Галлюцинировал Google Bard (Гемини: Самая большая и способная на данный момент ИИ-модель от Google)

Теги:
Всего голосов 4: ↑3 и ↓1+2
Комментарии0

Пользователи соцсетей заметили, что издательство АСТ выпускает роман в стихах «Евгений Онегин» А. С. Пушкина в виде комикса. Иллюстрации привлекли особое внимание: в них заподозрили работу нейросетей. В твиттере обратили внимание, что от картинки к картинке у героев меняется внешность. В описании издания при этом говорится о «выразительном языке графики».

Комментаторы нашли художницу Анастасию Соловьёву, которая занималась созданием иллюстраций для «Евгения Онегина». На своей странице девушка написала, что создаёт картинки в «нейроформате». «Да, я сделала „Онегина“. ОБОЖЕ я сделала это в нейросети с обработкой. Чего собственно и не скрываю. Я сделала то, что от меня ТРЕБОВАЛОСЬ. Далее, отчитываться я не собираюсь. Я работаю, делаю все по ТЗ с которыми ко мне ПРИХОДЯТ. Заказчик доволен, довольны другие», — прокомментировала она.

На официальном сайте издательства «АСТ» и на страницах романа в онлайн‑магазинах нет информации, кто и как создал иллюстрации.

Теги:
Всего голосов 5: ↑5 и ↓0+5
Комментарии2

Как будет развиваться ChatGPT в ближайшие 2 года: этот пост про новое интервью Сэма Альтмана с Биллом Гейтсом от 11.01.2024.

Если вас интересует искусственный интеллект, вы знаете, кто такой Сэм Альтман. Если вы использовали ChatGPT, DALL-E или другой продукт OpenAI, гендиректором которого является Сэм, то вы знаете его работу. И если вы используете Reddit, Dropbox или Airbnb — это тоже приложения, к созданию которых причастен Сэм Альтман.

В подкасте на YouTube (есть русские субтитры в авторежиме) спикеры обсуждают, где сейчас находится ИИ с точки зрения «мышления» и решения проблем пользователей, и куда ИИ движется дальше. Сэм рассказывает о своем видении потенциала ИИ по влиянию на рабочие места и развитию здравоохранения и образования.

Из конкретных планов — у продуктов OpenAI появится голосовой ввод и голосовая выдача, а также появится выдача в формате видео (но это пока неточно). Будет сделана адаптация под сложные и простые запросы.

«Самые важные области прогресса ИИ будут связаны со способностью рассуждать. Сейчас GPT-4 может рассуждать лишь очень ограниченными способами», — Сэм Альтман.

Вам с большой долей уверенности захочется послушать весь подкаст — как общество адаптируются к технологическим изменениям и как человечество обретет понимание своей цели, когда доведет до совершенства искусственный интеллект. А еще, учитывая, что Сэм находится в авангарде этой работы, вам наверняка важно услышать его точку зрения на баланс между инновациями ИИ и регулированием ИИ.

Теги:
Всего голосов 2: ↑2 и ↓0+2
Комментарии0

Стартап Rabbit продал около 10 тысяч карманных ИИ-компаньонов R1 всего за один день.

На выставке CES Rabbit представила устройство с 2,88-дюймовым сенсорным экраном, работающее на собственной Rabbit OS. ИИ-компаньон использует «большую модель действий», которая работает как «своего рода универсальный контроллер для приложений». Это позволяет ему выполнять такие действия, как воспроизведение музыки, а также покупать продукты и отправлять сообщения через единый интерфейс без необходимости использовать смартфон. Также можно обучить устройство взаимодействию с определённым приложением.

Клиентам доступен предзаказ устройств R1 за $200 на сайте Rabbit. Ожидаемая дата поставки — апрель-май 2024 года.

Теги:
Всего голосов 5: ↑5 и ↓0+5
Комментарии0

Что такое Bias-Variance Tradeoff?

Компромисс между смещением и дисперсией (Bias-Variance Tradeoff) — одна из базовых концепций в машинном обучении. Она отражает поиск баланса между двумя источниками ошибок в модели предсказания: смещением (bias) оценки параметров и дисперсией (variance) ошибки прогноза. По сути это поиск компромисса между недо- и переобучением.

Смещение оценки модели возникает из-за ошибочных предположений о данных. Модель с большим смещением хуже выделяет взаимосвязь между признаками и предсказываемыми данными, то есть склонна недообучаться.

Причина дисперсии ошибок модели — искажения в обучающих данных. Высокая дисперсия ошибки модели может означать, что модель слишком восприимчива к малым отклонениям и пытается трактовать шумы в обучающей выборке. То есть происходит её переобучение: модель показывает хорошие результаты на обучающем наборе данных, но плохо справляется с анализом новых.

В идеале разработчику хочется получить модель с низким смещением оценки и низкой дисперсией ошибки, однако в реальности между ними приходится искать баланс. Для этого применяют кросс-валидацию, регуляризацию и другие методы.

Теги:
Всего голосов 3: ↑3 и ↓0+3
Комментарии0

OpenAI заявила о невозможности создавать такие инструменты, как ChatGPT, без доступа к материалам, защищённым авторским правом. Компания испытывает давление по поводу использования контента из интернета для обучения своих моделей искусственного интеллекта, включая GPT-4.

Поскольку авторское право сегодня распространяется практически на все виды человеческого выражения, включая публикации в интернете, фотографии, фрагменты программного кода и правительственные документы, становится невозможным обучать сегодняшние модели ИИ без использования материалов, защищённых авторским правом, пояснила OpenAI в обращении к специальному комитету британской Палаты лордов по коммуникациям и цифровым технологиям.

В компании добавили, что использование исключительно учебных материалов и иллюстраций, которые не защищены авторскими правами, приведёт к созданию неадекватных ИИ-систем. Такие модели не смогут удовлетворить потребности сегодняшних пользователей.

Ранее против OpenAI выдвинули ряд исков из-за «незаконного использования» контента для обучения ИИ-моделей. Одной из последних в суд на OpenAI и её материнскую компанию Microsoft подала газета New York Times. Из иска следует, что миллионы статей издания использовались для обучения чат-ботов, которые теперь конкурируют с новостными агентствами в качестве источников достоверной информации.

Теги:
Всего голосов 6: ↑6 и ↓0+6
Комментарии2

Лауреат Нобелевской премии, специалист по рынку труда, профессор Лондонской школы экономики Кристофер Писсаридес посоветовал современным абитуриентам не стремиться изучать естественные науки, технические дисциплины и математику.

Писсаридес считает, что в будущем будут гораздо выше цениться «эмпатические» и творческие навыки, которые помогут процветать в мире доминирования искусственного интеллекта. А вот IT-специалисты, по его словам, рискуют собственными руками посеять «семена саморазрушения», продвигая искусственный интеллект, который в конечном итоге займёт их же рабочие места.

В целом Писсаридес с оптимизмом воспринимает влияние искусственного интеллекта на рынок труда. Он выразил обеспокоенность по поводу тех, кто изучает предметы STEM (Science, Technology, Engineering, Mathematics — естественные науки, технология, инженерия и математика) в надежде воспользоваться технологическим прогрессом.

По мнению Писсаридеса, несмотря на быстрый рост спроса на навыки STEM в настоящее время, рабочие места, требующие более традиционных личных навыков, таких как гостиничный бизнес и здравоохранение, по-прежнему будут доминировать на рынке труда.

Теги:
Всего голосов 3: ↑3 и ↓0+3
Комментарии2

Совет Федерации Федерального собрания РФ дал распоряжение Минпромторгу РФ, Минцифры РФ и Альянсу в сфере искусственного интеллекта за месяц подготовить предложения для доработки законодательства в части выделения промышленных данных в самостоятельную категорию и создания правил их использования для обучения ИИ и определения прав на конечные решения. Соответствующие поправки в регулирование авторских прав на продукты, созданные нейросетями, должны быть внесены в Гражданский кодекс РФ в 2024 году.

Оба ведомства и альянс должны подготовить поправки к четвёртой части Гражданского кодекса, связанной с регулированием оборота результатов интеллектуальной деятельности, создаваемых с использованием ИИ, включая промышленные решения. Сейчас в этом направлении правовой определённости нет. Однако для реализации проекта необходимо сначала установить, какие данные, используемые при обучении ИИ, могут считаться промышленными.

Теги:
Всего голосов 6: ↑5 и ↓1+4
Комментарии0

Apple выпустила нейросеть Ferret, предназначенную для работы с изображениями. Она принимает на вход фотографию, определяет на ней объекты и может отвечать на уточняющие вопросы. Компания опубликовала код Ferret на GitHub.

Пользователям доступны модели Ferret-7B и Ferret-13B с различным набором параметров. В основе также используются LLaVA и Vicuna. Нейросеть анализирует изображения на входе и может давать подробные комментарии. К примеру, можно спросить, что находится на фотографии или задавать другие уточняющие вопросы.

Код моделей и всё необходимое для локального запуска опубликовано в открытом репозитории Apple. Компания отмечает, что обучала нейросеть на восьми GPU A100 от Nvidia с общим объёмом памяти в 80 ГБ. Разработчики подготовили инструкцию по дополнительному обучению моделей на меньшем количестве оборудования.

Теги:
Всего голосов 5: ↑5 и ↓0+5
Комментарии0

Ближайшие события

Конференция «IT IS CONF 2024»
Дата20 июня
Время09:00 – 19:00
Место
Екатеринбург
Summer Merge
Дата28 – 30 июня
Время11:00
Место
Ульяновская область

Почему ChatGPT не заменит разработчиков

Часто слышу беспокойство по поводу ИИ, типа «программисты будут не нужны».

Недавно сталкивался с продуктом, рожденным при помощи ChatGPT. У руля ИИ был человек, который очень поверхностно понимал что такое разработка. Он смог довести продукт до рабочего состояния, но ChatGPT захлебнулся на моменте интеграции firebase для регистрации пользователей и внедрения формы оплаты. На внедрение этих фичей человек начал искать реальных разработчиков.

Я посмотрел на исходный код и ужаснулся: 

❗️Код представлял из себя портянку одного React компонента на тысячу строк

❗️GhatGPT взял топовые технологии: Next.js, TypeScript, Tailwind, Versel. Но Tailwind выглядел жестко – это были длинные портянки классов, которые невозможно разобрать

❗️Я уже молчу про нормальный дизайн и UX. ChatGPT делает корявенько, мягко говоря

Создание хорошего продукта – это не просто написать N строчек кода. Часто нужно интегрировать продукт с другими сервисами, продумывать архитектуру, а самое главное – писать масштабируемый поддерживаемый код для людей. Все это не может делать ChatGPT.

Программист нашелся, но вместо двух фич он получил вагон техдолга на старте. 

ИИ будет максимально полезен, когда не нужно будет за ним разбирать, что он нагенерировал. Если он будет делать решения под ключ, то тогда это будет эффективно. А пока такие технологии хороши для проверки гипотез, но дальше работают профи.

***

Подписывайтесь на мой телеграм-канал Вайтишная: пишу честно про IT и про свой опыт

Теги:
Всего голосов 9: ↑6 и ↓3+3
Комментарии1

Гиперпараметры модели

В разговорах про нейросети часто можно услышать термин "гиперпараметры". Мы попросили наших экспертов из лаборатории больших данных пояснить, что он означает.

Когда говорят про гиперпараметры модели, имеют в виду такие параметры модели машинного обучения, которые не подбираются автоматически в ходе тренировки. Они должны быть явно заданы перед началом обучения. Например, это количество скрытых слоёв нейросети и размер пакета данных для обработки за одну итерацию.

Процесс настройки гиперпараметров применяется для нахождения их комбинации, которая максимизирует производительность модели на конкретной задаче.

Обычно настройка выполняется методом проб и ошибок. Разработчики перебирают различные значения гиперпараметров и оценивают их влияние на метрики качества модели. Для определения оптимальных значений гиперпараметров могут использоваться такие методы, как поиск по сетке и случайный поиск.

Корректно подобранные гиперпараметры могут также улучшить способность модели к обобщению и оптимизировать её работу с учётом конкретной аппаратной платформы.

Теги:
Всего голосов 2: ↑2 и ↓0+2
Комментарии0

Облачная платформа Yandex Cloud представила 8 новых голосов с разными эмоциями в сервисе Yandex SpeechKit. Теперь компании смогут использовать в синтезе речи приветливую, строгую интонации или даже шепот. Это позволит компаниям-разработчикам менять окраску синтеза речи в зависимости от бизнес-сценария и повышать удовлетворенность клиентов и конверсию в голосовых каналах. Кроме этого, в сервисе появился новый параметр, который позволяет изменять высоту голоса.

Разнообразие голосов в Yandex SpeechKit позволило сделать диалоги роботов менее шаблонными, нативными. При создании новых голосов разработчики Yandex SpeechKit изменили не только работу модели машинного обучения, но и текстовую базу, которую использовали дикторы. Это позволило улучшить звучание голосов в вопросительных и восклицательных предложениях, которые являются сложной задачей для синтеза речи.

«Синтез речи — это популярная технология для автоматизации коммуникаций в контакт‑центрах и не только. Нам, как разработчикам, важно в том числе, чтобы диалоги с голосовыми роботами были человечными и комфортными для обычных людей. В будущем мы планируем предоставлять пользователям еще больше новых голосов», — пояснил Хабру CPO облачной платформы Yandex Cloud Григорий Атрепьев.

Теги:
Рейтинг0
Комментарии1

В программу международной конференции по машинному обучению NeurIPS 2023 вошло исследование команды Yandex Research о системе Petals, которое проводилось совместно с учёными из Университета Вашингтона и Hugging Face. Исследование демонстрирует экономически эффективный подход к запуску и тонкой настройке больших языковых моделей (LLM) благодаря использованию распределённой сети компьютеров с графическими ускорителями потребительского класса.

Petals — это система с открытым исходным кодом для работы с большими нейронными сетями не только на суперкомпьютерах и для небольших команд исследователей. Система делит модель на несколько блоков и размещает их на разных серверах, которые могут находиться в любой точке планеты. Все желающие могут присоединиться к одному из них, чтобы поделиться вычислительной мощностью своей видеокарты. Волонтёры могут подключаться и отключаться в любой момент — это не повлияет на происходящие в сети процессы. 

Помимо доклада о Petals в программу NeurIPS 2023 вошли исследования учёных из команды Yandex Research, включая:

  • алгоритм ускоренной адаптации диффузионных генеративных сетей под пользовательские изображения;

  • алгоритм прореживания передовых трансформерных моделей для компьютерного зрения;

  • оценку устойчивости передовых моделей графовых нейросетей;

  • метрику для квантификации степени гетерофильности заданного графа;

  • схему распределённой оптимизации для задач вариационных неравенств;

  • анализ стохастического градиентного спуска с нижними оценками на его сложность.

Теги:
Всего голосов 3: ↑3 и ↓0+3
Комментарии0

ByteDance уличили в использовании технологии OpenAI для продвижения собственной большой языковой модели. Поведение китайской компании не только не одобряется индустрией искусственного интеллекта, но и нарушает условия обслуживания OpenAI.

Клиентам разработчика ChatGPT запрещено разрабатывать какие-либо ИИ-модели, конкурирующие с продуктами и услугами OpenAI. Они также не могут извлекать данные из сервисов, кроме разрешённых через API.

ByteDance знала об этом и продолжала использовать API для обучения и сравнения со своей моделью, получившей название Project Seed. В китайской компании проводили инструктирование по маскировке доказательств использования решения OpenAI, пишет Verge со ссылкой на внутреннюю переписку.

Позже ByteDance дала указание сотрудникам перестать использовать API для разработки Project Seed примерно в то время, когда её чат-бот Doubao получил одобрение регулирующих органов для запуска в Китае. По данным, Verge компания-владелец TikTok продолжает использовать технологию OpenAI для оценки производительности своего чат-бота.

Теги:
Рейтинг0
Комментарии1

Недавно я задумался о том, как можно сделать LLM креативным. Кроме регулировки температуры, какие еще способы есть? Рассматривал ли кто-нибудь возможность получения более уникальных ответов от LLM, если изначально давать ему необычные промпты? Вроде в playground OpenAI, раньше была функция отображения вероятности токенов, но сейчас ее нет. Есть ли у вас предложения по повышению креативности LLM? Существуют ли модели LLM, которые предоставляют информацию о вероятности токенов в своих ответах? Уместно ли ставить равно между более редкими токенами в ответе и большей креативностью?

Теги:
Рейтинг0
Комментарии2

Специалисты «Яндекса» сравнили качество ответов YandexGPT 2 и GPT 3.5. Исследование показало, что в 63% случаев собственная языковая модель «Яндекса» отвечает на запросы лучше, чем нейросеть компании OpenAI.

Исследование проводилось методом сравнения Side by Side (SBS). Обе нейросети отвечали на один и тот же запрос, а AI-тренеры выбирали лучший ответ, не зная, какая именно модель его сгенерировала. Корзину запросов сформировали из обезличенных обращений пользователей сервисов «Яндекса» к YandexGPT 2. Она учитывает реальные потребности людей и охватывает множество тем.

«Сравнения нейросетей нужны не для того, чтобы получить абстрактные цифры в бенчмарке, а для решения задач продукта, создания новых функций и развития бизнеса. Именно поэтому значительную часть корзины для сравнения составили настоящие запросы из наших сервисов», — пояснил технический директор «Яндекс» Поиска Алексей Гусаков.

В начале сентября «Яндекс» представил языковую модель YandexGPT 2. Новая модель отвечает лучше старой в 67% случаев, а в некоторых сценариях побеждает с ещё бо́льшим перевесом. Разработчики пояснили, что добились этого результата благодаря улучшениям на каждом этапе обучения модели, но ключевое изменение — новый pretrain.

Теги:
Всего голосов 5: ↑5 и ↓0+5
Комментарии1

Вклад авторов