Как стать автором
Обновить
557.18

Искусственный интеллект

AI, ANN и иные формы искусственного разума

Сначала показывать
Порог рейтинга
Уровень сложности

Как начать мыслить о ИИ

Уровень сложностиПростой
Время на прочтение7 мин
Количество просмотров2.2K

В этой статье я расскажу о своем представлении того, с чего можно начать мыслить о создании искусственного интеллекта (ИИ, цифрового интеллекта, ЦИ), даже если он будет очень простым. Здесь я привожу несколько идей, которые должны показать, как можно мыслить о ИИ по-другому, с точки зрения того, какими основными свойствами должна обладать интеллектуальная программа и с чего можно начать мыслить в направлении создания ИИ.

Читать далее
Всего голосов 1: ↑1 и ↓0+1
Комментарии3

Проблема «галлюцинирования» в больших языковых моделях на примере чат-ботов

Уровень сложностиСредний
Время на прочтение14 мин
Количество просмотров2K

Добрый день, уважаемые читатели Хабр. По роду деятельности, я уже некоторое время занимаюсь вопросами NLP, в частности, генеративными большими языковыми моделями и, реализованными, на них чат-ботами. При этом, очень часто в их разработке возникает ряд проблем, с которыми приходится постоянно бороться. Одна из них — «галлюцинирование» моделей, то есть выдача неточной информации на поступающие запросы от пользователя, и, в целом, некорректное поведение модели при длительном ведении диалогов различной степени направленности, специфики, глубины рассуждений, оценки фактов и правдивости выдаваемых ответов. 

Исходя из этого, я решил систематизировать все имеющиеся по этой теме сведения. Сразу оговорюсь, статья носит обзорный характер и я ставлю своей целью обобщение фактов, причин и признаков такого поведения. Поиск возможных вариантов, методик и подходов для решения данной проблемы будут рассмотрены в следующей статье. Здесь, не будет кода и строгих выкладок, лишь, наблюдения, аналитика, способы оценки, выявленные закономерности и оценка работы в общем. 

В качестве результата исследования, предлагается описание общей ситуации с обнаруженными возможными проявлениями феномена «галлюцинирования». На целостность и завершенность обзора, при описании полученных вариаций и проявлений данного факта, не претендую. Это результаты моего поиска и анализа. Информация собиралась, буквально по крупицам, так как все сведения сильно разрознены, проявления их в «дикой природе» не всегда можно заметить и четко классифицировать, либо они начинают проявляться спустя большое количество тестов, диалогов, рассуждений, запросов, вариантов подачи подсказок и уточнений на поставленные запросы и исходных текстов. Кроме всего прочего, градация распределения этих аномалий по степени отслеживания, так же, сильно разнится. Есть те, которые проявляются весьма быстро, а есть крайне редкие, для которых нужен специфических, очень тонкий подход. Ниже я представлю данный перечень с подробными пояснениями, так что всех прошу под кат. 

Читать далее
Всего голосов 15: ↑14 и ↓1+21
Комментарии12

Язык программирования Mojo: что нового в версии 24.3?

Время на прочтение4 мин
Количество просмотров2.9K

На днях была опубликована новая версия языка программирования Mojo, теперь это 24.3. Новинка получила несколько важных компонентов, которые требуются для создания приложений на этом языке. Например, компилятор, интерактивная REPL-оболочка для сборки и запуска программ, отладчик, дополнение к редактору кода Visual Studio Code (VS Code) и т. п.

Стоит отметить, что исходники открыты под лицензией Apache 2.0. После того как будет завершено проектирование внутренней архитектуры, разработчики откроют и код компилятора. Ну а подробности изменений и дополнений — под катом.

Читать далее
Всего голосов 11: ↑9 и ↓2+13
Комментарии6

Топ-5 инструментов c AI для начинающих (или не очень) разработчиков

Уровень сложностиПростой
Время на прочтение5 мин
Количество просмотров7K

Однозначного ответа на вопрос «заменит ли ИИ человека» нет до сих пор. Ясно лишь одно — человек, умеющий правильно использовать искусственный интеллект, рано или поздно сместит того, кто ИИ пользоваться не умеет.

Мы собрали подборку из 5 AI-инструментов, которые могут быть полезны при разработке. Приятного чтения!

Читать далее
Всего голосов 14: ↑8 и ↓6+2
Комментарии8

Как AI-стартапу сэкономить копеечку: синтез речи из палок и веток для low-resource языков

Уровень сложностиСредний
Время на прочтение5 мин
Количество просмотров1.2K

Идущие майские учат нас, что шашлык сам себя не пожарит…но это лишь до поры до времени – не далек тот час, когда ИИ автоматизация наверняка придет и сюда! Но пока светлое будущее еще не наступило, поэтому давайте поговорим … о котиках о лошадках 🐴

Слышали ли вы, как скачет конь по монгольской степи? Если нет, то в этой статье мы исправим это упущение и расскажем, как за 'недорого' натренировать облегчённую TTS (Time-to-speech) модель для воспроизведения речи на монгольском языке, очень непривычно звучащим для русского уха и практически непроизносимом для языка 🚑

тыг-дык-тыг-дык… тыг-дык-тыг-дык…ии-го-го … Примерно такого аудио ряда мы ждем на выходе у нашего эксперимента... Чтобы узнать, как мы дошли до такой жизни, что у нас в итого получилось и насколько оно бьется с ожиданиями, поскакали под кат! 😜🚀

Поскакать
Всего голосов 6: ↑5 и ↓1+4
Комментарии6

Как пользоваться Claude: знакомство с главным конкурентом ChatGPT и базовые правила его использования

Уровень сложностиПростой
Время на прочтение14 мин
Количество просмотров16K

В последние годы мы стали свидетелями стремительного развития и роста популярности чат-ботов на базе искусственного интеллекта. Одним из наиболее известных и широко используемых чат-ботов стал ChatGPT от компании OpenAI, который продемонстрировал впечатляющие возможности в общении и решении разнообразных задач.

Однако ChatGPT - далеко не единственный продвинутый чат-бот, доступный сегодня. Не так давно компания Anthropic представила миру Claude v.3 Opus - ИИ-ассистента нового поколения, который во многом превосходит возможности ChatGPT и имеет ряд значимых отличий. И хотя на первый взгляд Claude может показаться похожим на своего более известного "коллегу", при ближайшем рассмотрении становятся видны существенные различия в архитектуре, возможностях и особенностях взаимодействия с пользователем.

В этой статье мы рассмотрим ключевые отличия Claude от ChatGPT, дадим практические рекомендации по эффективной работе с этим ИИ-помощником и обсудим перспективы дальнейшего развития подобных систем. Наша цель - предоставить полезное руководство, которое поможет вам в полной мере освоить и применять Claude, избегая распространенных ошибок и открывая новые горизонты в решении задач с помощью ИИ. Конечно, в этой статье не получится рассказать все, но самое основное - однозначно.

Приятного прочтения!:)

Читать далее
Всего голосов 16: ↑14 и ↓2+15
Комментарии17

ИИ-технологии потребляют слишком много энергии: правда или миф

Время на прочтение8 мин
Количество просмотров1.8K

Как и обо всех новых технологиях, об искусственном интеллекте уже успело сформироваться немало легенд. Например, о том, что сложные ИИ-модели вроде GPT-3 или DALLE оставляют огромный углеродный след и оказывают разрушительное воздействие на окружающую среду. В поисках истины мы нашли материал с интересной точкой зрения и перевели ее для вас. И кстати, 10 мая в Светлогорске мы обсудим технологии будущего на фестивале KODE Waves.

В последние годы заголовки в СМИ часто пугали читателей количеством электроэнергии, нужной для развития цифровых технологий. Например, когда в 2019 году Apple, Disney и HBO и другие видеостриминговые сервисы анонсировали платные подписки для конкуренции с Netflix, Amazon и YouTube, СМИ написали, что «согласно заявлению Французского аналитического центра, получасовой просмотр Netflix генерирует такой же выброс CO₂, как проезд на машине 6,5 километров». Год спустя аналитический центр обнаружил ошибку в вычислениях и подсчитал, что получасовой просмотр Netflix по количеству CO₂ сопоставим скорее с проездом на машине от 10 до 100 метров, но об этом СМИ не написали.

Читать далее
Всего голосов 4: ↑2 и ↓2+2
Комментарии4

«Строка бога»/идеальный промт, часть 2, продолжение истории

Уровень сложностиСредний
Время на прочтение4 мин
Количество просмотров2K

Здравствуйте, уважаемые читатели!

В этой статье я хотел бы продолжить тему появления субъязыка текстовых запросов к нейросетям (которая может быть полезна не только для инженеров, но и всех энтузиастов, которые, как, к примеру, и я проводят значительное время за работой с ИИ-генераторами).

Компания Anthropic, которая разработала семейство больших языковых моделей (LLM) Claude представила новый ИИ-инструмент, суть которого заключается в использовании уже готовых, универсальных, оптимизированных текстовых запросов по соответствующим темам, что позволяет повысить скорость и эффективность работы с нейросетевыми ресурсами.

Инструмент и соответствующий раздел веб-сайта Anthropic, на котором он размещен, получили название Prompt Library – Библиотека Запросов – а в качестве подзаголовка представлена фраза Explore optimized prompts for a breadth of business and personal tasks (Осваивайте оптимизированные запросы для решения широкого спектра деловых и личных задач).

Читать далее
Всего голосов 11: ↑6 и ↓5+5
Комментарии11

Дайджест научпоп-новостей за неделю, о которых мы ничего не писали

Уровень сложностиПростой
Время на прочтение5 мин
Количество просмотров3K

• Луноход НАСА VIPER обзавёлся «шеей» и «головой» для миссии, планируемой на этот год

• Учёные создали первый искусственный синапс, похожий на те, что есть в мозге

• Перегруженность орбиты достигает критического уровня, предупреждает новый доклад

• «Тигровые полосы» на Энцеладе могут показать, пригодны ли его океаны для жизни

• Исследователи создали пластик, в который добавлены бактерии, способные его переваривать

Читать далее
Всего голосов 31: ↑31 и ↓0+37
Комментарии5

Практические аспекты ранжирования ответов виртуального ассистента Салют

Уровень сложностиСредний
Время на прочтение7 мин
Количество просмотров1.3K

Всем привет! Меня зовут Аня Максимова, я занимаюсь NLP в команде Нейронные сети продукта Собеседник! 5 апреля проходила конференция Giga R&D Day, где мой коллега — Артем Снегирев рассказывал про практические аспекты ранжирования ответов виртуального ассистента Салют.

В этой статье мы подробнее расскажем вам, как делаем ранжирование ответов на примере собеседника, который является частью ассистентов Салют.

У ассистента есть три голоса — Сбер, Афина и Джой. Собеседник отвечает за общение на различные темы, ответы на фактологические вопросы и за развлекательный контент. Как правило, ассистент отвечает генеративными моделями, но есть сценарии, где используются заготовленные реплики, и их достаточно много, поэтому мы используем поиск — это классический retrieval-based подход.

Читать далее
Всего голосов 15: ↑15 и ↓0+17
Комментарии0

«В чем сила?» — ищем ответ среди афоризмов. Сравнение 6 моделей для векторного поиска и так ли хорош OpenAi Large

Уровень сложностиПростой
Время на прочтение4 мин
Количество просмотров1.5K

Сравниваем между собой качество 6 различных токенайзеров, включая новейший OpenAi Large|Small и E5 от Microsoft на задаче векторного поиска:

Ищем ответ на вопрос: В чем сила? в сборнике афоризмов и цитат.

Рассматриваются модели

text-embedding-ada-002
text-embedding-3-large
text-embedding-3-small
intfloat/multilingual-e5-large
ai-forever/ruBert-large
ai-forever/sbert_large_mt_nlu_ru

P.S. Бонусом сравнение как влияет токенайзер на качество задачи по классификации текста (30 классов).

Читать далее
Всего голосов 12: ↑11 и ↓1+15
Комментарии4

ADAS глазами Mobileye

Уровень сложностиПростой
Время на прочтение13 мин
Количество просмотров648

Вольный пересказ выступления главы компании Mobileye профессора Amnon Shashua на пресс конференции в 2023 году.

Читать далее
Всего голосов 7: ↑5 и ↓2+8
Комментарии2

Первый музыкальный клип, созданный нейросетью Sora от OpenAI, революция или баловство?⁠⁠ Как работает?

Время на прочтение5 мин
Количество просмотров6.9K

Представьте, что вы смотрите музыкальный клип, в котором каждая сцена, каждый персонаж и каждое движение камеры созданы искусственным интеллектом. Звучит как научная фантастика? Что ж, будущее уже наступило. Встречайте The Hardest Part - первый в истории музыкальный клип, полностью сгенерированный нейросетью Sora от OpenAI.

Читать далее
Всего голосов 7: ↑5 и ↓2+3
Комментарии14

Ближайшие события

Конференция «Я.Железо»
Дата18 мая
Время14:00 – 23:59
Место
МоскваОнлайн
Антиконференция X5 Future Night
Дата30 мая
Время11:00 – 23:00
Место
Онлайн
Конференция «IT IS CONF 2024»
Дата20 июня
Время09:00 – 19:00
Место
Екатеринбург
Summer Merge
Дата28 – 30 июня
Время11:00
Место
Ульяновская область

Bodyfuck – как писать программы без клавиатуры и c пользой для здоровья

Уровень сложностиПростой
Время на прочтение1 мин
Количество просмотров3.8K

Brainfuck — это один из эзотерических языков программирования, который имеет всего восемь команд, каждая из которых записывается одним символом.


А Bodyfuck — это жестовый интерпретатор Brainfuck, который позволяет писать код программы, используя различные движения тела без использования клавиатуры.


Смотрите, не перепутайте! :-)


Всего голосов 19: ↑16 и ↓3+23
Комментарии4

На практике пробуем KAN – принципиально новую архитектуру нейросетей

Уровень сложностиСредний
Время на прочтение5 мин
Количество просмотров27K

На днях ученые из MIT показали альтернативу многослойному перцептрону (MLP). MLP с самого момента изобретения глубокого обучения лежит в основе всех нейросетей, какими мы их знаем сегодня. На его идее в том числе построены большие языковые модели и системы компьютерного зрения.

Однако теперь все может измениться. В KAN (Kolmogorov-Arnold Networks) исследователи реализовали перемещение функций активации с нейронов на ребра нейросети, и такой подход показал блестящие результаты.

Читать далее
Всего голосов 57: ↑56 и ↓1+75
Комментарии15

Как LLM учат понимать синтаксис

Уровень сложностиСредний
Время на прочтение4 мин
Количество просмотров2.6K

Скорее всего, вы поняли заголовок правильно, хотя в нём есть стилистическая ошибка — двусмысленность (кто-то учит LLM, или они учат кого-то?). 

Человеческое понимание языка остается ориентиром и пока недостижимой целью для языковых моделей. При всей небезошибочности первого и при всех невероятных успехах последних. Например, человеку обычно не составляет труда однозначно трактовать двусмысленные фразы исходя из контекста. Более того, мы с удовольствием используем такие каламбуры в шутках разного качества. Из самого известного приходит на ум только “В Кремле голубые не только ели, но и пили” (предложите свои варианты в комментариях — будет интересно почитать). Есть ещё “казнить нельзя помиловать”, но эта двусмысленность разрешается запятой.

Самый известный пример в английском:  “Time flies like an arrow; Fruit flies like a banana”. 

Человек скорее всего после некоторых раздумий поймёт это как “Время летит как стрела, мухи любят банан” (хотя мне, например, понадобилось на это несколько секунд).  Яндекс переводчик понимает эту фразу так:  “Время летит как стрела, фрукты разлетаются как бананы”. Google translator демонстрирует зоологическую эрудированность: “Время летит как стрела; Фруктовые мушки, как банан”, а ChatGPT предлагает “Время летит как стрела; Мухи на фруктах летают как бананы”. В общем, никто не справился. 

Читать далее
Всего голосов 8: ↑8 и ↓0+11
Комментарии2

Как нам ChatGPT ускорил подбор на 30%

Уровень сложностиПростой
Время на прочтение6 мин
Количество просмотров6K

Мы в GetIT и Headz.io используем ChatGPT очень активно. Никого не заменяем — все люди на месте и при этом все довольны результатом, который выдает ChatGPT. В статье расскажу, каких результатов достигли в агентстве, используя этот инструмент. Плюс будут промты. Плюс будут аналоги ChatGPT, если у вас нет к нему доступа.

Читать далее
Всего голосов 19: ↑11 и ↓8+6
Комментарии12

Камера с распознаванием лиц и стрельбой слезоточивым газом

Время на прочтение2 мин
Количество просмотров2.5K

На Kickstarter стартовал сбор заказов на камеру видео наблюдения, использующую технологию распознавания лиц и отпугивающую злоумышленников пейнтбольными шарами. Когда PaintCam замечает кого-то, кого не знает, то через динамик советует убираться. Если нарушитель решает остаться, включается обратный отсчет, а потом камера стреляет шариками с краской. Особо гуманистичные владельцы могут зарядить камеру  снарядами со слезоточивым газом.

Читать далее
Всего голосов 6: ↑4 и ↓2+5
Комментарии18

Как интеллектуальные NPC Ubisoft справляются с динамическим взаимодействием с игроками?

Время на прочтение4 мин
Количество просмотров3K
Снятся ли NEO NPC электроовцы?



На GDC 2024 компания Ubisoft официально представила миру NEO NPC — генеративную технологию на базе ИИ для внутриигровых диалогов и взаимодействия игроков с неигровыми персонажами. Проект NEO NPC возник в результате сотрудничества между разработчиками Ubisoft и Inworld AI, которая предоставляет большую языковую модель (Large Language Model – LLM) для NEO NPC, позволяющую разработчикам создавать и формировать персонажей с их собственным прошлым, личностями и жизненными позициями. Также в этом проекте участвует Nvidia, предоставляя свою технологию Audio2Face для анимации NEO NPC в режиме реального времени.
Читать дальше →
Всего голосов 9: ↑7 и ↓2+8
Комментарии0

Этендю и голограммы

Время на прочтение9 мин
Количество просмотров1.8K


Авторы научно-фантастических произведений в своих трудах описывают технологии, которые казались чем-то невероятным в период жизни того или иного автора. Часть из этих вымышленных технологий в результате научного прогресса стали реальностью. Другие же до сих пор существуют лишь в теоретической плоскости. Одной из распространенных технологий, ассоциированных с миром будущего, являются голографические дисплеи. Зачатки этой технологии уже существуют, но их пока сложно назвать полноценными. Большинство из них имеют низкий геометрический фактор (этендю), что приводит либо к снижению поля зрения, либо к снижению размеров дисплея. Ученые из Принстонского университета (США) смогли обойти эти ограничения, достигнув высоких значений этендю. Что именно сделали ученые, какие результаты их работы, и что значит для технологии голографических дисплеев? Ответы на эти вопросы мы найдем в докладе ученых.
Читать дальше →
Всего голосов 14: ↑13 и ↓1+18
Комментарии2

Вклад авторов