Как стать автором
Обновить
452.57

Машинное обучение *

Основа искусственного интеллекта

Сначала показывать
Порог рейтинга

Если вы скептически настроены в отношении автопилота Tesla, рекомендую вам ознакомиться с этим видео, способным изменить ваше мнение.

Этот ролик демонстрирует, что AI / Tesla FSD - ключ к безопасному и надежному вождению, сравнимому с человеческим.

Система преобразует изображения с камер и данные с карт в низком разрешении в управляющие сигналы. Она эффективно справляется с различными нестандартными дорожными ситуациями и проявляет повышенную осторожность вблизи пешеходов, улавливая даже незначительные сигналы их телодвижений, чтобы предугадать их действия.

Такое поведение системы обусловлено обучением на миллионах часов видеозаписей. Система научилась интерпретировать дорожную обстановку так же, как это делает человек, и адаптироваться к неожиданным ситуациям.

В отличие от устаревших систем, основанных на тысячах правил и определений, FSD обеспечивает впечатляющее качество вождения.

Ожидается, что FSD достигнет полной функциональности в текущем году и будет одобрена в следующем.

Теги:
+2
Комментарии0

DocsGPT — open-source AI-помощник для работы с документами и не только.

DocsGPT — это функциональное решение на базе LLM и GPT с открытым исходным кодом, которое упрощает процесс поиска информации в документации.

Благодаря интеграции мощных LLM можно задавать вопросы по документации и различным текстам и получать точные ответы.

Модели на Hugging Face:

🟡 Docsgpt-7b-mistral — требует 1×A10G GPU

🟡 Docsgpt-14b — требует 2×A10 GPU

🟡 Docsgpt-40b-falcon — требует 8×A10G GPU

🖥 GitHub

#llm #gpt

Если интересуетесь темой ИИ и нейросетей, здесь я публикую разбор свежих моделей, статей и гайдов, кладешь полезной информации.
#gpt  #машинноеобучение  #chatgpt

Теги:
0
Комментарии0

Разбираем задачи на стажировку аналитика в яндекс. Подключаем GPT-4 Turbo и самые мощные ИИ!

Я подробно разобрал 3 задания на стажировку в летнюю школу Яндекс,

Затем я решил 2 из них с помощью GPT-4 в боте https://t.me/Chatgpturbobot GPT-4 решил первые 2 задания с первого раза, с одного промпта, а 3 задание никак не мог решить. Еще я рассказал про крутую арену с LLM - сайт chat.lmsys.org, на нем я попробовал решить 3 задание с помощью 6 разных LLM, но ни одна не справилась

Здесь я подробно разобрал 3 задания на стажировку в летнюю школу Яндекс, машинное обучение и data science.

#машинноеобучние

Теги:
+2
Комментарии0

📌 Сохраняем себе самые интересные нейросети за неделю, которые вы могли пропустить

Clipdrop: генератор изображений, способный создавать дипфейки и дополнять объекты;

- Chatgpturbobot - лучший бесплатный бот, который поддерживает новые версии GPT. Бот также поддерживает визуальную модель gpt, вы можете отправить скриншот за задачей боту и он пришлет вам решение, крутая вещь;

UDIO: обновленная нейронная сеть для создания музыкальных треков. Нейронка теперь умеет создавать треки продолжительностью до 15 минут и может «держать в уме» контекст 2 минут трека (ранее только 30 сек);

StoryDiffusion: генератор комиксов и видео, Модель позволяет создавать комиксы в различных стилях, с акцентом на последовательное повествование и поддержание единого стиля окружения, персонажей и их одежды;

ChatRTX: умный чат-бот от Nvidia, Работает ChatRTX на компьютере локально, но для запуска нужна видеокарта RTX 30-й или 40-й серии.

PuLID: стилизует изображения по текстовому запросу или фотореференсу;

- Webcam Motion Capture: приложение для превращения в персонажа аниме;

Meshy: обновленный генератор 3D-моделей на основе текста или изображений;

MS Paint Portraits: рисование в стиле Paint;- ClearSpace: приложение, требующее отжиманий для разблокировки смартфона

ClearSpace — интересное ИИ-приложение, которое заставит вас отжиматься, чтобы разблокировать свой смартфон. Обмануть приложение не получится, т.к. ИИ пристально следит через камеру за вашими движениями и распознает, сколько раз вы отжались

Теги:
0
Комментарии0

📊 TimesFM - это новая модель прогнозирования временных рядов от Google, предварительно обученная на большом массиве данных состоящем из 100 миллиардов реальных временных точек. 

Модель демонстрирует впечатляющую  производительность при zero-shot обучении на множестве бенчмарков.

Github: https://github.com/google-research/timesfm

Paper: https://arxiv.org/abs/2310.10688

Blog: https://research.google/blog/a-decoder-only-foundation-model-for-time-series-forecasting/

HF: https://huggingface.co/google/timesfm-1.0-200m

Если интересуетесь темой ИИ и нейросетей, здесь я публикую разбор свежих моделей, статей и гайдов, кладешь полезной информации.

#TimesFM #TimeSeries #Forecasting #FoundationModels


Теги:
+2
Комментарии0

Контекстное окно длиной 4 миллиона токенов в Llama-3 8B (V0.1) 🧑‍🍳

8 мая 2024 г. представители Gradient AI опубликовали в X (*запрещена в России) следующий пост:

"Мы активно расширяем границы возможностей моделей с большими контекстными окнами, поэтому мы с радостью представляем раннюю версию нашей модели Llama-3 8B на 4 млн токенов, которую мы выложили на huggingface.


Несмотря на то, что её совершенствование потребует времени, на сегодняшний день, из всех моделей с исходным кодом в открытом доступе, Llama-3 8B имеет контекстное окно, которое вмещает самое большое количество токенов.

Если вам нравится то, что вы видите, следите за нами и нашими друзьями@CrusoeEnergyтак как мы продолжаем оказывать помощь сообществу!"

Также следует отметить, что контекстное окно на 4 миллиона токенов примерно соответствует тексту длиной 3 миллиона слов.

Для справки, во всех книгах серии Гарри Поттер на языке оригинала суммарно содержится порядка 1,084,170 слов.

Gradient AI: Искусственный интеллект для бизнеса

Gradient AI представляет собой платформу искусственного интеллекта (AI), специально разработанную для работы с данными и корпоративными задачами. Она предлагает быстрый и простой способ интеграции AI в бизнес, обеспечивая максимальную ценность с минимальными усилиями.


Теги:
0
Комментарии0

Крутая ИИ-замена Photoshop.

Stylar генерирует картинки, превращает скетчи в 2D и 3D изображения, комбинирует их и улучшает качество. При этом ничего не нужно скачивать — все работает в браузере.

Есть и стандартные фичи:

  • удалить фон

  • добавить текст и эффекты

  • создать реалистичные мокапы

Разрабы выложили целую библиотеку референсов — круто для вдохновения!

Попробовать можно здесь.

Если интересуетесь темой ИИ и нейросетей, здесь я публикую разбор свежих моделей, статей и гайдов, кладешь полезной информации.

Теги:
+2
Комментарии2

⚡️ LLaVA-NeXT: новая мощнейшая модель для расшифровки и понимания видео.

LLaVA-NeXT - одна из самых мощных на сегодняшний день моделей для понимания видео, превосходящая все существующие VLM, с открытым исходным кодом.

LaVA-NeXT - одна из самых мощных на сегодняшний день моделей для понимания видео, превосходящая все существующие VLM, с открытым исходным кодом.

Новая SoTA! 

LLaVA-Next демонстрирует высокую скорость передачи данных и демонстрирует отличные результаты при zero-shot обучении.

Github: https://github.com/LLaVA-VL/LLaVA-NeXT

Blog: https://llava-vl.github.io/blog/2024-04-30-llava-next-video/

HF: https://huggingface.co/shi-labs/CuMo-mistral-7b

Dataset: https://huggingface.co/datasets/shi-labs/CuMo_dataset

Если интересуетесь темой машинного обучения и LLM, здесь я публикую разбор свежих LLM моделей, статей и гайдов, кладешь полезной информации.

Теги:
+1
Комментарии0

Совместно с Игорем Котенковым подготовили для себя и для вас Бинго-карточку на предстоящую трансляции OpenAI, чтоб было интереснее наблюдать!


Что именно покажут на презентации не уточнялось, но по словам Sam. A.:
`not gpt-5, not a search engine, but we've been hard at work on some new stuff we think people will love! feels like magic to me`

В твиттере много отсылок к слову "magic" и слухов по поводу голосового помощника, модели связанной со звуком.

В своем канале я оставлю короткую выдержку новостей и о какой магии говорят в openai!

Теги:
+1
Комментарии0

⚡️ PyWinAssistant — AI-инструмент для управления пользовательским интерфейсом

PyWinAssistant — это первый AI-фреймворк для Windows 10/11 с открытым исходным кодом для управления любыми пользовательскими интерфейсами win32api путем использования визуализации мышления (VoT) и пространственных рассуждений в LLM (без OCR / обнаружения объектов / сегментации — такой подход улучшает качество работы PyWinAssistant).

PyWinAssistant имеет встроенные опции чтобы помогать человеку пользоваться компьютером.

Он правильно понимает любые запросы на естественном языке и планирует выполнение правильных действий в ОС с учетом требований безопасности.

🖥 GitHub

🟡 Arxiv (связанное с этим исследование)

Если интересуетесь машинным обучением и ИИ, здесь я публикую разбор свежих LLM и их разбор, статьи и гайды, кладезь полезной информации.

#машинноеобучение #deeplearning



Теги:
+3
Комментарии0

🍏 Крутая новость: Apple заключила соглашение о внедрении ChatGPT в каждый iPhone

Apple и OpenAI смогли договориться и почти завершили сделку. Анонс может пройти на конференции WWDC в июне.

По слухам, нейронная сеть значительно улучшит функциональность Siri,сделав её по-настоящему полезным помощником.

Ожидаем вместе с выпуском iOS 18.

Если интересуетесь машинным обучением и ИИ, здесь я публикую разбор свежих LLM и их разбор, статьи и гайды, кладезь полезной информации.

#chatgpt

#машинноеобчение

Теги:
+3
Комментарии1

Вышла невероятная модель Gemma 2B с длиной контекста 10M, которая анализирует до 7 млн слов.

В нее можно закидывать огромные документы и модель всё проанализирует.

Производительность выше Gemini в 10 раз, а памяти нужно всего 32 ГБ.

Поддерживает Cuda.

Github: https://github.com/mustafaaljadery/gemma-2B-10M

HF: https://huggingface.co/mustafaaljadery/gemma-2B-10M

Technical Overview: https://medium.com/@akshgarg_36829/gemma-10m-technical-overview-900adc4fbeeb

Если интересуетесь машинным обучением и ИИ, здесь я публикую разбор свежих LLM и их разбор, статьи и гайды, кладезь полезной информации.


Теги:
+3
Комментарии0

OpenAI готовят грандиозный анонс.

Хитрец Сэм Альтман, отец chatgpt начал греть аудиторию перед большим анонсом на стриме компании в понедельник.

По его словам, это не GPT-5 и не убийца Google. 

«Мы много работали над кое-чем реально новым и думаем, что всем это понравится. Я прям чувствую магию!»

Понедельник. 20:00 по мск. Ожидаем)

В своем канале я сделаю разбор трансляций, а еще там много  крутых LLM , статей и гайдов по машинному обучению, ИИ, dl, заходите в гости,


Теги:
+5
Комментарии3

Ближайшие события

One day offer от ВСК
Дата16 – 17 мая
Время09:00 – 18:00
Место
Онлайн
Конференция «Я.Железо»
Дата18 мая
Время14:00 – 23:59
Место
МоскваОнлайн
Антиконференция X5 Future Night
Дата30 мая
Время11:00 – 23:00
Место
Онлайн
Конференция «IT IS CONF 2024»
Дата20 июня
Время09:00 – 19:00
Место
Екатеринбург
Summer Merge
Дата28 – 30 июня
Время11:00
Место
Ульяновская область

Новый метод Deblur-GS на основе Гауссовских сплатов для качественного восстановления размытой картинки 

Мощный метод Deblur-GS на основе Гауссовских сплатов для качественного восстановления размытой картинки.

Что же такое Гаусовские Сплаты, простыми словами:

Из видео извлекается облако точек, затем по облаку создается набор маленьких полупрозрачных гауссиан. Потом эти гауссианы оптимизируются доя тогог, чтобы после рендеринга с высокой точностью восстанавливать кадры.

Это не Nerual Radiance Field и здесь все рабоатет намного проще.

За счет простоты эта штука и обучается, и рендерится довольно быстро.

Deblur-GS обеспечивает превосходную производительность и качество рендеринга по сравнению с предыдущими методами, что подтверждается бенчмарками, как на синтетических, так и на реальных наборах данных.

Выглядит бомбезно.

▪Code: https://github.com/Chaphlagical/Deblur-GS

▪Paper: https://chaphlagical.icu/Deblur-GS/static/paper/Deblur_GS_author_version.pdf

▪Project: https://chaphlagical.icu/Deblur-GS/

Если интересуетесь машинным обучением и ИИ, здесь я публикую разбор свежих LLM и их разбор, статьи и гайды, кладезь полезной информации.

#машинноеобучение #deeplearning

Теги:
+3
Комментарии0

 Энтузиаст создал GPU с нуля всего за 2 недели

🟡Инженер Адам Маджмудар поделился своим опытом создания GPU с нуля, без какого-либо опыта в этой области.

Как и в своем предыдущем проекте по разработке CPU с нуля, он потратил всего две недели на этот подвиг. В треде на Twitter/X Маджмудар поделился всем процессом, шаг за шагом, и признал, что проектирование GPU оказалось намного более сложной задачей, чем ожидалось. 

🟡Текущим результатом проекта стала схема чипа на Verilog, которая была пропущена через ПО OpenLane EDA для верификации. GPU будет отправлен на тестирование через Tiny Tapeout 7, так что в ближайшие месяцы он станет физическим чипом.

🖥 Tiny-GPU GitHub

Здесь я публикую ,больше крутых новостей из мира машинного обучения, железа и LLM статьи и гайды, кладезь полезной информации.


Теги:
+4
Комментарии2

Это лучшие в настоящее время боты на базе нового GPT для различных задач!

Проверенные временем боты с той самой загадочной модели, которая, возможно, является GPT-5, о ней мы уже писали здесь.

В результате добавления новой модели, боты стали значительно умнее и работают на полную мощность!

Здесь лучшие бота на базе CHATGPT из возможных:

- Creative Ad Maker — выдающийся копирайтер, который придумает для вас и пост в блоге, и рекламную кампанию. Включает в себя обширный набор виральных кейсов.

Chatgpturbobot - лучший бесплатный бот, который поддерживает новые версии GPT. Бот также поддерживает визуальную модель gpt, вы можете отправить скриншот за задачей боту и он пришлет вам решение, крутая вещь.

- Growth Hacking Expert — предложит вам идеи для стартапов с учетом ограниченного бюджета и предоставит технические детали. За кулисами у бота — обширный набор успешных кейсов.

- Creative Answers & Brainstorm GPT — генерирует креативные ответы даже на самые скучные вопросы. Например, вместо «Собирать виноград в Италии» он предложит вам не только виноградник, но и потенциальный город поблизости и так далее.

- Anti AI-Detection — скроет ваш текст от обнаружения ИИ. Случайным образом маскирует ваши генерации под человеческий текст.

- Image Edit | img2img — бот для редактирования и генерации изображений. Стал еще более полезным с появлением редактора изображений в ChatGPT: просто предоставьте ему изображение, и он создаст похожее.

Здесь я сделала обзор еще 52 топовых ИИ-ботов.

Теги:
+1
Комментарии1

IC-Light - это новый интересный проект для реалистичного управления освещением.

Внутри два типа моделей: модель изменения освещения с из тектовых промптов и модель изменения подсветки фона изображений. 

Выглядит невероятно правдоподобно. 

Советую вам пролистать и посмотреть крутые на гитхабе.

Модели ставятся локально и как отдельный web-интерфейс.

Github: https://github.com/lllyasviel/IC-Light

Jupyter: https://github.com/camenduru/IC-Light-jupyter

Demo: https://huggingface.co/spaces/lllyasviel/IC-Light

Если интересуетесь машинным обучением и ИИ, здесь я публикую разбор свежих LLM и их разбор, статьи и гайды, кладезь полезной информации.


Теги:
+3
Комментарии0

Microsoft только что представили инструмент You Only Cache Once: Decoder-Decoder : архитектура Decoder-Decoder для больших языковых моделей

YOCO существенно снижает потребление  памяти GPU и состоит из двух компонентов -  cross decoder'а, объединенного с self-decoder'ом. 

Self-decoder кодирует глобальные кэши

значений ключей (KV), которые повторно используются cross decoder'ом с механизмом cross-attention.

Результаты экспериментов показывают, что YOCO достигает более высокой производительности по сравнению с архитектурой Трансформеров при различных настройках масштабирования размера модели и количества обучающих токенов, подробнее тут.

Github: https://github.com/microsoft/unilm/tree/master/YOCO

ABS: https://arxiv.org/abs/2405.05254

Если интересуетесь машинным обучением и ИИ, здесь я публикую разбор свежих LLM и их разбор, статьи и гайды, кладезь полезной информации.


Теги:
+1
Комментарии0

📌Artificial Analysis собрали топ 100 LLM в одном месте

Компания Artificial Analysis разработала рейтинговую систему, оценивающую стоимость, производительность и качество более 100 LLM, чтобы обеспечить удобный выбор модели, соответствующей индивидуальным потребностям.

Параметры для оценивания LLM:

🟡Качество: комплексный индекс, рассчитанный на основе метрик, таких как MMLU, MT-Bench, оценки HumanEval, а также рейтинг Chatbot Arena;

🟡Цена: метрики, учитывающие цену на вход/выход на один токен, а также среднюю цену для сравнения провайдеров хостинга. Стоимость представляет собой взвешенную смесь цен на входные и выходные токены в соотношении 3:1;

🟡Окно контекста: максимальное количество комбинированных входных и выходных токенов;

🟡Скорость: токены/с, получаемые во время генерации моделью токенов. Median, P5, P25, P75 и P95;

🟡Задержка: время до первого полученного токена, измеренное в секундах, после отправки запроса через API. Median, P5, P25, P75 и P95.

Если хотите изучать машинное обучение, разбираться в LLM и ИИ, здесь я публикую разбор свежих LLM и их разбор, статьи и гайды, кладезь полезной информации.

#llm

Теги:
+1
Комментарии0

Google DeepMind представили Alpha Fold3, новую модель искусственного интеллекта, которая предсказывает структуру и взаимодействия молекул.

Благодаря точному прогнозированию структуры белков, ДНК, РНК и многого другого, а также того, как они взаимодействуют, наше понимание биологического мира может выйти на новый уровень, а в практическом применение  поможет разработке новых лекарств.

Alpha Fold3
Alpha Fold3

Эта революционная модель, может предсказывать структуру и взаимодействия всех молекул жизни с беспрецедентной точностью. 

На основе входного списка молекул Alpha Fold3 генерирует их общую трехмерную структуру, показывая, как они сочетаются друг с другом. Программа моделирует крупные биомолекулы, такие как белки, ДНК и РНК, а также небольшие молекулы, также известные как лиганды. 

Кроме того, Alpha Fold3 может моделировать химические модификации этих молекул, которые контролируют здоровое функционирование клеток, нарушение которых может привести к различным заболеваниям.

Теперь для учёные со всего мира могут работать с  AlphaFold 3 совершенно бесплатно.

https://blog.google/technology/ai/google-deepmind-isomorphic-alphafold-3-ai-model/

Если интересуетесь машинным обучением и ИИ, здесь я публикую разбор свежих LLM и их разбор, статьи и гайды, кладезь полезной информации.

Теги:
+3
Комментарии1
1
23 ...

Вклад авторов

Работа

Data Scientist
54 вакансии