Машинное обучение *

Основа искусственного интеллекта

Блог компании BotHubМашинное обучение*Искусственный интеллект

Если вы скептически настроены в отношении автопилота Tesla, рекомендую вам ознакомиться с этим видео, способным изменить ваше мнение.

Этот ролик демонстрирует, что AI / Tesla FSD - ключ к безопасному и надежному вождению, сравнимому с человеческим.

Система преобразует изображения с камер и данные с карт в низком разрешении в управляющие сигналы. Она эффективно справляется с различными нестандартными дорожными ситуациями и проявляет повышенную осторожность вблизи пешеходов, улавливая даже незначительные сигналы их телодвижений, чтобы предугадать их действия.

Такое поведение системы обусловлено обучением на миллионах часов видеозаписей. Система научилась интерпретировать дорожную обстановку так же, как это делает человек, и адаптироваться к неожиданным ситуациям.

В отличие от устаревших систем, основанных на тысячах правил и определений, FSD обеспечивает впечатляющее качество вождения.

Ожидается, что FSD достигнет полной функциональности в текущем году и будет одобрена в следующем.

Теги:

linuxacademy

5 часов назад3.2K

Open source*Python*Машинное обучение*Искусственный интеллект

DocsGPT — open-source AI-помощник для работы с документами и не только.

DocsGPT — это функциональное решение на базе LLM и GPT с открытым исходным кодом, которое упрощает процесс поиска информации в документации.

Благодаря интеграции мощных LLM можно задавать вопросы по документации и различным текстам и получать точные ответы.

Модели на Hugging Face:

🟡 Docsgpt-7b-mistral — требует 1×A10G GPU

🟡 Docsgpt-14b — требует 2×A10 GPU

🟡 Docsgpt-40b-falcon — требует 8×A10G GPU

🖥 GitHub

#llm #gpt

Если интересуетесь темой ИИ и нейросетей, здесь я публикую разбор свежих моделей, статей и гайдов, кладешь полезной информации.
#gpt #машинноеобучение #chatgpt

Теги:

linuxacademy

10 часов назад5.9K

Python*Программирование*Открытые данные*Машинное обучение*Искусственный интеллект

Разбираем задачи на стажировку аналитика в яндекс. Подключаем GPT-4 Turbo и самые мощные ИИ!

Я подробно разобрал 3 задания на стажировку в летнюю школу Яндекс,

Затем я решил 2 из них с помощью GPT-4 в боте https://t.me/Chatgpturbobot GPT-4 решил первые 2 задания с первого раза, с одного промпта, а 3 задание никак не мог решить. Еще я рассказал про крутую арену с LLM - сайт chat.lmsys.org, на нем я попробовал решить 3 задание с помощью 6 разных LLM, но ни одна не справилась

Здесь я подробно разобрал 3 задания на стажировку в летнюю школу Яндекс, машинное обучение и data science.

#машинноеобучние

Теги:

Golangcoder

13 часов назад3.7K

Open source*Программирование*Машинное обучение*Искусственный интеллект

📌 Сохраняем себе самые интересные нейросети за неделю, которые вы могли пропустить

- Clipdrop: генератор изображений, способный создавать дипфейки и дополнять объекты;

- Chatgpturbobot - лучший бесплатный бот, который поддерживает новые версии GPT. Бот также поддерживает визуальную модель gpt, вы можете отправить скриншот за задачей боту и он пришлет вам решение, крутая вещь;

- UDIO: обновленная нейронная сеть для создания музыкальных треков. Нейронка теперь умеет создавать треки продолжительностью до 15 минут и может «держать в уме» контекст 2 минут трека (ранее только 30 сек);

- StoryDiffusion: генератор комиксов и видео, Модель позволяет создавать комиксы в различных стилях, с акцентом на последовательное повествование и поддержание единого стиля окружения, персонажей и их одежды;

- ChatRTX: умный чат-бот от Nvidia, Работает ChatRTX на компьютере локально, но для запуска нужна видеокарта RTX 30-й или 40-й серии.

- PuLID: стилизует изображения по текстовому запросу или фотореференсу;

- Webcam Motion Capture: приложение для превращения в персонажа аниме;

- Meshy: обновленный генератор 3D-моделей на основе текста или изображений;

- MS Paint Portraits: рисование в стиле Paint;- ClearSpace: приложение, требующее отжиманий для разблокировки смартфона

- ClearSpace — интересное ИИ-приложение, которое заставит вас отжиматься, чтобы разблокировать свой смартфон. Обмануть приложение не получится, т.к. ИИ пристально следит через камеру за вашими движениями и распознает, сколько раз вы отжались

Теги:

Golangcoder

14 часов назад3.9K

Open source*Python*Программирование*Машинное обучение*Искусственный интеллект

📊 TimesFM - это новая модель прогнозирования временных рядов от Google, предварительно обученная на большом массиве данных состоящем из 100 миллиардов реальных временных точек.

Модель демонстрирует впечатляющую производительность при zero-shot обучении на множестве бенчмарков.

▪Github: https://github.com/google-research/timesfm

▪Paper: https://arxiv.org/abs/2310.10688

▪Blog: https://research.google/blog/a-decoder-only-foundation-model-for-time-series-forecasting/

▪HF: https://huggingface.co/google/timesfm-1.0-200m

Если интересуетесь темой ИИ и нейросетей, здесь я публикую разбор свежих моделей, статей и гайдов, кладешь полезной информации.

#TimesFM #TimeSeries #Forecasting #FoundationModels

Теги:

Odin_Himself

вчера в 00:215.5K

Машинное обучение*Управление проектами*Искусственный интеллектIT-компании

Контекстное окно длиной 4 миллиона токенов в Llama-3 8B (V0.1) 🧑‍🍳

8 мая 2024 г. представители Gradient AI опубликовали в X (*запрещена в России) следующий пост:

"Мы активно расширяем границы возможностей моделей с большими контекстными окнами, поэтому мы с радостью представляем раннюю версию нашей модели Llama-3 8B на 4 млн токенов, которую мы выложили на huggingface.

Несмотря на то, что её совершенствование потребует времени, на сегодняшний день, из всех моделей с исходным кодом в открытом доступе, Llama-3 8B имеет контекстное окно, которое вмещает самое большое количество токенов.
Если вам нравится то, что вы видите, следите за нами и нашими друзьями@CrusoeEnergyтак как мы продолжаем оказывать помощь сообществу!"

Также следует отметить, что контекстное окно на 4 миллиона токенов примерно соответствует тексту длиной 3 миллиона слов.

Для справки, во всех книгах серии Гарри Поттер на языке оригинала суммарно содержится порядка 1,084,170 слов.

Gradient AI: Искусственный интеллект для бизнеса

Gradient AI представляет собой платформу искусственного интеллекта (AI), специально разработанную для работы с данными и корпоративными задачами. Она предлагает быстрый и простой способ интеграции AI в бизнес, обеспечивая максимальную ценность с минимальными усилиями.

Теги:

Golangcoder

11 мая в 21:596.8K

Программирование*Машинное обучение*ДизайнИскусственный интеллект

Крутая ИИ-замена Photoshop.

Stylar генерирует картинки, превращает скетчи в 2D и 3D изображения, комбинирует их и улучшает качество. При этом ничего не нужно скачивать — все работает в браузере.

Есть и стандартные фичи:

удалить фон
добавить текст и эффекты
создать реалистичные мокапы

Разрабы выложили целую библиотеку референсов — круто для вдохновения!

Попробовать можно здесь.

Теги:

Golangcoder

11 мая в 20:056.6K

Open source*Python*Машинное обучение*Искусственный интеллект

⚡️ LLaVA-NeXT: новая мощнейшая модель для расшифровки и понимания видео.

LLaVA-NeXT - одна из самых мощных на сегодняшний день моделей для понимания видео, превосходящая все существующие VLM, с открытым исходным кодом.

LaVA-NeXT - одна из самых мощных на сегодняшний день моделей для понимания видео, превосходящая все существующие VLM, с открытым исходным кодом.

Новая SoTA!

LLaVA-Next демонстрирует высокую скорость передачи данных и демонстрирует отличные результаты при zero-shot обучении.

▪Github: https://github.com/LLaVA-VL/LLaVA-NeXT

▪Blog: https://llava-vl.github.io/blog/2024-04-30-llava-next-video/

▪HF: https://huggingface.co/shi-labs/CuMo-mistral-7b

▪Dataset: https://huggingface.co/datasets/shi-labs/CuMo_dataset

Если интересуетесь темой машинного обучения и LLM, здесь я публикую разбор свежих LLM моделей, статей и гайдов, кладешь полезной информации.

Теги:

odmin227

11 мая в 18:056.1K

Программирование*Big Data*Машинное обучение*Искусственный интеллектNatural Language Processing*

Совместно с Игорем Котенковым подготовили для себя и для вас Бинго-карточку на предстоящую трансляции OpenAI, чтоб было интереснее наблюдать!

Что именно покажут на презентации не уточнялось, но по словам Sam. A.:
`not gpt-5, not a search engine, but we've been hard at work on some new stuff we think people will love! feels like magic to me`

В твиттере много отсылок к слову "magic" и слухов по поводу голосового помощника, модели связанной со звуком.

В своем канале я оставлю короткую выдержку новостей и о какой магии говорят в openai!

Теги:

linuxacademy

11 мая в 12:317.2K

Open source*Python*Машинное обучение*Искусственный интеллектData Engineering*

⚡️ PyWinAssistant — AI-инструмент для управления пользовательским интерфейсом

PyWinAssistant — это первый AI-фреймворк для Windows 10/11 с открытым исходным кодом для управления любыми пользовательскими интерфейсами win32api путем использования визуализации мышления (VoT) и пространственных рассуждений в LLM (без OCR / обнаружения объектов / сегментации — такой подход улучшает качество работы PyWinAssistant).

PyWinAssistant имеет встроенные опции чтобы помогать человеку пользоваться компьютером.

Он правильно понимает любые запросы на естественном языке и планирует выполнение правильных действий в ОС с учетом требований безопасности.

🖥 GitHub

🟡 Arxiv (связанное с этим исследование)

Если интересуетесь машинным обучением и ИИ, здесь я публикую разбор свежих LLM и их разбор, статьи и гайды, кладезь полезной информации.

#машинноеобучение #deeplearning

Теги:

linuxacademy

11 мая в 11:296.6K

Open source*Программирование*Машинное обучение*Искусственный интеллект

🍏 Крутая новость: Apple заключила соглашение о внедрении ChatGPT в каждый iPhone

Apple и OpenAI смогли договориться и почти завершили сделку. Анонс может пройти на конференции WWDC в июне.

По слухам, нейронная сеть значительно улучшит функциональность Siri,сделав её по-настоящему полезным помощником.

Ожидаем вместе с выпуском iOS 18.

Теги:

Open source*Python*Машинное обучение*Искусственный интеллектData Engineering*

Вышла невероятная модель Gemma 2B с длиной контекста 10M, которая анализирует до 7 млн слов.

В нее можно закидывать огромные документы и модель всё проанализирует.

Производительность выше Gemini в 10 раз, а памяти нужно всего 32 ГБ.

Поддерживает Cuda.

▪Github: https://github.com/mustafaaljadery/gemma-2B-10M

▪HF: https://huggingface.co/mustafaaljadery/gemma-2B-10M

▪Technical Overview: https://medium.com/@akshgarg_36829/gemma-10m-technical-overview-900adc4fbeeb

Теги:

linuxacademy

10 мая в 22:569.4K

Open source*Машинное обучение*Искусственный интеллект

OpenAI готовят грандиозный анонс.

Хитрец Сэм Альтман, отец chatgpt начал греть аудиторию перед большим анонсом на стриме компании в понедельник.

По его словам, это не GPT-5 и не убийца Google.

«Мы много работали над кое-чем реально новым и думаем, что всем это понравится. Я прям чувствую магию!»

Понедельник. 20:00 по мск. Ожидаем)

В своем канале я сделаю разбор трансляций, а еще там много крутых LLM , статей и гайдов по машинному обучению, ИИ, dl, заходите в гости,

Теги:

Golangcoder

10 мая в 19:436.6K

Open source*Python*Машинное обучение*Искусственный интеллектData Engineering*

Новый метод Deblur-GS на основе Гауссовских сплатов для качественного восстановления размытой картинки

Мощный метод Deblur-GS на основе Гауссовских сплатов для качественного восстановления размытой картинки.

Что же такое Гаусовские Сплаты, простыми словами:

Из видео извлекается облако точек, затем по облаку создается набор маленьких полупрозрачных гауссиан. Потом эти гауссианы оптимизируются доя тогог, чтобы после рендеринга с высокой точностью восстанавливать кадры.

Это не Nerual Radiance Field и здесь все рабоатет намного проще.

За счет простоты эта штука и обучается, и рендерится довольно быстро.

Deblur-GS обеспечивает превосходную производительность и качество рендеринга по сравнению с предыдущими методами, что подтверждается бенчмарками, как на синтетических, так и на реальных наборах данных.

Выглядит бомбезно.

▪Code: https://github.com/Chaphlagical/Deblur-GS

▪Paper: https://chaphlagical.icu/Deblur-GS/static/paper/Deblur_GS_author_version.pdf

▪Project: https://chaphlagical.icu/Deblur-GS/

#машинноеобучение #deeplearning

Теги:

Golangcoder

10 мая в 18:329.2K

Машинное обучение*Компьютерное железо

Энтузиаст создал GPU с нуля всего за 2 недели

🟡Инженер Адам Маджмудар поделился своим опытом создания GPU с нуля, без какого-либо опыта в этой области.

Как и в своем предыдущем проекте по разработке CPU с нуля, он потратил всего две недели на этот подвиг. В треде на Twitter/X Маджмудар поделился всем процессом, шаг за шагом, и признал, что проектирование GPU оказалось намного более сложной задачей, чем ожидалось.

🟡Текущим результатом проекта стала схема чипа на Verilog, которая была пропущена через ПО OpenLane EDA для верификации. GPU будет отправлен на тестирование через Tiny Tapeout 7, так что в ближайшие месяцы он станет физическим чипом.

🖥 Tiny-GPU GitHub

Здесь я публикую ,больше крутых новостей из мира машинного обучения, железа и LLM статьи и гайды, кладезь полезной информации.

Теги:

Golangcoder

9 мая в 22:317.3K

Open source*Python*Программирование*Машинное обучение*Искусственный интеллект

Это лучшие в настоящее время боты на базе нового GPT для различных задач!

Проверенные временем боты с той самой загадочной модели, которая, возможно, является GPT-5, о ней мы уже писали здесь.

В результате добавления новой модели, боты стали значительно умнее и работают на полную мощность!

Здесь лучшие бота на базе CHATGPT из возможных:

- Creative Ad Maker — выдающийся копирайтер, который придумает для вас и пост в блоге, и рекламную кампанию. Включает в себя обширный набор виральных кейсов.

Chatgpturbobot - лучший бесплатный бот, который поддерживает новые версии GPT. Бот также поддерживает визуальную модель gpt, вы можете отправить скриншот за задачей боту и он пришлет вам решение, крутая вещь.

- Growth Hacking Expert — предложит вам идеи для стартапов с учетом ограниченного бюджета и предоставит технические детали. За кулисами у бота — обширный набор успешных кейсов.

- Creative Answers & Brainstorm GPT — генерирует креативные ответы даже на самые скучные вопросы. Например, вместо «Собирать виноград в Италии» он предложит вам не только виноградник, но и потенциальный город поблизости и так далее.

- Anti AI-Detection — скроет ваш текст от обнаружения ИИ. Случайным образом маскирует ваши генерации под человеческий текст.

- Image Edit | img2img — бот для редактирования и генерации изображений. Стал еще более полезным с появлением редактора изображений в ChatGPT: просто предоставьте ему изображение, и он создаст похожее.

Здесь я сделала обзор еще 52 топовых ИИ-ботов.

Теги:

Golangcoder

9 мая в 19:246.9K

Open source*Python*Машинное обучение*Искусственный интеллект

IC-Light - это новый интересный проект для реалистичного управления освещением.

Внутри два типа моделей: модель изменения освещения с из тектовых промптов и модель изменения подсветки фона изображений.

Выглядит невероятно правдоподобно.

Советую вам пролистать и посмотреть крутые на гитхабе.

Модели ставятся локально и как отдельный web-интерфейс.

▪Github: https://github.com/lllyasviel/IC-Light

▪Jupyter: https://github.com/camenduru/IC-Light-jupyter

▪Demo: https://huggingface.co/spaces/lllyasviel/IC-Light

Теги:

Golangcoder

9 мая в 11:194.8K

Open source*Python*Программирование*Машинное обучение*Искусственный интеллект

Microsoft только что представили инструмент You Only Cache Once: Decoder-Decoder : архитектура Decoder-Decoder для больших языковых моделей

YOCO существенно снижает потребление памяти GPU и состоит из двух компонентов - cross decoder'а, объединенного с self-decoder'ом.

Self-decoder кодирует глобальные кэши

значений ключей (KV), которые повторно используются cross decoder'ом с механизмом cross-attention.

Результаты экспериментов показывают, что YOCO достигает более высокой производительности по сравнению с архитектурой Трансформеров при различных настройках масштабирования размера модели и количества обучающих токенов, подробнее тут.

▪Github: https://github.com/microsoft/unilm/tree/master/YOCO

▪ABS: https://arxiv.org/abs/2405.05254

Теги:

Golangcoder

9 мая в 10:374K

Python*Программирование*Машинное обучение*Искусственный интеллектData Engineering*

📌Artificial Analysis собрали топ 100 LLM в одном месте

Компания Artificial Analysis разработала рейтинговую систему, оценивающую стоимость, производительность и качество более 100 LLM, чтобы обеспечить удобный выбор модели, соответствующей индивидуальным потребностям.

Параметры для оценивания LLM:

🟡Качество: комплексный индекс, рассчитанный на основе метрик, таких как MMLU, MT-Bench, оценки HumanEval, а также рейтинг Chatbot Arena;

🟡Цена: метрики, учитывающие цену на вход/выход на один токен, а также среднюю цену для сравнения провайдеров хостинга. Стоимость представляет собой взвешенную смесь цен на входные и выходные токены в соотношении 3:1;

🟡Окно контекста: максимальное количество комбинированных входных и выходных токенов;

🟡Скорость: токены/с, получаемые во время генерации моделью токенов. Median, P5, P25, P75 и P95;

🟡Задержка: время до первого полученного токена, измеренное в секундах, после отправки запроса через API. Median, P5, P25, P75 и P95.

Если хотите изучать машинное обучение, разбираться в LLM и ИИ, здесь я публикую разбор свежих LLM и их разбор, статьи и гайды, кладезь полезной информации.

#llm

Теги:

Golangcoder

8 мая в 20:266.7K

Open source*Машинное обучение*Искусственный интеллектБиология

Google DeepMind представили Alpha Fold3, новую модель искусственного интеллекта, которая предсказывает структуру и взаимодействия молекул.

Благодаря точному прогнозированию структуры белков, ДНК, РНК и многого другого, а также того, как они взаимодействуют, наше понимание биологического мира может выйти на новый уровень, а в практическом применение поможет разработке новых лекарств.

Эта революционная модель, может предсказывать структуру и взаимодействия всех молекул жизни с беспрецедентной точностью.

На основе входного списка молекул Alpha Fold3 генерирует их общую трехмерную структуру, показывая, как они сочетаются друг с другом. Программа моделирует крупные биомолекулы, такие как белки, ДНК и РНК, а также небольшие молекулы, также известные как лиганды.

Кроме того, Alpha Fold3 может моделировать химические модификации этих молекул, которые контролируют здоровое функционирование клеток, нарушение которых может привести к различным заболеваниям.

Теперь для учёные со всего мира могут работать с AlphaFold 3 совершенно бесплатно.

https://blog.google/technology/ai/google-deepmind-isomorphic-alphafold-3-ai-model/

Теги:

2 3 ...

10 11

Машинное обучение *

Ближайшие события

Вклад авторов

Работа