Как стать автором
Обновить
421.42

Python *

Высокоуровневый язык программирования

Сначала показывать
Порог рейтинга

⚡️ DINO 1.5: самая мощная серия моделей IDEA Research для обнаружения объектов.

Это наиболее эффективный опенсорс инструмент для запуска на edge девайсах, с  хорошей оптимизацией и высокой скоростью работы.

Исходный код выпущен в версии Apache 2.0. 💙

Github

Paper

Demo

Если интересуетесь темой ИИ и нейросетей, здесь я публикую разбор свежих моделей, статей и гайдов, кладешь полезной информации.

Теги:
+2
Комментарии0

🌟 LibreChat — улучшенный свободный клон ChatGPT

LibreChat — open-source клон ChatGPT:

 — предоставляет удобный API

 — работает с Groq, GPT-4 Vision, Mistral, Bing, Anthropic, OpenRouter, Vertex AI, Gemini и другими моделями  — можно запустить полностью локально

Запуск локально:

git clone https://github.com/danny-avila/LibreChat.git

cd LibreChat

cp .env.example .env

docker compose up -d

🖥 GitHub

🟡 Подробнее о локальном запуске

🟡 Использовать онлайн

Если интересуетесь темой ИИ и нейросетей, здесь я публикую разбор свежих моделей, статей и гайдов, кладешь полезной информации.

Теги:
+4
Комментарии6

⚡ Zeus Новый инструмент экосистемы Pytorch для экономии ресурсов

Глубокое обучение потребляет довольно много энергии.

Например, обучение одного 200B LLM на инстансах AWS p4d потребляет около 11,9 ГВт-ч (источник: CIDR 2024 keynote), это же количество энергии позволяет в одиночку обеспечивать энергией более тысячи домохозяйств в среднем по США в течение года.

Теги:
-1
Комментарии0

Еще один ништячок от Google они выпустили- "PaliGemma"! 🚀 

Семейство из 116 новых моделей, которые могут подписывать изображения, отвечать на вопросы, распознавать объекты, сегментировать изображения и многое другое!

PaliGemma (Github) - это семейство моделей визуализации с архитектурой, состоящей из SIGLIP-So 400m в качестве кодера изображений и Gemma-2B в качестве декодера текста. 

SigLIP - это современная модель, которая может распознавать как изображения, так и текст. Как и CLIP, он состоит из кодера изображений и текста. Как и в случае с PALI-3, комбинированная модель Paligemma работает на основе графических и текстовых данных, а затем может быть легко адаптирована для последующих задач, таких как создание субтитров. 

Gemma - это модель для генерации текста, предназначенная только для декодера. Сочетание графического кодера Siglip и линейного адаптера Gemma позволяет использовать Paligemma в качестве мощной модели визуализации.

Блог: https://hf.co/blog/paligemma

Модели: https://hf.co/collections/google/paligemma-release-6643a9ffbf57de2ae0448dda

Demo: https://hf.co/spaces/google/paligemma

У себя в канале я опубликую ее обзор моделей и первые впечатления, а как появится api, добавлю в бота, чтобы любой мог поиграться с ним, заходите в гости)

Теги:
0
Комментарии0

🌟 LocalAI — открытая и бесплатная альтернатива предложений от OpenAI

LocalAI — это open-source альтернатива решений от OpenAI. LocalAI выступает в качестве замены REST API, совместимого со спецификациями OpenAI API для локальных выводов.

Позволяет локально запускать LLM, генерировать изображения, аудио (и не только), клонировать голос; при этом не требует GPU.

Теги:
-1
Комментарии0

🔥 Мощная шпаргалка от Стенфорда, посвящённая важнейшим понятиям ML

Здесь содержится все ключевые формулы и понятия базовых алгоритмов Machine Learning

Вся информация отлично структурирована и имеется оглавление.

Хороший вариант для тех, кто хочет погрузится в мл.

📎 Шпаргалка

Если интересуетесь темой МЛ и нейросетей, здесь я публикую разбор свежих моделей, статей и гайдов, кладешь полезной информации. 

Теги:
+8
Комментарии0

⚡️ Lory — полностью дифференцируемая Mixture-of-Experts (MoE) для предварительного обучения авторегрессионной языковой модели

На днях исследователи из Принстона представили Lory — первое в своём роде решение, которое позволяет масштабировать MoE-архитектуры для предварительного обучения авторегрессионных языковых моделей. 

В Lory реализованы 2 ключевые технологии: 

 (1) — стратегия маршрутизации причинных сегментов, которая обеспечивает высокую эффективность операций объединения экспертов при сохранении авторегрессивной природы языковых моделей

 (2) — метод группировки данных на основе сходства, который стимулирует специализацию "экспертов" путем группировки похожих документов в обучающих выборках

Результаты экспериментов с Lory показывают значительный прирост производительности по сравнению с обычными MoE-моделями. 

📎 Arxiv

Если интересуетесь темой ИИ и нейросетей, здесь я публикую разбор свежих моделей, статей и гайдов, кладешь полезной информации.

  #машинноеобучение  #llm

Теги:
+2
Комментарии0

DocsGPT — open-source AI-помощник для работы с документами и не только.

DocsGPT — это функциональное решение на базе LLM и GPT с открытым исходным кодом, которое упрощает процесс поиска информации в документации.

Благодаря интеграции мощных LLM можно задавать вопросы по документации и различным текстам и получать точные ответы.

Модели на Hugging Face:

🟡 Docsgpt-7b-mistral — требует 1×A10G GPU

🟡 Docsgpt-14b — требует 2×A10 GPU

🟡 Docsgpt-40b-falcon — требует 8×A10G GPU

🖥 GitHub

#llm #gpt

Если интересуетесь темой ИИ и нейросетей, здесь я публикую разбор свежих моделей, статей и гайдов, кладешь полезной информации.
#gpt  #машинноеобучение  #chatgpt

Теги:
0
Комментарии0

Разбираем задачи на стажировку аналитика в яндекс. Подключаем GPT-4 Turbo и самые мощные ИИ!

Я подробно разобрал 3 задания на стажировку в летнюю школу Яндекс,

Затем я решил 2 из них с помощью GPT-4 в боте https://t.me/Chatgpturbobot GPT-4 решил первые 2 задания с первого раза, с одного промпта, а 3 задание никак не мог решить. Еще я рассказал про крутую арену с LLM - сайт chat.lmsys.org, на нем я попробовал решить 3 задание с помощью 6 разных LLM, но ни одна не справилась

Здесь я подробно разобрал 3 задания на стажировку в летнюю школу Яндекс, машинное обучение и data science.

#машинноеобучние

Теги:
+1
Комментарии0

📊 TimesFM - это новая модель прогнозирования временных рядов от Google, предварительно обученная на большом массиве данных состоящем из 100 миллиардов реальных временных точек. 

Модель демонстрирует впечатляющую  производительность при zero-shot обучении на множестве бенчмарков.

Github: https://github.com/google-research/timesfm

Paper: https://arxiv.org/abs/2310.10688

Blog: https://research.google/blog/a-decoder-only-foundation-model-for-time-series-forecasting/

HF: https://huggingface.co/google/timesfm-1.0-200m

Если интересуетесь темой ИИ и нейросетей, здесь я публикую разбор свежих моделей, статей и гайдов, кладешь полезной информации.

#TimesFM #TimeSeries #Forecasting #FoundationModels


Теги:
+1
Комментарии0

⚡️ LLaVA-NeXT: новая мощнейшая модель для расшифровки и понимания видео.

LLaVA-NeXT - одна из самых мощных на сегодняшний день моделей для понимания видео, превосходящая все существующие VLM, с открытым исходным кодом.

LaVA-NeXT - одна из самых мощных на сегодняшний день моделей для понимания видео, превосходящая все существующие VLM, с открытым исходным кодом.

Новая SoTA! 

LLaVA-Next демонстрирует высокую скорость передачи данных и демонстрирует отличные результаты при zero-shot обучении.

Github: https://github.com/LLaVA-VL/LLaVA-NeXT

Blog: https://llava-vl.github.io/blog/2024-04-30-llava-next-video/

HF: https://huggingface.co/shi-labs/CuMo-mistral-7b

Dataset: https://huggingface.co/datasets/shi-labs/CuMo_dataset

Если интересуетесь темой машинного обучения и LLM, здесь я публикую разбор свежих LLM моделей, статей и гайдов, кладешь полезной информации.

Теги:
0
Комментарии0

Российский разработчик сделал инструмент, который определяет местонахождение любого человека в Телеграм

CTV — визуализация местоположения пользователей Telegram

🗄Исследователь создал инструмент Close-Circuit Telegram Vision (CCTV), позволяющий искать пользователей Telegram, у которых включена настройка «Люди рядом». CCTV показывает примерное физическое местоположение пользователей на карте, даже если они находятся совсем не рядом.

🗄Разработчик объяснил, что CCTV использует API Telegram, связанный с функцией Find People Nearby. «В качестве входных данных он принимает кастомные широту и долготу, поэтому можно вводить любые данные (не нужен даже GPS-спуфинг)», — сообщил Глинкин. Также он показал журналистам два других [1] [2] проекта с похожей функциональностью, но отметил, что его проект более точен.

🗄Пресс-служба Telegram дала следующий комментарий:

«Опциональная функция “Люди рядом” была создана специально для людей, которые хотят сообщить о своем местоположении другим. По умолчанию она всегда отключена. Координаты, которые отображает инструмент с GitHub, не являются местоположением пользователя — данные на сервере аппроксимируются до 800 метров и существуют только для пользователей, которые явно предпочли транслировать свое местоположение вовне»

Если интересуетесь этичным хакингом и инструментами OSINT, здесь я публикую и разбираю самые интересные инструменты разведки.

Теги:
+3
Комментарии0

⚡️ PyWinAssistant — AI-инструмент для управления пользовательским интерфейсом

PyWinAssistant — это первый AI-фреймворк для Windows 10/11 с открытым исходным кодом для управления любыми пользовательскими интерфейсами win32api путем использования визуализации мышления (VoT) и пространственных рассуждений в LLM (без OCR / обнаружения объектов / сегментации — такой подход улучшает качество работы PyWinAssistant).

PyWinAssistant имеет встроенные опции чтобы помогать человеку пользоваться компьютером.

Он правильно понимает любые запросы на естественном языке и планирует выполнение правильных действий в ОС с учетом требований безопасности.

🖥 GitHub

🟡 Arxiv (связанное с этим исследование)

Если интересуетесь машинным обучением и ИИ, здесь я публикую разбор свежих LLM и их разбор, статьи и гайды, кладезь полезной информации.

#машинноеобучение #deeplearning



Теги:
+3
Комментарии0

Ближайшие события

One day offer от ВСК
Дата16 – 17 мая
Время09:00 – 18:00
Место
Онлайн
Конференция «Я.Железо»
Дата18 мая
Время14:00 – 23:59
Место
МоскваОнлайн
Антиконференция X5 Future Night
Дата30 мая
Время11:00 – 23:00
Место
Онлайн
Конференция «IT IS CONF 2024»
Дата20 июня
Время09:00 – 19:00
Место
Екатеринбург
Summer Merge
Дата28 – 30 июня
Время11:00
Место
Ульяновская область

Вышла невероятная модель Gemma 2B с длиной контекста 10M, которая анализирует до 7 млн слов.

В нее можно закидывать огромные документы и модель всё проанализирует.

Производительность выше Gemini в 10 раз, а памяти нужно всего 32 ГБ.

Поддерживает Cuda.

Github: https://github.com/mustafaaljadery/gemma-2B-10M

HF: https://huggingface.co/mustafaaljadery/gemma-2B-10M

Technical Overview: https://medium.com/@akshgarg_36829/gemma-10m-technical-overview-900adc4fbeeb

Если интересуетесь машинным обучением и ИИ, здесь я публикую разбор свежих LLM и их разбор, статьи и гайды, кладезь полезной информации.


Теги:
+3
Комментарии0

Новый метод Deblur-GS на основе Гауссовских сплатов для качественного восстановления размытой картинки 

Мощный метод Deblur-GS на основе Гауссовских сплатов для качественного восстановления размытой картинки.

Что же такое Гаусовские Сплаты, простыми словами:

Из видео извлекается облако точек, затем по облаку создается набор маленьких полупрозрачных гауссиан. Потом эти гауссианы оптимизируются доя тогог, чтобы после рендеринга с высокой точностью восстанавливать кадры.

Это не Nerual Radiance Field и здесь все рабоатет намного проще.

За счет простоты эта штука и обучается, и рендерится довольно быстро.

Deblur-GS обеспечивает превосходную производительность и качество рендеринга по сравнению с предыдущими методами, что подтверждается бенчмарками, как на синтетических, так и на реальных наборах данных.

Выглядит бомбезно.

▪Code: https://github.com/Chaphlagical/Deblur-GS

▪Paper: https://chaphlagical.icu/Deblur-GS/static/paper/Deblur_GS_author_version.pdf

▪Project: https://chaphlagical.icu/Deblur-GS/

Если интересуетесь машинным обучением и ИИ, здесь я публикую разбор свежих LLM и их разбор, статьи и гайды, кладезь полезной информации.

#машинноеобучение #deeplearning

Теги:
+2
Комментарии0

🖥 Вышла первая бета-версия языка программирования Python 3.13.0b1

8 мая 2024 года вышла первая бета-версия языка программирования Python 3.13.0b1 (3.13.0 beta 1) для тестирования с экспериментальным JIT-компилятором и улучшенным интерактивным интерпретатором на основе PyPy 🔥

Ещё одним интересным моментом в Python 3.13.0b1 является экспериментальный режим сборки free-threaded build mode, который отключает глобальную блокировку интерпретатора (GIL), циклический сборщик мусора теперь стал более инкрементальным, также там включен модифицированный mimalloc, внесены новые дополнения к типизации и другие изменения, включая исправление ранее обнаруженных ошибок.

Здесь я публикую гайды, уроки и самые интересные библиотеки Python у себя в канале.

Теги:
+5
Комментарии0

PyHTools: крутой инструмент Python для различных задач кибербезопасности:

- изменение mac-адреса

- сканирование диапазона ip-адресов в сети;

- сканирование каталогов - сканирование уязвимостей

- сканирование поддоменов 

и более

Github

Каждый день я выкладываю крутые OSINT инструменты в своем канале, заходите, если интересуетесь темой этичного Хакинга.

Теги:
0
Комментарии0

Это лучшие в настоящее время боты на базе нового GPT для различных задач!

Проверенные временем боты с той самой загадочной модели, которая, возможно, является GPT-5, о ней мы уже писали здесь.

В результате добавления новой модели, боты стали значительно умнее и работают на полную мощность!

Здесь лучшие бота на базе CHATGPT из возможных:

- Creative Ad Maker — выдающийся копирайтер, который придумает для вас и пост в блоге, и рекламную кампанию. Включает в себя обширный набор виральных кейсов.

Chatgpturbobot - лучший бесплатный бот, который поддерживает новые версии GPT. Бот также поддерживает визуальную модель gpt, вы можете отправить скриншот за задачей боту и он пришлет вам решение, крутая вещь.

- Growth Hacking Expert — предложит вам идеи для стартапов с учетом ограниченного бюджета и предоставит технические детали. За кулисами у бота — обширный набор успешных кейсов.

- Creative Answers & Brainstorm GPT — генерирует креативные ответы даже на самые скучные вопросы. Например, вместо «Собирать виноград в Италии» он предложит вам не только виноградник, но и потенциальный город поблизости и так далее.

- Anti AI-Detection — скроет ваш текст от обнаружения ИИ. Случайным образом маскирует ваши генерации под человеческий текст.

- Image Edit | img2img — бот для редактирования и генерации изображений. Стал еще более полезным с появлением редактора изображений в ChatGPT: просто предоставьте ему изображение, и он создаст похожее.

Здесь я сделала обзор еще 52 топовых ИИ-ботов.

Теги:
0
Комментарии1

IC-Light - это новый интересный проект для реалистичного управления освещением.

Внутри два типа моделей: модель изменения освещения с из тектовых промптов и модель изменения подсветки фона изображений. 

Выглядит невероятно правдоподобно. 

Советую вам пролистать и посмотреть крутые на гитхабе.

Модели ставятся локально и как отдельный web-интерфейс.

Github: https://github.com/lllyasviel/IC-Light

Jupyter: https://github.com/camenduru/IC-Light-jupyter

Demo: https://huggingface.co/spaces/lllyasviel/IC-Light

Если интересуетесь машинным обучением и ИИ, здесь я публикую разбор свежих LLM и их разбор, статьи и гайды, кладезь полезной информации.


Теги:
+2
Комментарии0

Microsoft только что представили инструмент You Only Cache Once: Decoder-Decoder : архитектура Decoder-Decoder для больших языковых моделей

YOCO существенно снижает потребление  памяти GPU и состоит из двух компонентов -  cross decoder'а, объединенного с self-decoder'ом. 

Self-decoder кодирует глобальные кэши

значений ключей (KV), которые повторно используются cross decoder'ом с механизмом cross-attention.

Результаты экспериментов показывают, что YOCO достигает более высокой производительности по сравнению с архитектурой Трансформеров при различных настройках масштабирования размера модели и количества обучающих токенов, подробнее тут.

Github: https://github.com/microsoft/unilm/tree/master/YOCO

ABS: https://arxiv.org/abs/2405.05254

Если интересуетесь машинным обучением и ИИ, здесь я публикую разбор свежих LLM и их разбор, статьи и гайды, кладезь полезной информации.


Теги:
0
Комментарии0

Вклад авторов

Работа

Python разработчик
121 вакансия
Data Scientist
62 вакансии