Python *

Высокоуровневый язык программирования

⚡️ DINO 1.5: самая мощная серия моделей IDEA Research для обнаружения объектов.

Это наиболее эффективный опенсорс инструмент для запуска на edge девайсах, с хорошей оптимизацией и высокой скоростью работы.

Исходный код выпущен в версии Apache 2.0. 💙

▪Github

▪Paper

▪Demo

Если интересуетесь темой ИИ и нейросетей, здесь я публикую разбор свежих моделей, статей и гайдов, кладешь полезной информации.

Теги:

linuxacademy

10 часов назад4.3K

Open source*Python*Программирование*Машинное обучение*

🌟 LibreChat — улучшенный свободный клон ChatGPT

LibreChat — open-source клон ChatGPT:

— предоставляет удобный API

— работает с Groq, GPT-4 Vision, Mistral, Bing, Anthropic, OpenRouter, Vertex AI, Gemini и другими моделями — можно запустить полностью локально

Запуск локально:

git clone https://github.com/danny-avila/LibreChat.git

cd LibreChat

cp .env.example .env

docker compose up -d

🖥 GitHub

🟡 Подробнее о локальном запуске

🟡 Использовать онлайн

Теги:

linuxacademy

21 час назад6.9K

Open source*Python*Программирование*Машинное обучение*Искусственный интеллект

⚡ Zeus Новый инструмент экосистемы Pytorch для экономии ресурсов

Глубокое обучение потребляет довольно много энергии.

Например, обучение одного 200B LLM на инстансах AWS p4d потребляет около 11,9 ГВт-ч (источник: CIDR 2024 keynote), это же количество энергии позволяет в одиночку обеспечивать энергией более тысячи домохозяйств в среднем по США в течение года.

Теги:

-1

linuxacademy

15 мая в 18:264.8K

Open source*Python*Программирование*Машинное обучение*Искусственный интеллект

Еще один ништячок от Google они выпустили- "PaliGemma"! 🚀

Семейство из 116 новых моделей, которые могут подписывать изображения, отвечать на вопросы, распознавать объекты, сегментировать изображения и многое другое!

PaliGemma (Github) - это семейство моделей визуализации с архитектурой, состоящей из SIGLIP-So 400m в качестве кодера изображений и Gemma-2B в качестве декодера текста.

SigLIP - это современная модель, которая может распознавать как изображения, так и текст. Как и CLIP, он состоит из кодера изображений и текста. Как и в случае с PALI-3, комбинированная модель Paligemma работает на основе графических и текстовых данных, а затем может быть легко адаптирована для последующих задач, таких как создание субтитров.

Gemma - это модель для генерации текста, предназначенная только для декодера. Сочетание графического кодера Siglip и линейного адаптера Gemma позволяет использовать Paligemma в качестве мощной модели визуализации.

▪Блог: https://hf.co/blog/paligemma

▪Модели: https://hf.co/collections/google/paligemma-release-6643a9ffbf57de2ae0448dda

▪Demo: https://hf.co/spaces/google/paligemma

У себя в канале я опубликую ее обзор моделей и первые впечатления, а как появится api, добавлю в бота, чтобы любой мог поиграться с ним, заходите в гости)

Теги:

Machinelearning_Ai

14 мая в 14:346.3K

Open source*Python*Машинное обучение*Искусственный интеллект

🌟 LocalAI — открытая и бесплатная альтернатива предложений от OpenAI

LocalAI — это open-source альтернатива решений от OpenAI. LocalAI выступает в качестве замены REST API, совместимого со спецификациями OpenAI API для локальных выводов.

Позволяет локально запускать LLM, генерировать изображения, аудио (и не только), клонировать голос; при этом не требует GPU.

Теги:

-1

linuxacademy

13 мая в 13:216.6K

Open source*Python*Математика*Машинное обучение*Искусственный интеллект

🔥 Мощная шпаргалка от Стенфорда, посвящённая важнейшим понятиям ML

Здесь содержится все ключевые формулы и понятия базовых алгоритмов Machine Learning

Вся информация отлично структурирована и имеется оглавление.

Хороший вариант для тех, кто хочет погрузится в мл.

📎 Шпаргалка

Если интересуетесь темой МЛ и нейросетей, здесь я публикую разбор свежих моделей, статей и гайдов, кладешь полезной информации.

Теги:

linuxacademy

13 мая в 09:595.2K

Open source*Python*Программирование*Машинное обучение*Искусственный интеллект

⚡️ Lory — полностью дифференцируемая Mixture-of-Experts (MoE) для предварительного обучения авторегрессионной языковой модели

На днях исследователи из Принстона представили Lory — первое в своём роде решение, которое позволяет масштабировать MoE-архитектуры для предварительного обучения авторегрессионных языковых моделей.

В Lory реализованы 2 ключевые технологии:

(1) — стратегия маршрутизации причинных сегментов, которая обеспечивает высокую эффективность операций объединения экспертов при сохранении авторегрессивной природы языковых моделей

(2) — метод группировки данных на основе сходства, который стимулирует специализацию "экспертов" путем группировки похожих документов в обучающих выборках

Результаты экспериментов с Lory показывают значительный прирост производительности по сравнению с обычными MoE-моделями.

📎 Arxiv

#машинноеобучение #llm

Теги:

linuxacademy

12 мая в 19:387.7K

Open source*Python*Машинное обучение*Искусственный интеллект

DocsGPT — open-source AI-помощник для работы с документами и не только.

DocsGPT — это функциональное решение на базе LLM и GPT с открытым исходным кодом, которое упрощает процесс поиска информации в документации.

Благодаря интеграции мощных LLM можно задавать вопросы по документации и различным текстам и получать точные ответы.

Модели на Hugging Face:

🟡 Docsgpt-7b-mistral — требует 1×A10G GPU

🟡 Docsgpt-14b — требует 2×A10 GPU

🟡 Docsgpt-40b-falcon — требует 8×A10G GPU

🖥 GitHub

#llm #gpt

Если интересуетесь темой ИИ и нейросетей, здесь я публикую разбор свежих моделей, статей и гайдов, кладешь полезной информации.
#gpt #машинноеобучение #chatgpt

Теги:

linuxacademy

12 мая в 14:049K

Python*Программирование*Открытые данные*Машинное обучение*Искусственный интеллект

Разбираем задачи на стажировку аналитика в яндекс. Подключаем GPT-4 Turbo и самые мощные ИИ!

Я подробно разобрал 3 задания на стажировку в летнюю школу Яндекс,

Затем я решил 2 из них с помощью GPT-4 в боте https://t.me/Chatgpturbobot GPT-4 решил первые 2 задания с первого раза, с одного промпта, а 3 задание никак не мог решить. Еще я рассказал про крутую арену с LLM - сайт chat.lmsys.org, на нем я попробовал решить 3 задание с помощью 6 разных LLM, но ни одна не справилась

Здесь я подробно разобрал 3 задания на стажировку в летнюю школу Яндекс, машинное обучение и data science.

#машинноеобучние

Теги:

Golangcoder

12 мая в 10:316.1K

Open source*Python*Программирование*Машинное обучение*Искусственный интеллект

📊 TimesFM - это новая модель прогнозирования временных рядов от Google, предварительно обученная на большом массиве данных состоящем из 100 миллиардов реальных временных точек.

Модель демонстрирует впечатляющую производительность при zero-shot обучении на множестве бенчмарков.

▪Github: https://github.com/google-research/timesfm

▪Paper: https://arxiv.org/abs/2310.10688

▪Blog: https://research.google/blog/a-decoder-only-foundation-model-for-time-series-forecasting/

▪HF: https://huggingface.co/google/timesfm-1.0-200m

#TimesFM #TimeSeries #Forecasting #FoundationModels

Теги:

Golangcoder

11 мая в 20:058.1K

Open source*Python*Машинное обучение*Искусственный интеллект

⚡️ LLaVA-NeXT: новая мощнейшая модель для расшифровки и понимания видео.

LLaVA-NeXT - одна из самых мощных на сегодняшний день моделей для понимания видео, превосходящая все существующие VLM, с открытым исходным кодом.

LaVA-NeXT - одна из самых мощных на сегодняшний день моделей для понимания видео, превосходящая все существующие VLM, с открытым исходным кодом.

Новая SoTA!

LLaVA-Next демонстрирует высокую скорость передачи данных и демонстрирует отличные результаты при zero-shot обучении.

▪Github: https://github.com/LLaVA-VL/LLaVA-NeXT

▪Blog: https://llava-vl.github.io/blog/2024-04-30-llava-next-video/

▪HF: https://huggingface.co/shi-labs/CuMo-mistral-7b

▪Dataset: https://huggingface.co/datasets/shi-labs/CuMo_dataset

Если интересуетесь темой машинного обучения и LLM, здесь я публикую разбор свежих LLM моделей, статей и гайдов, кладешь полезной информации.

Теги:

Golangcoder

11 мая в 12:5711K

Настройка Linux*Мессенджеры*Open source*Python*

Российский разработчик сделал инструмент, который определяет местонахождение любого человека в Телеграм

CTV — визуализация местоположения пользователей Telegram

🗄Исследователь создал инструмент Close-Circuit Telegram Vision (CCTV), позволяющий искать пользователей Telegram, у которых включена настройка «Люди рядом». CCTV показывает примерное физическое местоположение пользователей на карте, даже если они находятся совсем не рядом.

🗄Разработчик объяснил, что CCTV использует API Telegram, связанный с функцией Find People Nearby. «В качестве входных данных он принимает кастомные широту и долготу, поэтому можно вводить любые данные (не нужен даже GPS-спуфинг)», — сообщил Глинкин. Также он показал журналистам два других [1] [2] проекта с похожей функциональностью, но отметил, что его проект более точен.

🗄Пресс-служба Telegram дала следующий комментарий:

«Опциональная функция “Люди рядом” была создана специально для людей, которые хотят сообщить о своем местоположении другим. По умолчанию она всегда отключена. Координаты, которые отображает инструмент с GitHub, не являются местоположением пользователя — данные на сервере аппроксимируются до 800 метров и существуют только для пользователей, которые явно предпочли транслировать свое местоположение вовне»

Если интересуетесь этичным хакингом и инструментами OSINT, здесь я публикую и разбираю самые интересные инструменты разведки.

Теги:

linuxacademy

11 мая в 12:318.5K

Open source*Python*Машинное обучение*Искусственный интеллектData Engineering*

⚡️ PyWinAssistant — AI-инструмент для управления пользовательским интерфейсом

PyWinAssistant — это первый AI-фреймворк для Windows 10/11 с открытым исходным кодом для управления любыми пользовательскими интерфейсами win32api путем использования визуализации мышления (VoT) и пространственных рассуждений в LLM (без OCR / обнаружения объектов / сегментации — такой подход улучшает качество работы PyWinAssistant).

PyWinAssistant имеет встроенные опции чтобы помогать человеку пользоваться компьютером.

Он правильно понимает любые запросы на естественном языке и планирует выполнение правильных действий в ОС с учетом требований безопасности.

🖥 GitHub

🟡 Arxiv (связанное с этим исследование)

Если интересуетесь машинным обучением и ИИ, здесь я публикую разбор свежих LLM и их разбор, статьи и гайды, кладезь полезной информации.

#машинноеобучение #deeplearning

Теги:

linuxacademy

11 мая в 11:066.9K

Open source*Python*Машинное обучение*Искусственный интеллектData Engineering*

Вышла невероятная модель Gemma 2B с длиной контекста 10M, которая анализирует до 7 млн слов.

В нее можно закидывать огромные документы и модель всё проанализирует.

Производительность выше Gemini в 10 раз, а памяти нужно всего 32 ГБ.

Поддерживает Cuda.

▪Github: https://github.com/mustafaaljadery/gemma-2B-10M

▪HF: https://huggingface.co/mustafaaljadery/gemma-2B-10M

▪Technical Overview: https://medium.com/@akshgarg_36829/gemma-10m-technical-overview-900adc4fbeeb

Теги:

Golangcoder

10 мая в 19:437.5K

Open source*Python*Машинное обучение*Искусственный интеллектData Engineering*

Новый метод Deblur-GS на основе Гауссовских сплатов для качественного восстановления размытой картинки

Мощный метод Deblur-GS на основе Гауссовских сплатов для качественного восстановления размытой картинки.

Что же такое Гаусовские Сплаты, простыми словами:

Из видео извлекается облако точек, затем по облаку создается набор маленьких полупрозрачных гауссиан. Потом эти гауссианы оптимизируются доя тогог, чтобы после рендеринга с высокой точностью восстанавливать кадры.

Это не Nerual Radiance Field и здесь все рабоатет намного проще.

За счет простоты эта штука и обучается, и рендерится довольно быстро.

Deblur-GS обеспечивает превосходную производительность и качество рендеринга по сравнению с предыдущими методами, что подтверждается бенчмарками, как на синтетических, так и на реальных наборах данных.

Выглядит бомбезно.

▪Code: https://github.com/Chaphlagical/Deblur-GS

▪Paper: https://chaphlagical.icu/Deblur-GS/static/paper/Deblur_GS_author_version.pdf

▪Project: https://chaphlagical.icu/Deblur-GS/

#машинноеобучение #deeplearning

Теги:

linuxacademy

10 мая в 11:366.2K

Open source*Python*Программирование*

🖥 Вышла первая бета-версия языка программирования Python 3.13.0b1

8 мая 2024 года вышла первая бета-версия языка программирования Python 3.13.0b1 (3.13.0 beta 1) для тестирования с экспериментальным JIT-компилятором и улучшенным интерактивным интерпретатором на основе PyPy 🔥

Ещё одним интересным моментом в Python 3.13.0b1 является экспериментальный режим сборки free-threaded build mode, который отключает глобальную блокировку интерпретатора (GIL), циклический сборщик мусора теперь стал более инкрементальным, также там включен модифицированный mimalloc, внесены новые дополнения к типизации и другие изменения, включая исправление ранее обнаруженных ошибок.

Здесь я публикую гайды, уроки и самые интересные библиотеки Python у себя в канале.

Теги:

Golangcoder

10 мая в 11:216.1K

Информационная безопасность*Python*Разработка под Linux*

PyHTools: крутой инструмент Python для различных задач кибербезопасности:

- изменение mac-адреса

- сканирование диапазона ip-адресов в сети;

- сканирование каталогов - сканирование уязвимостей

- сканирование поддоменов

и более

▪ Github

Каждый день я выкладываю крутые OSINT инструменты в своем канале, заходите, если интересуетесь темой этичного Хакинга.

Теги:

Golangcoder

9 мая в 22:317.8K

Open source*Python*Программирование*Машинное обучение*Искусственный интеллект

Это лучшие в настоящее время боты на базе нового GPT для различных задач!

Проверенные временем боты с той самой загадочной модели, которая, возможно, является GPT-5, о ней мы уже писали здесь.

В результате добавления новой модели, боты стали значительно умнее и работают на полную мощность!

Здесь лучшие бота на базе CHATGPT из возможных:

- Creative Ad Maker — выдающийся копирайтер, который придумает для вас и пост в блоге, и рекламную кампанию. Включает в себя обширный набор виральных кейсов.

Chatgpturbobot - лучший бесплатный бот, который поддерживает новые версии GPT. Бот также поддерживает визуальную модель gpt, вы можете отправить скриншот за задачей боту и он пришлет вам решение, крутая вещь.

- Growth Hacking Expert — предложит вам идеи для стартапов с учетом ограниченного бюджета и предоставит технические детали. За кулисами у бота — обширный набор успешных кейсов.

- Creative Answers & Brainstorm GPT — генерирует креативные ответы даже на самые скучные вопросы. Например, вместо «Собирать виноград в Италии» он предложит вам не только виноградник, но и потенциальный город поблизости и так далее.

- Anti AI-Detection — скроет ваш текст от обнаружения ИИ. Случайным образом маскирует ваши генерации под человеческий текст.

- Image Edit | img2img — бот для редактирования и генерации изображений. Стал еще более полезным с появлением редактора изображений в ChatGPT: просто предоставьте ему изображение, и он создаст похожее.

Здесь я сделала обзор еще 52 топовых ИИ-ботов.

Теги:

Golangcoder

9 мая в 19:247.3K

Open source*Python*Машинное обучение*Искусственный интеллект

IC-Light - это новый интересный проект для реалистичного управления освещением.

Внутри два типа моделей: модель изменения освещения с из тектовых промптов и модель изменения подсветки фона изображений.

Выглядит невероятно правдоподобно.

Советую вам пролистать и посмотреть крутые на гитхабе.

Модели ставятся локально и как отдельный web-интерфейс.

▪Github: https://github.com/lllyasviel/IC-Light

▪Jupyter: https://github.com/camenduru/IC-Light-jupyter

▪Demo: https://huggingface.co/spaces/lllyasviel/IC-Light

Теги:

Golangcoder

9 мая в 11:195.1K

Open source*Python*Программирование*Машинное обучение*Искусственный интеллект

Microsoft только что представили инструмент You Only Cache Once: Decoder-Decoder : архитектура Decoder-Decoder для больших языковых моделей

YOCO существенно снижает потребление памяти GPU и состоит из двух компонентов - cross decoder'а, объединенного с self-decoder'ом.

Self-decoder кодирует глобальные кэши

значений ключей (KV), которые повторно используются cross decoder'ом с механизмом cross-attention.

Результаты экспериментов показывают, что YOCO достигает более высокой производительности по сравнению с архитектурой Трансформеров при различных настройках масштабирования размера модели и количества обучающих токенов, подробнее тут.

▪Github: https://github.com/microsoft/unilm/tree/master/YOCO

▪ABS: https://arxiv.org/abs/2405.05254

Теги:

2 3 4 5

Python *

Ближайшие события

Вклад авторов

Работа