Как стать автором
Обновить
302.9

Open source *

Открытое программное обеспечение

Сначала показывать
Порог рейтинга

DocsGPT — open-source AI-помощник для работы с документами и не только.

DocsGPT — это функциональное решение на базе LLM и GPT с открытым исходным кодом, которое упрощает процесс поиска информации в документации.

Благодаря интеграции мощных LLM можно задавать вопросы по документации и различным текстам и получать точные ответы.

Модели на Hugging Face:

🟡 Docsgpt-7b-mistral — требует 1×A10G GPU

🟡 Docsgpt-14b — требует 2×A10 GPU

🟡 Docsgpt-40b-falcon — требует 8×A10G GPU

🖥 GitHub

#llm #gpt

Если интересуетесь темой ИИ и нейросетей, здесь я публикую разбор свежих моделей, статей и гайдов, кладешь полезной информации.
#gpt  #машинноеобучение  #chatgpt

Теги:
0
Комментарии0

📌 Сохраняем себе самые интересные нейросети за неделю, которые вы могли пропустить

Clipdrop: генератор изображений, способный создавать дипфейки и дополнять объекты;

- Chatgpturbobot - лучший бесплатный бот, который поддерживает новые версии GPT. Бот также поддерживает визуальную модель gpt, вы можете отправить скриншот за задачей боту и он пришлет вам решение, крутая вещь;

UDIO: обновленная нейронная сеть для создания музыкальных треков. Нейронка теперь умеет создавать треки продолжительностью до 15 минут и может «держать в уме» контекст 2 минут трека (ранее только 30 сек);

StoryDiffusion: генератор комиксов и видео, Модель позволяет создавать комиксы в различных стилях, с акцентом на последовательное повествование и поддержание единого стиля окружения, персонажей и их одежды;

ChatRTX: умный чат-бот от Nvidia, Работает ChatRTX на компьютере локально, но для запуска нужна видеокарта RTX 30-й или 40-й серии.

PuLID: стилизует изображения по текстовому запросу или фотореференсу;

- Webcam Motion Capture: приложение для превращения в персонажа аниме;

Meshy: обновленный генератор 3D-моделей на основе текста или изображений;

MS Paint Portraits: рисование в стиле Paint;- ClearSpace: приложение, требующее отжиманий для разблокировки смартфона

ClearSpace — интересное ИИ-приложение, которое заставит вас отжиматься, чтобы разблокировать свой смартфон. Обмануть приложение не получится, т.к. ИИ пристально следит через камеру за вашими движениями и распознает, сколько раз вы отжались

Теги:
0
Комментарии0

📊 TimesFM - это новая модель прогнозирования временных рядов от Google, предварительно обученная на большом массиве данных состоящем из 100 миллиардов реальных временных точек. 

Модель демонстрирует впечатляющую  производительность при zero-shot обучении на множестве бенчмарков.

Github: https://github.com/google-research/timesfm

Paper: https://arxiv.org/abs/2310.10688

Blog: https://research.google/blog/a-decoder-only-foundation-model-for-time-series-forecasting/

HF: https://huggingface.co/google/timesfm-1.0-200m

Если интересуетесь темой ИИ и нейросетей, здесь я публикую разбор свежих моделей, статей и гайдов, кладешь полезной информации.

#TimesFM #TimeSeries #Forecasting #FoundationModels


Теги:
+2
Комментарии0

⚡️ LLaVA-NeXT: новая мощнейшая модель для расшифровки и понимания видео.

LLaVA-NeXT - одна из самых мощных на сегодняшний день моделей для понимания видео, превосходящая все существующие VLM, с открытым исходным кодом.

LaVA-NeXT - одна из самых мощных на сегодняшний день моделей для понимания видео, превосходящая все существующие VLM, с открытым исходным кодом.

Новая SoTA! 

LLaVA-Next демонстрирует высокую скорость передачи данных и демонстрирует отличные результаты при zero-shot обучении.

Github: https://github.com/LLaVA-VL/LLaVA-NeXT

Blog: https://llava-vl.github.io/blog/2024-04-30-llava-next-video/

HF: https://huggingface.co/shi-labs/CuMo-mistral-7b

Dataset: https://huggingface.co/datasets/shi-labs/CuMo_dataset

Если интересуетесь темой машинного обучения и LLM, здесь я публикую разбор свежих LLM моделей, статей и гайдов, кладешь полезной информации.

Теги:
+1
Комментарии0

Российский разработчик сделал инструмент, который определяет местонахождение любого человека в Телеграм

CTV — визуализация местоположения пользователей Telegram

🗄Исследователь создал инструмент Close-Circuit Telegram Vision (CCTV), позволяющий искать пользователей Telegram, у которых включена настройка «Люди рядом». CCTV показывает примерное физическое местоположение пользователей на карте, даже если они находятся совсем не рядом.

🗄Разработчик объяснил, что CCTV использует API Telegram, связанный с функцией Find People Nearby. «В качестве входных данных он принимает кастомные широту и долготу, поэтому можно вводить любые данные (не нужен даже GPS-спуфинг)», — сообщил Глинкин. Также он показал журналистам два других [1] [2] проекта с похожей функциональностью, но отметил, что его проект более точен.

🗄Пресс-служба Telegram дала следующий комментарий:

«Опциональная функция “Люди рядом” была создана специально для людей, которые хотят сообщить о своем местоположении другим. По умолчанию она всегда отключена. Координаты, которые отображает инструмент с GitHub, не являются местоположением пользователя — данные на сервере аппроксимируются до 800 метров и существуют только для пользователей, которые явно предпочли транслировать свое местоположение вовне»

Если интересуетесь этичным хакингом и инструментами OSINT, здесь я публикую и разбираю самые интересные инструменты разведки.

Теги:
+4
Комментарии0

⚡️ PyWinAssistant — AI-инструмент для управления пользовательским интерфейсом

PyWinAssistant — это первый AI-фреймворк для Windows 10/11 с открытым исходным кодом для управления любыми пользовательскими интерфейсами win32api путем использования визуализации мышления (VoT) и пространственных рассуждений в LLM (без OCR / обнаружения объектов / сегментации — такой подход улучшает качество работы PyWinAssistant).

PyWinAssistant имеет встроенные опции чтобы помогать человеку пользоваться компьютером.

Он правильно понимает любые запросы на естественном языке и планирует выполнение правильных действий в ОС с учетом требований безопасности.

🖥 GitHub

🟡 Arxiv (связанное с этим исследование)

Если интересуетесь машинным обучением и ИИ, здесь я публикую разбор свежих LLM и их разбор, статьи и гайды, кладезь полезной информации.

#машинноеобучение #deeplearning



Теги:
+3
Комментарии0

🍏 Крутая новость: Apple заключила соглашение о внедрении ChatGPT в каждый iPhone

Apple и OpenAI смогли договориться и почти завершили сделку. Анонс может пройти на конференции WWDC в июне.

По слухам, нейронная сеть значительно улучшит функциональность Siri,сделав её по-настоящему полезным помощником.

Ожидаем вместе с выпуском iOS 18.

Если интересуетесь машинным обучением и ИИ, здесь я публикую разбор свежих LLM и их разбор, статьи и гайды, кладезь полезной информации.

#chatgpt

#машинноеобчение

Теги:
+3
Комментарии1

Функции MS Excel, которых пока нет в LibreOffice Calc

До выхода MS Office 2021 по набору функций Calc и Excel были на 95% совместимы. Причем ситуация была такая, что десятка функций из Calc нет (само собой) в Excel и ровно наоборот - десятка неких других функций из Excel нет в Calc.

В MS Excel 2021 прилетело достаточно много новых функций, которые на сегодня можно разделить на две группы:

  1. Уже добавлены в LibreOffice Calc - XLOOKUP, XMATCH, FILTER, SORT, SORTBY, UNIQUE, SEQUENCE, RANDARRAY (спасибо Balazs Varga!)

  2. Ещё не добавлены - IMAGE, LET, LAMBDA, TEXTBEFORE, TEXTAFTER, TEXTSPLIT, VSTACK, HSTACK, TOROW, TOCOL, WRAPROWS, WRAPCOLS, TAKE, DROP, CHOOSEROWS, CHOOSECOLS, EXPAND

Будем надеяться, что найдется ещё кто-то, кто продолжит добавлять новые функции в LibreOffice Calc.

Кстати, чтобы не было недопонимания, Balazs Varga никакой не волонтер-мимокрокодил, а программист на зарплате в немецкой компании allotropia. Соответсвенно, им кто-то заплатил денег за реализацию отсутствующих функций в Calc.

Теги:
+3
Комментарии0

Вышла невероятная модель Gemma 2B с длиной контекста 10M, которая анализирует до 7 млн слов.

В нее можно закидывать огромные документы и модель всё проанализирует.

Производительность выше Gemini в 10 раз, а памяти нужно всего 32 ГБ.

Поддерживает Cuda.

Github: https://github.com/mustafaaljadery/gemma-2B-10M

HF: https://huggingface.co/mustafaaljadery/gemma-2B-10M

Technical Overview: https://medium.com/@akshgarg_36829/gemma-10m-technical-overview-900adc4fbeeb

Если интересуетесь машинным обучением и ИИ, здесь я публикую разбор свежих LLM и их разбор, статьи и гайды, кладезь полезной информации.


Теги:
+3
Комментарии0

OpenAI готовят грандиозный анонс.

Хитрец Сэм Альтман, отец chatgpt начал греть аудиторию перед большим анонсом на стриме компании в понедельник.

По его словам, это не GPT-5 и не убийца Google. 

«Мы много работали над кое-чем реально новым и думаем, что всем это понравится. Я прям чувствую магию!»

Понедельник. 20:00 по мск. Ожидаем)

В своем канале я сделаю разбор трансляций, а еще там много  крутых LLM , статей и гайдов по машинному обучению, ИИ, dl, заходите в гости,


Теги:
+5
Комментарии3

Новый метод Deblur-GS на основе Гауссовских сплатов для качественного восстановления размытой картинки 

Мощный метод Deblur-GS на основе Гауссовских сплатов для качественного восстановления размытой картинки.

Что же такое Гаусовские Сплаты, простыми словами:

Из видео извлекается облако точек, затем по облаку создается набор маленьких полупрозрачных гауссиан. Потом эти гауссианы оптимизируются доя тогог, чтобы после рендеринга с высокой точностью восстанавливать кадры.

Это не Nerual Radiance Field и здесь все рабоатет намного проще.

За счет простоты эта штука и обучается, и рендерится довольно быстро.

Deblur-GS обеспечивает превосходную производительность и качество рендеринга по сравнению с предыдущими методами, что подтверждается бенчмарками, как на синтетических, так и на реальных наборах данных.

Выглядит бомбезно.

▪Code: https://github.com/Chaphlagical/Deblur-GS

▪Paper: https://chaphlagical.icu/Deblur-GS/static/paper/Deblur_GS_author_version.pdf

▪Project: https://chaphlagical.icu/Deblur-GS/

Если интересуетесь машинным обучением и ИИ, здесь я публикую разбор свежих LLM и их разбор, статьи и гайды, кладезь полезной информации.

#машинноеобучение #deeplearning

Теги:
+4
Комментарии0

Профессиональный плагин формы обратной связи Radical Form совместим с Joomla 5

Профессиональный плагин-обработчик форм обратной связи Radical Form получил совместимость с Joomla 5 с релизом 3.1.5. Особенность плагина в том, что он позволяет отправлять абсолютно любые формы: стандартные callback формы, квизы, опросы и т.д., но не предоставляет готового фронтенда.

Такой подход предоставляет разработчикам практически неограниченную гибкость в разработке, но при этом требует от них определенного уровня знаний и умений. Radical Form даёт возможность сторонним разработчикам обрабатывать данные форм в момент отправки с помощью плагинов, что позволяет очень удобно и быстро интегрировать его со сторонними сервисами. Для плагина существуют сторонние плагины для интеграции Radical Form с Битрикс 24 и AmoCRM.

Разработчик Radical Form - @progreccor

Страница расширения GitHub расширения

Также добро пожаловать в Telegram-чат русскоязычного Joomla-сообщества

Теги:
0
Комментарии0

🖥 Вышла первая бета-версия языка программирования Python 3.13.0b1

8 мая 2024 года вышла первая бета-версия языка программирования Python 3.13.0b1 (3.13.0 beta 1) для тестирования с экспериментальным JIT-компилятором и улучшенным интерактивным интерпретатором на основе PyPy 🔥

Ещё одним интересным моментом в Python 3.13.0b1 является экспериментальный режим сборки free-threaded build mode, который отключает глобальную блокировку интерпретатора (GIL), циклический сборщик мусора теперь стал более инкрементальным, также там включен модифицированный mimalloc, внесены новые дополнения к типизации и другие изменения, включая исправление ранее обнаруженных ошибок.

Здесь я публикую гайды, уроки и самые интересные библиотеки Python у себя в канале.

Теги:
+5
Комментарии0

Ближайшие события

One day offer от ВСК
Дата16 – 17 мая
Время09:00 – 18:00
Место
Онлайн
Конференция «Я.Железо»
Дата18 мая
Время14:00 – 23:59
Место
МоскваОнлайн
Антиконференция X5 Future Night
Дата30 мая
Время11:00 – 23:00
Место
Онлайн
Конференция «IT IS CONF 2024»
Дата20 июня
Время09:00 – 19:00
Место
Екатеринбург
Summer Merge
Дата28 – 30 июня
Время11:00
Место
Ульяновская область

Вышел дистрибутива Daphile 24.05 на базе Gentoo Linux и предназначенный для создания системы хранения и воспроизведения музыкальной коллекции, замещаемой на компьютере без экрана. Управление воспроизведением и коллекцией производится через специальный веб-интерфейс. Опубликована сборка проекта с обычным ядром Linux (329 МБ) и версия с компонентами для работы в режиме реального времени (319 МБ).

Дистрибутив может работать в режиме звукового сервера, сетевого хранилища и точки беспроводного доступа. Поддерживается воспроизведение с внутренних накопителей, c сетевых потоковых сервисов и c внешних USB-накопителей. Для обеспечения максимального качества звука и создания мультизональных аудиосистем поддерживается подключения компьютера с Daphile к аналоговым усилителям через ЦАП с интерфейсом USB.

В новой версии:

  • обновлены LMS (Lyrion Music Server) 8.5.2, Perl 5.38, ядро Linux 6.6. Для сборки задействован GCC 13.2;

  • обновлены плагины для интеграции с сервисами Spotty 4.10.1, TIDAL 1.4.6, Qobuz 3.5.0, Deezer 2.81.4 и YouTube 0.212;

  • удалена поддержка Mysqueezebox.com;

  • добавлен модуль Crypt::Blowfish, позволивший повысить производительность плагинов;

  • добавлена возможность сохранения содержимого звуковых CD в формате WAV;

  • библиотека с информацией об исполнителях и музыкальных композициях CDDB заменена на Gnudb;

  • добавлена поддержка обращения к внешним сетевым накопителям через протоколы SMB3 и WebDAV.

Источник: OpenNET.

Теги:
+1
Комментарии0

Это лучшие в настоящее время боты на базе нового GPT для различных задач!

Проверенные временем боты с той самой загадочной модели, которая, возможно, является GPT-5, о ней мы уже писали здесь.

В результате добавления новой модели, боты стали значительно умнее и работают на полную мощность!

Здесь лучшие бота на базе CHATGPT из возможных:

- Creative Ad Maker — выдающийся копирайтер, который придумает для вас и пост в блоге, и рекламную кампанию. Включает в себя обширный набор виральных кейсов.

Chatgpturbobot - лучший бесплатный бот, который поддерживает новые версии GPT. Бот также поддерживает визуальную модель gpt, вы можете отправить скриншот за задачей боту и он пришлет вам решение, крутая вещь.

- Growth Hacking Expert — предложит вам идеи для стартапов с учетом ограниченного бюджета и предоставит технические детали. За кулисами у бота — обширный набор успешных кейсов.

- Creative Answers & Brainstorm GPT — генерирует креативные ответы даже на самые скучные вопросы. Например, вместо «Собирать виноград в Италии» он предложит вам не только виноградник, но и потенциальный город поблизости и так далее.

- Anti AI-Detection — скроет ваш текст от обнаружения ИИ. Случайным образом маскирует ваши генерации под человеческий текст.

- Image Edit | img2img — бот для редактирования и генерации изображений. Стал еще более полезным с появлением редактора изображений в ChatGPT: просто предоставьте ему изображение, и он создаст похожее.

Здесь я сделала обзор еще 52 топовых ИИ-ботов.

Теги:
+1
Комментарии1

IC-Light - это новый интересный проект для реалистичного управления освещением.

Внутри два типа моделей: модель изменения освещения с из тектовых промптов и модель изменения подсветки фона изображений. 

Выглядит невероятно правдоподобно. 

Советую вам пролистать и посмотреть крутые на гитхабе.

Модели ставятся локально и как отдельный web-интерфейс.

Github: https://github.com/lllyasviel/IC-Light

Jupyter: https://github.com/camenduru/IC-Light-jupyter

Demo: https://huggingface.co/spaces/lllyasviel/IC-Light

Если интересуетесь машинным обучением и ИИ, здесь я публикую разбор свежих LLM и их разбор, статьи и гайды, кладезь полезной информации.


Теги:
+3
Комментарии0

Microsoft только что представили инструмент You Only Cache Once: Decoder-Decoder : архитектура Decoder-Decoder для больших языковых моделей

YOCO существенно снижает потребление  памяти GPU и состоит из двух компонентов -  cross decoder'а, объединенного с self-decoder'ом. 

Self-decoder кодирует глобальные кэши

значений ключей (KV), которые повторно используются cross decoder'ом с механизмом cross-attention.

Результаты экспериментов показывают, что YOCO достигает более высокой производительности по сравнению с архитектурой Трансформеров при различных настройках масштабирования размера модели и количества обучающих токенов, подробнее тут.

Github: https://github.com/microsoft/unilm/tree/master/YOCO

ABS: https://arxiv.org/abs/2405.05254

Если интересуетесь машинным обучением и ИИ, здесь я публикую разбор свежих LLM и их разбор, статьи и гайды, кладезь полезной информации.


Теги:
+1
Комментарии0

Функции динамических массивов в LibreOffice Calc. RANDARRAY

Вот и предпоследняя функция динамических массивов RANDARRAY приземлилась в исходный код LibreOffice Calc. Balazs Varga продолжает нас радовать своими патчами. Осталась функция UNIQUE, кое чего допилить, исправить баги и можно будет радоваться =)

Вообще все желающие приглашаются к тестированию новых функций.

Теги:
0
Комментарии0

Google DeepMind представили Alpha Fold3, новую модель искусственного интеллекта, которая предсказывает структуру и взаимодействия молекул.

Благодаря точному прогнозированию структуры белков, ДНК, РНК и многого другого, а также того, как они взаимодействуют, наше понимание биологического мира может выйти на новый уровень, а в практическом применение  поможет разработке новых лекарств.

Alpha Fold3
Alpha Fold3

Эта революционная модель, может предсказывать структуру и взаимодействия всех молекул жизни с беспрецедентной точностью. 

На основе входного списка молекул Alpha Fold3 генерирует их общую трехмерную структуру, показывая, как они сочетаются друг с другом. Программа моделирует крупные биомолекулы, такие как белки, ДНК и РНК, а также небольшие молекулы, также известные как лиганды. 

Кроме того, Alpha Fold3 может моделировать химические модификации этих молекул, которые контролируют здоровое функционирование клеток, нарушение которых может привести к различным заболеваниям.

Теперь для учёные со всего мира могут работать с  AlphaFold 3 совершенно бесплатно.

https://blog.google/technology/ai/google-deepmind-isomorphic-alphafold-3-ai-model/

Если интересуетесь машинным обучением и ИИ, здесь я публикую разбор свежих LLM и их разбор, статьи и гайды, кладезь полезной информации.

Теги:
+3
Комментарии1

Audio Seal - это лучшая модель для распознавания речи, сгенерированной искусственным интеллектом 🔉

 Audio Seal - это SOTA для добавления метаданных на аудио и распознавания их, предназначенная для локального распознавания речи, сгенерированной искусственным интеллектом. 

Инструмент прост в настройке и работает молниеносно.

Audioseal обеспечивает самые современные характеристики распознавания как естественной, так и синтетической речи, обеспечивает незначительное изменение качества сигнала и устойчив ко многим типам редактирования аудио. 

Audioseal  значительно превосходит существующие модели по скорости обнаружения.

pip install audioseal

Github: https://github.com/facebookresearch/audioseal

Paper: https://arxiv.org/abs/2401.17264

Colab: https://colab.research.google.com/github/facebookresearch/audioseal/blob/master/examples/colab.ipynb

HF: https://huggingface.co/facebook/audioseal

#audio

Если интересуетесь машинным обучением и ИИ, здесь я публикую разбор свежих LLM и их разбор, статьи и гайды, кладезь полезной информации.


Теги:
+2
Комментарии1
1
23 ...

Вклад авторов