Как стать автором
Обновить

Комментарии 5

Не добрался до исходного текста ещё, но можно вопрос? GPT-4 содержал коллекции нуклеотидных последовательностей в обучающей выборке?

Очень интересный обзор, спасибо! Я не разбираюсь в биологии, но был опыт использования краудсорсингом для аннотирования данных, и взаимодействия с GPT-4. Сразу пришел в голову такой вопрос: совпадают ли те категории клеток, в которых чаще ошибается GPT, и те, где ошибаются/испытывают затруднения сами биологи? (Вижу в статье упоминание типов клеток, с которыми больше всего расхождений, но это ответ на чуть другой вопрос)

Если не совпадают, то это прям отличный простор для ускорения и масштабирования разметки в такой комбинации, естественно, с осторожностью в выводах и применении и должным контролем качества

Спасибо за Ваш комментарий! Категории клеток, в которых испытывает затруднение GPT, зачастую бывают неприятны и для специалистов)

Спасибо за интересный материал!

Вообще не понял.

1) почему речь именно про single cell? Начать можно было с профилирования тканей (либо событий типа пролиферации, воспаления) по обычному реалтайму;

2) нафиг гпт4? Почему не самописная локальная модель без лишних данных? Сложнее в исполнении, но точнее в перспективе и упаковывается в продукт ( наверняка множество РнД отделов биотеха этим и заняты);

3) обучается на литературных данных или специально подготовленных экспериментальных? Я бы доверял только специально созданным датасетам;

4) (мечтательно): профилировать и я могу, вот бы она праймеры подбирать умела...

Зарегистрируйтесь на Хабре, чтобы оставить комментарий