Summarize — CLI и расширение Chrome для быстрых саммари из любых источников

Что это

Summarize — открытый инструмент от Питера Штайнбергера (Peter Steinberger), который превращает любой URL, YouTube-видео, подкаст, PDF или локальный файл в структурированное саммари. Работает в двух режимах: CLI для автоматизации и скриптов, и Chrome Side Panel (+ Firefox Sidebar) для быстрого саммари прямо в браузере.

Проект распространяется под лицензией MIT и активно развивается — на GitHub больше 1 500 звёзд.


Зачем нужен

Когда вы ежедневно обрабатываете десятки ссылок, статей и видео, ручное чтение каждого источника съедает часы. Summarize решает эту задачу: вы указываете на источник — получаете суть. Без копипаста, без переключения между вкладками и ChatGPT.

Особенно полезен тем, кто:

  • Строит контент-пайплайны и хочет автоматически извлекать ключевые тезисы
  • Работает с видео и подкастами, но не хочет тратить час на просмотр
  • Использует AI-агентов и нуждается в чистом тексте из веб-страниц

Как работает

Pipeline состоит из трёх шагов:

  1. Fetch + Extract — загрузка источника, очистка HTML, нормализация или конвертация в Markdown. Для «упрямых» сайтов подключается Firecrawl как fallback
  2. Transcript (при необходимости) — для YouTube и подкастов сначала ищутся опубликованные транскрипты, затем Whisper как запасной вариант
  3. Summarize + Format — LLM генерирует саммари с потоковым выводом в терминал или боковую панель браузера

CLI: ключевые возможности

Установка через npm:

npm i -g @steipete/summarize

Базовое использование:

# Саммари веб-страницы
summarize "https://example.com/article"

# YouTube-видео с автоопределением транскрипта
summarize "https://youtu.be/..." --youtube auto

# PDF с выбором модели
summarize "/path/report.pdf" --model google/gemini-3-flash-preview

# Длинное саммари
summarize "https://example.com" --length long

Что умеет CLI:

  • Обрабатывать URL, PDF, изображения, аудио/видео, YouTube и подкасты
  • Извлекать чистый текст без суммаризации (--extract)
  • Выводить результат в JSON (--json) или показывать метрики (--metrics)
  • Автоматически выбирать модель через --model auto — инструмент сам решает, какую модель использовать в зависимости от размера входных данных
  • Кэшировать транскрипты для повторных запросов

Chrome Side Panel и Firefox Sidebar

Расширение для браузера добавляет боковую панель, которая в один клик генерирует саммари текущей вкладки. Можно включить автосуммари при переключении между вкладками — и панель будет обновляться сама.

Расширение также поддерживает чат с потоковым выводом и историей прямо в сайдбаре.

Как это устроено: расширение работает через локальный демон на localhost, защищённый токеном. Никакие данные не уходят на сторонние серверы (кроме вызовов к LLM, если вы используете облачную модель).

Установить можно из Chrome Web Store или собрать из исходников.


Поддержка моделей

Summarize — provider-agnostic (не привязан к конкретному провайдеру). Поддерживаются:

  • Локальные модели через OpenAI-совместимые шлюзы (Ollama, LM Studio и т.д.)
  • Платные провайдеры — OpenAI, Google Gemini, Anthropic Claude
  • Бесплатные модели через OpenRouter

Режим --model auto (по умолчанию) сам выбирает модель из доступных, учитывая тип контента и объём токенов. Если одна модель не сработала — автоматически пробует следующую из списка.


YouTube и подкасты

Для медиа-контента Summarize использует умный подход:

  • Сначала ищет опубликованные транскрипты (субтитры YouTube, RSS-фиды подкастов)
  • Если транскрипт недоступен — запускает Whisper для локальной транскрибации
  • Поддерживает таймкоды: в саммари можно кликнуть на [mm:ss] и перейти к нужному моменту
  • Для YouTube доступен режим слайдов — скриншоты + OCR + транскрипт с привязкой ко времени

Когда использовать

  • Ресёрч и мониторинг — быстро оценить, стоит ли статья детального чтения
  • Контент-пайплайны — автоматический сбор тезисов из источников через CLI + скрипты
  • Работа с видеоконтентом — получить суть часового подкаста за 30 секунд
  • Интеграция с AI-агентами — использовать --json или --extract для передачи чистых данных в другие инструменты

Ссылки


По теме

Если вы строите пайплайн обработки контента или хотите разобраться, как подключить CLI-инструменты к вашим AI-агентам — давайте обсудим.

Связь со мной: t.me/pimenov Мой телеграм канал t.me/pimenov_ru

© 2026 ИП Пименов Сергей Викторович
ИНН 616271176890
ОГРН 316619600255641