Фичи Hermes Agent для офисного ИИ-сотрудника
Фичи Hermes Agent для офисного ИИ-сотрудника
Связано: iiworker/_index, landing_pages
Источник: hermes-agent.nousresearch.com и документация Hermes Agent.
Цель: понять, что агент умеет из коробки, и отсортировать по применимости в регулярной жизни офисного работника. Позже — на сайт IIWorker.
Вывод
Hermes Agent лучше подавать офисному рынку не как «кодинг-агент», а как цифрового сотрудника в рабочих каналах:
- живёт в Telegram/Slack/Email/Teams и других каналах;
- помнит правила компании и прошлые решения;
- работает по расписанию;
- ищет, читает, сверяет и оформляет информацию;
- действует в браузере, файлах и подключённых системах;
- делегирует большие задачи подагентам;
- работает с подтверждениями, изоляцией и ограничениями доступа.
Для аудитории 40+: не чат-бот, а исполнитель офисной рутины с памятью, расписанием и доступом к рабочим системам.
Рейтинг фич для офисной рутины
1. Messaging Gateway — агент в рабочих каналах
Умеет: Telegram, Discord, Slack, WhatsApp, Signal, Email, CLI, Microsoft Teams, Matrix, Mattermost, Feishu/Lark, WeCom, LINE, SMS, browser/API и др.
Сценарии: задача в Telegram, отчёт в почту, агент в чате отдела, продолжение диалога в другом канале.
На сайт: «ИИ-сотрудник работает там, где уже работает ваша команда».
2. Scheduled Automations / Cron — регулярные задачи
Умеет: задачи по расписанию естественным языком или cron; доставка в нужный канал; полноценный агент или лёгкий script-only job.
Сценарии: утренняя сводка, пятничный отчёт, мониторинг заявок/оплат/сайтов, напоминания по клиентам, брифинг к планёрке.
На сайт: «Каждое утро сам собирает сводку и присылает в чат».
3. Persistent Memory — помнит компанию
Умеет: хранит предпочтения, факты о проектах, окружении, правилах работы и выученных уроках.
Сценарии: формат отчётов, названия проектов, ответственные, стиль коммуникации, прошлые исправления.
На сайт: «Не нужно объяснять одно и то же заново».
4. Skills System — рабочие инструкции
Умеет: загружает готовые навыки и создаёт новые. В комплекте есть GitHub, research, Google Workspace, Notion, Airtable, Linear, PDF/OCR, PowerPoint, email, YouTube-конспекты и др.
Сценарии: КП, протокол встречи, проверка договора, еженедельный отчёт, подборка новостей.
На сайт: «Один раз научился процедуре — дальше повторяет её сам».
5. Web Search & Extract — поиск и выжимка
Умеет: web search, извлечение текста из страниц, сжатие длинных материалов, deep crawl.
Сценарии: мониторинг конкурентов, справка о клиенте, сравнение поставщиков, новости отрасли, быстрый ресёрч.
На сайт: «Сам найдёт, прочитает и принесёт короткую выжимку».
6. Файлы, терминал, code execution — работа с выгрузками
Умеет: читать, искать и править файлы; запускать команды; выполнять Python-скрипты с инструментами Hermes.
Сценарии: CSV/Excel-выгрузки, расхождения в файлах, списки клиентов, массовые правки документов, проверка отчётов.
На сайт: «Может не только отвечать, но и реально работать с файлами».
7. Browser Automation — действия на сайтах
Умеет: открывать сайты, нажимать кнопки, заполнять формы, читать страницы, анализировать скриншоты и интерфейсы.
Сценарии: статус заказа, форма заявки, выгрузка из кабинета, тест страницы, данные без API.
Важно: критичные действия — только через подтверждения и правила доступа.
8. MCP и интеграции — подключение к системам компании
Умеет: MCP через stdio/HTTP: GitHub, базы данных, файловые системы, внутренние API, внешние сервисы; фильтрация инструментов.
Сценарии: CRM, база знаний, внутренние API, GitHub/Linear/Notion/Airtable, корпоративные инструменты.
На сайт: «Подключается к вашим системам, а не живёт отдельно».
9. Delegation & Parallelization — подагенты
Умеет: изолированные подагенты с отдельным контекстом, терминалом и ограниченными инструментами.
Сценарии: один изучает конкурентов, второй цены, третий отзывы; параллельная проверка документов; исследователь → аналитик → редактор.
На сайт: «Большую задачу раскладывает на нескольких исполнителей».
10. Voice Mode / TTS / STT — голосовые поручения
Умеет: голосовой ввод и ответы в CLI, Telegram/Discord, Discord voice channels; много TTS-провайдеров.
Сценарии: надиктовать поручение в дороге, получить голосовую сводку, переслать голосовое с задачей.
11. Vision & Image Analysis — скриншоты и изображения
Умеет: анализировать изображения, скриншоты, визуальные интерфейсы.
Сценарии: скриншот ошибки, макет сайта, визуальная инструкция, картинка из чата.
12. Security & Sandboxing — доверие и контроль
Умеет: подтверждение опасных команд, allowlists, Docker/Singularity/Modal, фильтрация MCP-секретов, проверка context-файлов на prompt injection, изоляция сессий.
На сайт: «Опасные действия — только с подтверждением. Доступы и окружения изолируются».
13. Context Files — правила проекта
Умеет: подхватывает .hermes.md, AGENTS.md, CLAUDE.md, SOUL.md, .cursorrules и правила подпапок.
Сценарии: регламенты отдела, стиль отчётов, инструкции по клиенту, правила документооборота.
14. Checkpoints / Rollback — откат изменений
Умеет: снимки рабочего каталога перед правками и /rollback.
Сценарии: безопасно менять сайт, документы, код, шаблоны.
15. Persistent Goals — доведение длинных задач
Умеет: /goal задаёт стоящую цель; judge-модель проверяет прогресс, агент продолжает до результата или лимита.
Сценарии: «разбери все документы», «найди ошибки», «проверь клиентов и контакты».
16. Kanban / Multi-agent Board — очередь задач
Умеет: SQLite-доска задач для нескольких профилей агентов: комментарии, блокировки, повторы, human-in-the-loop.
Сценарии: постоянные роли агентов, задачи длиннее одной сессии, аудит поручений.
17. Provider Routing / Multi-model — разные модели под задачи
Умеет: Nous Portal, OpenRouter, Anthropic, OpenAI Codex, Copilot, Gemini, DeepSeek, xAI, Hugging Face, Kimi, MiniMax, Alibaba, Z.AI и другие OpenAI-compatible API.
Сценарии: дешёвая модель для сводок, сильная модель для договоров, резервный провайдер, контроль стоимости.
18. Batch Processing / Research Trajectories
Умеет: массовые прогоны prompt-задач, ShareGPT trajectories, checkpointing, RL/training/evaluation.
Для офиса: не первый экран. Полезно для R&D, не для рядового сотрудника.
Как растащить на сайт IIWorker
Первый экран:
- ИИ-сотрудник в вашем рабочем чате.
- Помнит правила компании.
- Сам делает регулярные отчёты.
- Работает с сайтами, файлами и документами.
Блок «Что делает каждый день»:
- утренние сводки;
- поиск информации по клиентам и конкурентам;
- письма и follow-up;
- разбор документов и выгрузок;
- проверка статусов в веб-кабинетах;
- напоминания и контроль сроков.
Блок «Почему это не обычный чат-бот»: память, навыки, расписание, инструменты действий, браузер и файлы, безопасность, дневник работы.
Не выносить на первый экран: RL/Atropos/ShareGPT, полный список LLM-провайдеров, Docker/Singularity/Modal в деталях, технические термины MCP/toolsets/context compression.