Фичи Hermes Agent для офисного ИИ-сотрудника

Фичи Hermes Agent для офисного ИИ-сотрудника

Связано: iiworker/_index, landing_pages

Источник: hermes-agent.nousresearch.com и документация Hermes Agent.

Цель: понять, что агент умеет из коробки, и отсортировать по применимости в регулярной жизни офисного работника. Позже — на сайт IIWorker.

Вывод

Hermes Agent лучше подавать офисному рынку не как «кодинг-агент», а как цифрового сотрудника в рабочих каналах:

  • живёт в Telegram/Slack/Email/Teams и других каналах;
  • помнит правила компании и прошлые решения;
  • работает по расписанию;
  • ищет, читает, сверяет и оформляет информацию;
  • действует в браузере, файлах и подключённых системах;
  • делегирует большие задачи подагентам;
  • работает с подтверждениями, изоляцией и ограничениями доступа.

Для аудитории 40+: не чат-бот, а исполнитель офисной рутины с памятью, расписанием и доступом к рабочим системам.

Рейтинг фич для офисной рутины

1. Messaging Gateway — агент в рабочих каналах

Умеет: Telegram, Discord, Slack, WhatsApp, Signal, Email, CLI, Microsoft Teams, Matrix, Mattermost, Feishu/Lark, WeCom, LINE, SMS, browser/API и др.

Сценарии: задача в Telegram, отчёт в почту, агент в чате отдела, продолжение диалога в другом канале.

На сайт: «ИИ-сотрудник работает там, где уже работает ваша команда».

2. Scheduled Automations / Cron — регулярные задачи

Умеет: задачи по расписанию естественным языком или cron; доставка в нужный канал; полноценный агент или лёгкий script-only job.

Сценарии: утренняя сводка, пятничный отчёт, мониторинг заявок/оплат/сайтов, напоминания по клиентам, брифинг к планёрке.

На сайт: «Каждое утро сам собирает сводку и присылает в чат».

3. Persistent Memory — помнит компанию

Умеет: хранит предпочтения, факты о проектах, окружении, правилах работы и выученных уроках.

Сценарии: формат отчётов, названия проектов, ответственные, стиль коммуникации, прошлые исправления.

На сайт: «Не нужно объяснять одно и то же заново».

4. Skills System — рабочие инструкции

Умеет: загружает готовые навыки и создаёт новые. В комплекте есть GitHub, research, Google Workspace, Notion, Airtable, Linear, PDF/OCR, PowerPoint, email, YouTube-конспекты и др.

Сценарии: КП, протокол встречи, проверка договора, еженедельный отчёт, подборка новостей.

На сайт: «Один раз научился процедуре — дальше повторяет её сам».

5. Web Search & Extract — поиск и выжимка

Умеет: web search, извлечение текста из страниц, сжатие длинных материалов, deep crawl.

Сценарии: мониторинг конкурентов, справка о клиенте, сравнение поставщиков, новости отрасли, быстрый ресёрч.

На сайт: «Сам найдёт, прочитает и принесёт короткую выжимку».

6. Файлы, терминал, code execution — работа с выгрузками

Умеет: читать, искать и править файлы; запускать команды; выполнять Python-скрипты с инструментами Hermes.

Сценарии: CSV/Excel-выгрузки, расхождения в файлах, списки клиентов, массовые правки документов, проверка отчётов.

На сайт: «Может не только отвечать, но и реально работать с файлами».

7. Browser Automation — действия на сайтах

Умеет: открывать сайты, нажимать кнопки, заполнять формы, читать страницы, анализировать скриншоты и интерфейсы.

Сценарии: статус заказа, форма заявки, выгрузка из кабинета, тест страницы, данные без API.

Важно: критичные действия — только через подтверждения и правила доступа.

8. MCP и интеграции — подключение к системам компании

Умеет: MCP через stdio/HTTP: GitHub, базы данных, файловые системы, внутренние API, внешние сервисы; фильтрация инструментов.

Сценарии: CRM, база знаний, внутренние API, GitHub/Linear/Notion/Airtable, корпоративные инструменты.

На сайт: «Подключается к вашим системам, а не живёт отдельно».

9. Delegation & Parallelization — подагенты

Умеет: изолированные подагенты с отдельным контекстом, терминалом и ограниченными инструментами.

Сценарии: один изучает конкурентов, второй цены, третий отзывы; параллельная проверка документов; исследователь → аналитик → редактор.

На сайт: «Большую задачу раскладывает на нескольких исполнителей».

10. Voice Mode / TTS / STT — голосовые поручения

Умеет: голосовой ввод и ответы в CLI, Telegram/Discord, Discord voice channels; много TTS-провайдеров.

Сценарии: надиктовать поручение в дороге, получить голосовую сводку, переслать голосовое с задачей.

11. Vision & Image Analysis — скриншоты и изображения

Умеет: анализировать изображения, скриншоты, визуальные интерфейсы.

Сценарии: скриншот ошибки, макет сайта, визуальная инструкция, картинка из чата.

12. Security & Sandboxing — доверие и контроль

Умеет: подтверждение опасных команд, allowlists, Docker/Singularity/Modal, фильтрация MCP-секретов, проверка context-файлов на prompt injection, изоляция сессий.

На сайт: «Опасные действия — только с подтверждением. Доступы и окружения изолируются».

13. Context Files — правила проекта

Умеет: подхватывает .hermes.md, AGENTS.md, CLAUDE.md, SOUL.md, .cursorrules и правила подпапок.

Сценарии: регламенты отдела, стиль отчётов, инструкции по клиенту, правила документооборота.

14. Checkpoints / Rollback — откат изменений

Умеет: снимки рабочего каталога перед правками и /rollback.

Сценарии: безопасно менять сайт, документы, код, шаблоны.

15. Persistent Goals — доведение длинных задач

Умеет: /goal задаёт стоящую цель; judge-модель проверяет прогресс, агент продолжает до результата или лимита.

Сценарии: «разбери все документы», «найди ошибки», «проверь клиентов и контакты».

16. Kanban / Multi-agent Board — очередь задач

Умеет: SQLite-доска задач для нескольких профилей агентов: комментарии, блокировки, повторы, human-in-the-loop.

Сценарии: постоянные роли агентов, задачи длиннее одной сессии, аудит поручений.

17. Provider Routing / Multi-model — разные модели под задачи

Умеет: Nous Portal, OpenRouter, Anthropic, OpenAI Codex, Copilot, Gemini, DeepSeek, xAI, Hugging Face, Kimi, MiniMax, Alibaba, Z.AI и другие OpenAI-compatible API.

Сценарии: дешёвая модель для сводок, сильная модель для договоров, резервный провайдер, контроль стоимости.

18. Batch Processing / Research Trajectories

Умеет: массовые прогоны prompt-задач, ShareGPT trajectories, checkpointing, RL/training/evaluation.

Для офиса: не первый экран. Полезно для R&D, не для рядового сотрудника.

Как растащить на сайт IIWorker

Первый экран:

  • ИИ-сотрудник в вашем рабочем чате.
  • Помнит правила компании.
  • Сам делает регулярные отчёты.
  • Работает с сайтами, файлами и документами.

Блок «Что делает каждый день»:

  • утренние сводки;
  • поиск информации по клиентам и конкурентам;
  • письма и follow-up;
  • разбор документов и выгрузок;
  • проверка статусов в веб-кабинетах;
  • напоминания и контроль сроков.

Блок «Почему это не обычный чат-бот»: память, навыки, расписание, инструменты действий, браузер и файлы, безопасность, дневник работы.

Не выносить на первый экран: RL/Atropos/ShareGPT, полный список LLM-провайдеров, Docker/Singularity/Modal в деталях, технические термины MCP/toolsets/context compression.