Обзор возможностей
Hermes Agent включает богатый набор возможностей, который выходит далеко за рамки базового чата. От постоянной памяти и контекста с учетом файлов до автоматизации браузера и голосовых разговоров — эти функции работают вместе, делая Hermes мощным автономным ассистентом.
- Инструменты и наборы инструментов — Инструменты — это функции, расширяющие возможности агента. Они организованы в логические наборы инструментов, которые можно включать или отключать для каждой платформы; они охватывают веб-поиск, выполнение команд в терминале, редактирование файлов, память, делегирование и многое другое.
- Система навыков — Документы со знаниями по запросу, которые агент может загружать при необходимости. Навыки следуют модели поэтапного раскрытия, чтобы минимизировать использование токенов, и совместимы с открытым стандартом agentskills.io.
- Постоянная память — Ограниченная, курируемая память, которая сохраняется между сессиями. Hermes помнит ваши предпочтения, проекты, окружение и то, чему он научился через
MEMORY.mdиUSER.md. - Файлы контекста — Hermes автоматически обнаруживает и загружает файлы контекста проекта (
.hermes.md,AGENTS.md,CLAUDE.md,SOUL.md,.cursorrules), которые определяют его поведение в вашем проекте. - Ссылки на контекст — Введите
@и затем ссылку, чтобы вставить файлы, папки, git diff и URL прямо в ваши сообщения. Hermes разворачивает ссылку inline и автоматически добавляет содержимое. - Контрольные точки — Hermes автоматически создает снимок вашей рабочей директории перед внесением изменений в файлы, обеспечивая вам страховку для отката с помощью
/rollback, если что-то пойдет не так.
Automation
Заголовок раздела «Automation»- Запланированные задачи (Cron) — Планируйте задачи для автоматического выполнения с помощью естественного языка или cron-выражений. Задания могут подключать навыки, доставлять результаты на любую платформу и поддерживают операции pause/resume/edit.
- Делегирование субагентам — Инструмент
delegate_taskзапускает дочерние экземпляры агента с изолированным контекстом, ограниченными наборами инструментов и собственными terminal-сессиями. По умолчанию запускаются 3 параллельных субагента (настраивается) для параллельных рабочих процессов. - Выполнение кода — Инструмент
execute_codeпозволяет агенту писать Python-скрипты, которые программно вызывают инструменты Hermes, сводя многошаговые рабочие процессы к одному ходу LLM за счет изолированного выполнения RPC. - Хуки событий — Запускайте пользовательский код в ключевых точках жизненного цикла. Хуки gateway обрабатывают логирование, оповещения и webhooks; хуки плагинов обрабатывают перехват инструментов, метрики и guardrails.
- Пакетная обработка — Запускайте агент Hermes для сотен или тысяч prompt’ов параллельно, создавая структурированные данные траекторий в формате ShareGPT для генерации обучающих данных или оценки.
Медиа и веб
Заголовок раздела «Медиа и веб»- Voice Mode — Полноценное голосовое взаимодействие в CLI и на платформах обмена сообщениями. Общайтесь с агентом через микрофон, слушайте озвученные ответы и ведите голосовые разговоры в голосовых каналах Discord.
- Browser Automation — Полная автоматизация браузера с несколькими бэкендами: Browserbase cloud, Browser Use cloud, локальный Chrome через CDP, или локальный Chromium. Переходите по сайтам, заполняйте формы и извлекайте информацию.
- Vision & Image Paste — Поддержка мультимодального зрения. Вставляйте изображения из буфера обмена в CLI и просите агента анализировать, описывать их или работать с ними с помощью любой модели с поддержкой vision.
- Image Generation — Генерация изображений из текстовых prompt с использованием FAL.ai. Поддерживаются девять моделей (FLUX 2 Klein/Pro, GPT-Image 1.5/2, Nano Banana Pro, Ideogram V3, Recraft V4 Pro, Qwen, Z-Image Turbo); выберите одну через
hermes tools. - Voice & TTS — Вывод речи через text-to-speech и транскрибация голосовых сообщений на всех платформах обмена сообщениями, с десятью встроенными вариантами провайдеров: Edge TTS (бесплатно), ElevenLabs, OpenAI TTS, MiniMax, Mistral Voxtral, Google Gemini, xAI, NeuTTS, KittenTTS и Piper — плюс провайдеры пользовательских команд для любых локальных TTS CLI.
Интеграции
Заголовок раздела «Интеграции»- MCP Интеграция — Подключайтесь к любому серверу MCP через stdio или транспорт HTTP. Получайте доступ к внешним инструментам из GitHub, баз данных, файловых систем и внутренних API без написания нативных инструментов Hermes. Включает фильтрацию инструментов для каждого сервера и поддержку sampling.
- Маршрутизация провайдеров — Точный контроль над тем, какие AI-провайдеры обрабатывают ваши запросы. Оптимизируйте стоимость, скорость или качество с помощью сортировки, белых списков, чёрных списков и порядка приоритета.
- Резервные провайдеры — Автоматическое переключение на резервные провайдеры LLM при ошибках основной модели, включая независимый fallback для вспомогательных задач, таких как vision и compression.
- Пулы учётных данных — Распределяйте вызовы API между несколькими ключами для одного и того же провайдера. Автоматическая ротация при rate limits или сбоях.
- Провайдеры памяти — Подключайте внешние backends памяти (Honcho, OpenViking, Mem0, Hindsight, Holographic, RetainDB, ByteRover, Supermemory) для межсессионного моделирования пользователей и персонализации сверх встроенной системы памяти.
- API Сервер — Предоставьте Hermes как совместимый с OpenAI endpoint HTTP. Подключайте любой frontend, поддерживающий формат OpenAI — Open WebUI, LobeChat, LibreChat и другие.
- IDE Интеграция (ACP) — Используйте Hermes внутри редакторов, совместимых с ACP, таких как VS Code, Zed и JetBrains. Чат, активность инструментов, diffs файлов и команды терминала отображаются внутри редактора.
- Обучение RL — Генерируйте данные траекторий из сессий агента для обучения с подкреплением и дообучения моделей.
Настройка
Заголовок раздела «Настройка»- Личность и SOUL.md — Полностью настраиваемая личность агента.
SOUL.md— это основной файл идентичности, первое, что попадает в system prompt, и вы можете переключать встроенные или пользовательские пресеты/personalityдля каждой сессии. - Скины и темы — Настройте визуальное оформление CLI: цвета баннера, лица и глаголы спиннера, метки блока ответов, текст брендинга и префикс активности инструментов.
- Плагины — Добавляйте пользовательские инструменты, hooks и интеграции без изменения основного кода. Три типа плагинов: общие плагины (tools/hooks), провайдеры памяти (знания между сессиями) и context engines (альтернативное управление контекстом). Управляются через единый интерактивный UI
hermes plugins.