Перейти к содержимому

Обзор возможностей

Hermes Agent включает богатый набор возможностей, который выходит далеко за рамки базового чата. От постоянной памяти и контекста с учетом файлов до автоматизации браузера и голосовых разговоров — эти функции работают вместе, делая Hermes мощным автономным ассистентом.

  • Инструменты и наборы инструментов — Инструменты — это функции, расширяющие возможности агента. Они организованы в логические наборы инструментов, которые можно включать или отключать для каждой платформы; они охватывают веб-поиск, выполнение команд в терминале, редактирование файлов, память, делегирование и многое другое.
  • Система навыков — Документы со знаниями по запросу, которые агент может загружать при необходимости. Навыки следуют модели поэтапного раскрытия, чтобы минимизировать использование токенов, и совместимы с открытым стандартом agentskills.io.
  • Постоянная память — Ограниченная, курируемая память, которая сохраняется между сессиями. Hermes помнит ваши предпочтения, проекты, окружение и то, чему он научился через MEMORY.md и USER.md.
  • Файлы контекста — Hermes автоматически обнаруживает и загружает файлы контекста проекта (.hermes.md, AGENTS.md, CLAUDE.md, SOUL.md, .cursorrules), которые определяют его поведение в вашем проекте.
  • Ссылки на контекст — Введите @ и затем ссылку, чтобы вставить файлы, папки, git diff и URL прямо в ваши сообщения. Hermes разворачивает ссылку inline и автоматически добавляет содержимое.
  • Контрольные точки — Hermes автоматически создает снимок вашей рабочей директории перед внесением изменений в файлы, обеспечивая вам страховку для отката с помощью /rollback, если что-то пойдет не так.
  • Запланированные задачи (Cron) — Планируйте задачи для автоматического выполнения с помощью естественного языка или cron-выражений. Задания могут подключать навыки, доставлять результаты на любую платформу и поддерживают операции pause/resume/edit.
  • Делегирование субагентам — Инструмент delegate_task запускает дочерние экземпляры агента с изолированным контекстом, ограниченными наборами инструментов и собственными terminal-сессиями. По умолчанию запускаются 3 параллельных субагента (настраивается) для параллельных рабочих процессов.
  • Выполнение кода — Инструмент execute_code позволяет агенту писать Python-скрипты, которые программно вызывают инструменты Hermes, сводя многошаговые рабочие процессы к одному ходу LLM за счет изолированного выполнения RPC.
  • Хуки событий — Запускайте пользовательский код в ключевых точках жизненного цикла. Хуки gateway обрабатывают логирование, оповещения и webhooks; хуки плагинов обрабатывают перехват инструментов, метрики и guardrails.
  • Пакетная обработка — Запускайте агент Hermes для сотен или тысяч prompt’ов параллельно, создавая структурированные данные траекторий в формате ShareGPT для генерации обучающих данных или оценки.
  • Voice Mode — Полноценное голосовое взаимодействие в CLI и на платформах обмена сообщениями. Общайтесь с агентом через микрофон, слушайте озвученные ответы и ведите голосовые разговоры в голосовых каналах Discord.
  • Browser Automation — Полная автоматизация браузера с несколькими бэкендами: Browserbase cloud, Browser Use cloud, локальный Chrome через CDP, или локальный Chromium. Переходите по сайтам, заполняйте формы и извлекайте информацию.
  • Vision & Image Paste — Поддержка мультимодального зрения. Вставляйте изображения из буфера обмена в CLI и просите агента анализировать, описывать их или работать с ними с помощью любой модели с поддержкой vision.
  • Image Generation — Генерация изображений из текстовых prompt с использованием FAL.ai. Поддерживаются девять моделей (FLUX 2 Klein/Pro, GPT-Image 1.5/2, Nano Banana Pro, Ideogram V3, Recraft V4 Pro, Qwen, Z-Image Turbo); выберите одну через hermes tools.
  • Voice & TTS — Вывод речи через text-to-speech и транскрибация голосовых сообщений на всех платформах обмена сообщениями, с десятью встроенными вариантами провайдеров: Edge TTS (бесплатно), ElevenLabs, OpenAI TTS, MiniMax, Mistral Voxtral, Google Gemini, xAI, NeuTTS, KittenTTS и Piper — плюс провайдеры пользовательских команд для любых локальных TTS CLI.
  • MCP Интеграция — Подключайтесь к любому серверу MCP через stdio или транспорт HTTP. Получайте доступ к внешним инструментам из GitHub, баз данных, файловых систем и внутренних API без написания нативных инструментов Hermes. Включает фильтрацию инструментов для каждого сервера и поддержку sampling.
  • Маршрутизация провайдеров — Точный контроль над тем, какие AI-провайдеры обрабатывают ваши запросы. Оптимизируйте стоимость, скорость или качество с помощью сортировки, белых списков, чёрных списков и порядка приоритета.
  • Резервные провайдеры — Автоматическое переключение на резервные провайдеры LLM при ошибках основной модели, включая независимый fallback для вспомогательных задач, таких как vision и compression.
  • Пулы учётных данных — Распределяйте вызовы API между несколькими ключами для одного и того же провайдера. Автоматическая ротация при rate limits или сбоях.
  • Провайдеры памяти — Подключайте внешние backends памяти (Honcho, OpenViking, Mem0, Hindsight, Holographic, RetainDB, ByteRover, Supermemory) для межсессионного моделирования пользователей и персонализации сверх встроенной системы памяти.
  • API Сервер — Предоставьте Hermes как совместимый с OpenAI endpoint HTTP. Подключайте любой frontend, поддерживающий формат OpenAI — Open WebUI, LobeChat, LibreChat и другие.
  • IDE Интеграция (ACP) — Используйте Hermes внутри редакторов, совместимых с ACP, таких как VS Code, Zed и JetBrains. Чат, активность инструментов, diffs файлов и команды терминала отображаются внутри редактора.
  • Обучение RL — Генерируйте данные траекторий из сессий агента для обучения с подкреплением и дообучения моделей.
  • Личность и SOUL.md — Полностью настраиваемая личность агента. SOUL.md — это основной файл идентичности, первое, что попадает в system prompt, и вы можете переключать встроенные или пользовательские пресеты /personality для каждой сессии.
  • Скины и темы — Настройте визуальное оформление CLI: цвета баннера, лица и глаголы спиннера, метки блока ответов, текст брендинга и префикс активности инструментов.
  • Плагины — Добавляйте пользовательские инструменты, hooks и интеграции без изменения основного кода. Три типа плагинов: общие плагины (tools/hooks), провайдеры памяти (знания между сессиями) и context engines (альтернативное управление контекстом). Управляются через единый интерактивный UI hermes plugins.