
Компания Anthropic опубликовала пересмотренную версию Конституции Claude — 80-страничного документа, определяющего этические рамки работы чат-бота. Презентация состоялась в рамках выступления генерального директора Дарио Амодеи на Всемирном экономическом форуме в Давосе. Система Constitutional AI позволяет модели обучаться на основе набора принципов, а не только на обратной связи от людей.
Обновленный документ детализирует вопросы безопасности, этики и инклюзивности для предотвращения дискриминационных ответов. Алгоритм использует инструкции на естественном языке для самоконтроля и соблюдения нормативного поведения в различных контекстах. В разделе безопасности указано, что Claude должен перенаправлять пользователей в экстренные службы при выявлении рисков для жизни.
В финальной части документа авторы поднимают вопрос о моральном статусе ИИ, называя его глубоко неопределенным. Anthropic подчеркивает серьезность дискуссии о возможном наличии сознания у моделей, ссылаясь на мнения ведущих философов. Компания позиционирует себя как сдержанную и демократичную альтернативу более агрессивным конкурентам в лице OpenAI и xAI.