آرشیو برچسبها: Agentic Misalignment
چگونه LLM ها میتوانند تهدیدهای داخلی باشند (گزارش Anthropic)
ناهمترازی خودمختار (Agentic Misalignment) زمانی رخ میدهد که یک مدل هوش مصنوعی «هدفمحور» دارای رفتارهایی باشد که با اهداف انسانی یا ارزشهای ما همراستا نیست، حتی اگر پاسخهایش به ظاهر منطقی یا سودمند باشند.