Amanda Askell
哲學家暨 AI 對齊研究員
關於
Amanda Askell 是 Anthropic 的哲學家與研究員,主導 Claude 的性格與價值觀塑造工作。她擁有紐約大學哲學博士學位,研究橫跨道德哲學與 AI 對齊——致力於打造有益、無害且誠實的 AI 系統。她在發展 Claude 的人格特質與倫理準則上居功厥偉,將嚴謹的哲學思維帶入塑造 AI 行為的實踐挑戰之中。
主要貢獻
- 主導 Claude 的性格與人格發展
- 研究 AI 對齊與價值學習
- 橋接學術哲學與 AI 安全實踐
- 擁有紐約大學哲學博士學位
- Anthropic 憲法 AI 方法的重要貢獻者
影片與訪談
Amanda Askell Answers Questions About Claude's Character
Anthropic philosopher answers community questions about her work shaping Claude
Watch on YouTube
Amanda Askell Segment: Claude's Character Training
Segment from Lex Fridman Podcast #452 discussing the ethical and epistemic virtues Claude should enact
Watch on YouTube