• Takes on "Alignment Faking in Large Language Models"

  • 2024/12/18
  • 再生時間: 1 時間 28 分
  • ポッドキャスト

Takes on "Alignment Faking in Large Language Models"

  • サマリー

  • What can we learn from recent empirical demonstrations of scheming in frontier models? Text version here: https://joecarlsmith.com/2024/12/18/takes-on-alignment-faking-in-large-language-models/

    続きを読む 一部表示

あらすじ・解説

What can we learn from recent empirical demonstrations of scheming in frontier models? Text version here: https://joecarlsmith.com/2024/12/18/takes-on-alignment-faking-in-large-language-models/

activate_buybox_copy_target_t1

Takes on "Alignment Faking in Large Language Models"に寄せられたリスナーの声

カスタマーレビュー:以下のタブを選択することで、他のサイトのレビューをご覧になれます。