OpenAIが人間を使わずAIの安全性を高める手法「Rule-Based Rewards(RBR)」を開発

2024/07/25

ChatGPTやGPT-4などを開発するOpenAIが、言語モデルの安全性と有効性を高めるための新たなアプローチである「Rule-Based Rewards(RBR)」を開発しました。RBRは、AI自体を使用することで人間によるデータ収集を必要とせずに、AIを安全に動作させることができるとされています。続きを読む……

このサイトの記事を見る

通知を有効にしますか？ OK! No...

タイトルとURLをコピーしました