探索 AGI 对齐的迭代、经验方法

对齐研究：我们的方法

迭代和经验是我们用来对齐 AGI 的两种主要方法。我们正在改进我们的人工智能系统，以便能够从人类提供的反馈中学习并帮助人类评估人工智能。我们的目标是创建一个充分对齐的 AI 系统，这将帮助我们解决其他对齐问题。

我们的对齐研究旨在使人工智能 (AGI) 与人类的价值观保持一致并遵循人类的意图。通过使用经验性的迭代方法，我们从对齐高性能 AI 系统的结果中学习。这使我们能够提高使 AI 更安全、更协调的能力。我们使用科学实验研究对齐技术，以了解它们如何扩展以及它们在哪里中断。

我们解决了我们最先进的 AI 系统和我们预计在通往 AGI 的道路上会遇到的对齐问题。我们想将当前的对齐想法推向极限，并了解它们为何奏效或失败。即使没有新的基本对齐想法，我们也相信我们可以构建足够的对齐 AI 来推进对齐研究。

来源和详细信息：
https://openai.com/blog/our-approach-to-alignment-research/

谷歌AI优化指南