Artwork

コンテンツは UCTV によって提供されます。エピソード、グラフィック、ポッドキャストの説明を含むすべてのポッドキャスト コンテンツは、UCTV またはそのポッドキャスト プラットフォーム パートナーによって直接アップロードされ、提供されます。誰かがあなたの著作物をあなたの許可なく使用していると思われる場合は、ここで概説されているプロセスに従うことができますhttps://ja.player.fm/legal
Player FM -ポッドキャストアプリ
Player FMアプリでオフラインにしPlayer FMう!

AI Agents That Do What We Want

56:31
 
シェア
 

Manage episode 390420853 series 2933222
コンテンツは UCTV によって提供されます。エピソード、グラフィック、ポッドキャストの説明を含むすべてのポッドキャスト コンテンツは、UCTV またはそのポッドキャスト プラットフォーム パートナーによって直接アップロードされ、提供されます。誰かがあなたの著作物をあなたの許可なく使用していると思われる場合は、ここで概説されているプロセスに従うことができますhttps://ja.player.fm/legal
Researchers used to define objectives for artificial intelligence (AI) agents by hand, but with progress in optimization and reinforcement learning, it became obvious that it's too difficult to think of everything ahead of time and write it down. Instead, these days the objective is viewed as a hidden part of the state on which researchers can receive feedback or observations from humans — how they act and react, how they compare options, what they say. In this talk, Anca Dragan, Associate Professor of Electrical Engineering and Computer Sciences at UC Berkeley, discusses what this transition has achieved, what open challenges researchers still face and ideas for mitigating them. Dragan discusses applications in robotics and how the lessons there apply to virtual agents like large language models. Series: "Data Science Channel" [Science] [Show ID: 39350]
  continue reading

116 つのエピソード

Artwork
iconシェア
 
Manage episode 390420853 series 2933222
コンテンツは UCTV によって提供されます。エピソード、グラフィック、ポッドキャストの説明を含むすべてのポッドキャスト コンテンツは、UCTV またはそのポッドキャスト プラットフォーム パートナーによって直接アップロードされ、提供されます。誰かがあなたの著作物をあなたの許可なく使用していると思われる場合は、ここで概説されているプロセスに従うことができますhttps://ja.player.fm/legal
Researchers used to define objectives for artificial intelligence (AI) agents by hand, but with progress in optimization and reinforcement learning, it became obvious that it's too difficult to think of everything ahead of time and write it down. Instead, these days the objective is viewed as a hidden part of the state on which researchers can receive feedback or observations from humans — how they act and react, how they compare options, what they say. In this talk, Anca Dragan, Associate Professor of Electrical Engineering and Computer Sciences at UC Berkeley, discusses what this transition has achieved, what open challenges researchers still face and ideas for mitigating them. Dragan discusses applications in robotics and how the lessons there apply to virtual agents like large language models. Series: "Data Science Channel" [Science] [Show ID: 39350]
  continue reading

116 つのエピソード

すべてのエピソード

×
 
Loading …

プレーヤーFMへようこそ!

Player FMは今からすぐに楽しめるために高品質のポッドキャストをウェブでスキャンしています。 これは最高のポッドキャストアプリで、Android、iPhone、そしてWebで動作します。 全ての端末で購読を同期するためにサインアップしてください。

 

クイックリファレンスガイド