読者です 読者をやめる 読者になる 読者になる

AIと言語

本当はこれから考えを深めていかなくてはならないアイデアで、これから改良していこうという段階なのですが、面白そうなので書きます。 まず、できるだけ話をクリアにしたいので定義をします。AIはここではreinforcement learning agentとします。つまりAIと…

OpenAIと今後の強化学習

OpenAIがUniverseという強化学習のプラットフォームをリリースして話題になっているみたいです。 universe.openai.com そもそもOpenAIとは何かというと、イーロンマスク、ピーターティールといった名だたるメンバーが後援しており、さらにMicrosoftとも提携…

Doube-DQN with prioritized experience replay

Deep Q-Network(通称DQN)を試しに使ってみました。 ちょっとだけ説明すると、前回説明した強化学習では状態数が大きい場合、現実的な時間内で実行できないので、近似的な手法が必要になります。 そこでDeep Learningを使ってvalue functionを推定しようとい…