kivantium活動日記

プログラムを使っていろいろやります

2015-09-29から1日間の記事一覧

強化学習で考えるギャンブラーの最適行動

強化学習と呼ばれる機械学習の一分野があります。機械学習というと、入力に対して正解の出力を当てる教師あり学習が話題になることが多いですが、強化学習では明示的に正解が与えられません。ある行動を試してみて、それに対して得られる「報酬」から自分で…

特定商取引法に定められた事項は請求により遅滞なく提供する