强化学习(Reinforcement Learning)这一名词来源于行为心理学,表示生物为了趋利避害而更频繁实施对自己有利的策略。例如,在工作中会根据策略决定做出各种动作。如果我的某些决定使我升职加薪,而另外一些决策使我受到了处罚,那么我在以后的工作中会更多采用使我升职加薪的决策。
阅读全文
强化学习(Reinforcement Learning)这一名词来源于行为心理学,表示生物为了趋利避害而更频繁实施对自己有利的策略。例如,在工作中会根据策略决定做出各种动作。如果我的某些决定使我升职加薪,而另外一些决策使我受到了处罚,那么我在以后的工作中会更多采用使我升职加薪的决策。
阅读全文The handwritten digits recognition may be your first project when you get started with Tensorflow or Pytorch, and the dataset used in this project is the Mnist database of handwritten digit.
阅读全文TensorBoard 是 TensorFlow 提供的实用工具,可以图形化的显示计算图。
阅读全文梅须逊雪三分白,雪却输梅一段殇
Master’s Student in Computer Science