强化学习(Reinforcement Learning)这一名词来源于行为心理学,表示生物为了趋利避害而更频繁实施对自己有利的策略。例如,在工作中会根据策略决定做出各种动作。如果我的某些决定使我升职加薪,而另外一些决策使我受到了处罚,那么我在以后的工作中会更多采用使我升职加薪的决策。
阅读全文
强化学习(Reinforcement Learning)这一名词来源于行为心理学,表示生物为了趋利避害而更频繁实施对自己有利的策略。例如,在工作中会根据策略决定做出各种动作。如果我的某些决定使我升职加薪,而另外一些决策使我受到了处罚,那么我在以后的工作中会更多采用使我升职加薪的决策。
阅读全文最近在做手写体识别,需要将QT中手写的数字转换成像训练集一样图片。因此需要将QImage转换为numpy array。
阅读全文The handwritten digits recognition may be your first project when you get started with Tensorflow or Pytorch, and the dataset used in this project is the Mnist database of handwritten digit.
阅读全文Python的编码问题可能是很多人都遇到过的问题(没遇到的终将会遇到的),笔者之前也对这个问题很模糊,今天看了《Effective Python》之后总结一下自己的理解。
阅读全文TensorBoard 是 TensorFlow 提供的实用工具,可以图形化的显示计算图。
阅读全文梅须逊雪三分白,雪却输梅一段殇
Master’s Student in Computer Science