背着翅膀流浪

我祈祷拥有一颗透明的心灵和会流泪的眼睛

2017-06-28

Deep Q Network设计与实现

之前写了关于DQN（Deep Q Network）的算法分析，今天用Python以及相关的库来设计并实现一个DQN。阅读全文...
2017-06-12

Python数据处理教程

本文主要介绍Python在数据处理中用到的库和方法。阅读全文...
- Python
2017-06-08

基于TensorFlow的循环神经网络设计

循环神经网络(RNN)是区别于卷积神经网络的一种网络结构。适用于自然语言处理，文本分析，机器翻译等领域。阅读全文...
2017-05-27

基于TensorFlow的AutoEncoder网络设计

Autoencoder是一种无监督的学习方法，通过编码过程自动提取数据的高阶特征，并用于分析与识别。阅读全文...
2017-05-26

Policy Gradients

Policy Gradients是强化学(Reinforcement Learning)中的一种算法，Policy Gradients 不需要用贪婪策略来选择行为，而是算法直接给出不同行为的概率并通过这个概率来选择行为。阅读全文...
- RL
2017-05-25

DQN(Deep Q Network)

DQN是Deep Q Network的简称，是一种将强化学习的方法(Q-Learning)和神经网络(Neural Networks)相结合的一种新的算法。阅读全文...
- RL
2017-05-17

勇士VS马刺 G1

一场充满争议的比赛，一场谁都不服气的比赛。当小卡又一次倒在几乎同样的位置的时候，全世界的人们似乎都把目光投向了球场上，每个人都化身篮球专家，指点江山，义愤填膺。阅读全文...
- 随笔
2017-05-12

基于TensorFlow的卷积神经网络设计

今天继续来写一篇关于TensorFlow的，用TensorFlow来设计一个卷积神经网络，并用于手写体识别。阅读全文...
2017-05-07

Q-Learing,Sarsa和Sarsa-lambda

最近看了一些关于强化学习(Reinforcement Learning)的资料，今天来总结一下RL中一些基本的算法。阅读全文...
- RL
2017-05-05

基于TensorFlow的多层神经网络设计

今天利用TensorFlow来实现多层神经网络的设计，并用手写数字数据库对模型进行训练和测试。阅读全文...