2022-05-29-PyTorch强化学习实战1强化学习环境配置与PyTorch基础
PyTorch强化学习实战(1)——强化学习环境配置与PyTorch基础
PyTorch强化学习实战(1)——强化学习环境配置与PyTorch基础
0. 前言
工欲善其事,必先利其器。为了更专注于学习强化学习的思想,而不必关注其底层的计算细节,我们首先搭建相关深度学习环境,主要包括
Python
以及
PyTorch
。
Python
,更具体说使用
Python3.7+
作为我们实现强化学习算法进行实战的编程语言。
PyTorch
是我们将要使用的主要深度学习框架,
PyTorch
由
Facebook AI Research
基于
Torch
开发,是主流的机器学习库之一。在
PyTorch
中,使用张量 (
Tensors
) 代替了
NumPy
中的
ndarray
数据类型,从而提供了更强大的灵活性和与
GPU
的兼容性。由于其强大的计算图特性和简单的上手难度,使得
PyTorch
受到了广泛的欢迎,并且它已被越来越多的科技巨头所采用。