Modelo de memoria PyTorch: "torch.from_numpy ()" vs "torch.Tensor ()"

Question

Jan 28, 2018, 04:07 AM

python numpy multidimensional-array deep-learning pytorch

Modelo de memoria PyTorch: "torch.from_numpy ()" vs "torch.Tensor ()"

Estoy tratando de tener una comprensión profunda de cómo funciona el modelo de memoria de Tensor de PyTorch.

# input numpy array
In [91]: arr = np.arange(10, dtype=float32).reshape(5, 2)

# input tensors in two different ways
In [92]: t1, t2 = torch.Tensor(arr), torch.from_numpy(arr)

# their types
In [93]: type(arr), type(t1), type(t2)
Out[93]: (numpy.ndarray, torch.FloatTensor, torch.FloatTensor)

# ndarray 
In [94]: arr
Out[94]: 
array([[ 0.,  1.],
       [ 2.,  3.],
       [ 4.,  5.],
       [ 6.,  7.],
       [ 8.,  9.]], dtype=float32)

Sé que los tensores PyTorchcompartir el búfer de memoria de NumPy ndarrays. Por lo tanto, cambiar uno se reflejará en el otro. Entonces, aquí estoy cortando y actualizando algunos valores en el Tensort2

In [98]: t2[:, 1] = 23.0

Y como se esperaba, se actualiza ent2 yarr ya que comparten el mismo búfer de memoria.

In [99]: t2
Out[99]: 

  0  23
  2  23
  4  23
  6  23
  8  23
[torch.FloatTensor of size 5x2]


In [101]: arr
Out[101]: 
array([[  0.,  23.],
       [  2.,  23.],
       [  4.,  23.],
       [  6.,  23.],
       [  8.,  23.]], dtype=float32)

Pero,t1 también se actualiza. Recuerda esot1 fue construido usandotorch.Tensor() mientrast2 fue construido usandotorch.from_numpy()

In [100]: t1
Out[100]: 

  0  23
  2  23
  4  23
  6  23
  8  23
[torch.FloatTensor of size 5x2]

Entonces, no importa si usamostorch.from_numpy() otorch.Tensor() para construir un tensor a partir de un ndarray,todas tales tensores y ndarrays comparten el mismo búfer de memoria.

En base a esta comprensión, mi pregunta es por qué una función dedicadatorch.from_numpy() existe cuando simplementetorch.Tensor() puede hacer el trabajo?

Miré la documentación de PyTorch pero no menciona nada sobre esto. ¿Alguna idea / sugerencia?