Wywołania OpenGL Compute Shader

Mam pytanie dotyczące nowych shaderów obliczeniowych. Obecnie pracuję nad systemem cząstek. Przechowuję wszystkie moje cząstki w buforze shader-storage, aby uzyskać do nich dostęp w shaderze obliczeniowym. Następnie wysyłam jednowymiarową grupę roboczą.

#define WORK_GROUP_SIZE 128
_shaderManager->useProgram("computeProg");
glDispatchCompute((_numParticles/WORK_GROUP_SIZE), 1, 1);
glMemoryBarrier(GL_SHADER_STORAGE_BARRIER_BIT);

Mój shader obliczeniowy:

#version 430
struct particle{
     vec4 currentPos;
     vec4 oldPos;
};

layout(std430, binding=0) buffer particles{
     struct particle p[];
};

layout (local_size_x = 128, local_size_y = 1, local_size_z = 1) in;
void main(){
     uint gid = gl_GlobalInvocationID.x;

     p[gid].currentPos.x += 100;
}

Ale jakoś nie dotyczy to wszystkich cząstek. Robię to w taki sam sposób, jak w tym przykładzie, ale to nie działa.http://education.siggraph.org/media/conference/S2012_Materials/ComputeShader_6pp.pdf

Edytować:

Po wywołaniu glMemoryBarrier (GL_SHADER_STORAGE_BARRIER_BIT) kontynuuję w ten sposób:

_shaderManager->useProgram("shaderProg"); 
glBindBuffer(GL_ARRAY_BUFFER, shaderStorageBufferID); 
glVertexPointer(4,GL_FLOAT,sizeof(glm::vec4), (void*)0);
glEnableClientState(GL_VERTEX_ARRAY); 
glDrawArrays(GL_POINTS, 0, _numParticles); 
glDisableClientState(GL_VERTEX_ARRAY);

Który bit byłby odpowiedni w tym przypadku?

questionAnswers(2)

yourAnswerToTheQuestion