Cuda версия не работает во время серийной работы

мой следующий минималистский код Cuda возвращает неверный результат (все полигоны имеют 0 вершин в конце), в то время как один и тот же код, работающий последовательно в C ++, работает хорошо. Проблема смущающе параллельна: нет связи, нет синхротоков и т. Д., И распределение памяти Cuda является успешным. Даже моя фиктивная переменная, которая хранит содержимое входного массива для целей отладки, равна 0 для версии Cuda. Нет доступа за пределы, так как мои массивы в основном достаточно велики. Замена memcpy в цикле в Cuda нене могу ничего изменить.

Я действительно нене понимаю, что происходит ... есть идеи? Спасибо!

Код Cuda:

    #include 
    #include 
    #include 
    #include 

    class Point2D {
     public:
     __device__ Point2D(double xx=0, double yy=0):x(xx),y(yy){};
     double x, y;
    };

    __device__ double dot(const Point2D &A, const Point2D &B) {
     return A.x*B.x + A.y*B.y;
    }
    __device__ Point2D operator*(double a, const Point2D &P) {
     return Point2D(a*P.x, a*P.y);
    }
    __device__ Point2D operator+(Point2D A, const Point2D &B) {
     return Point2D(A.x + B.x, A.y + B.y);
    }
    __device__ Point2D operator-(Point2D A, const Point2D &B) {
     return Point2D(A.x - B.x, A.y - B.y);
    }
    __device__ Point2D inter(const Point2D &A, const Point2D &B, const Point2D &C, const Point2D &D) { //intersects AB by *the mediator* of CD 
      Point2D M = 0.5*(C+D);
      return A - (dot(A-M, D-C)/dot(B-A, D-C)) * (B-A);
    }

    class Polygon {
    public:
      __device__ Polygon():nbpts(0){};
      __device__ void addPts(Point2D pt) {
        pts[nbpts] = pt;
        nbpts++;
      }; 
      __device__ Polygon& operator=(const Polygon& rhs) {
        nbpts = rhs.nbpts;
        dummy = rhs.dummy;
        memcpy(pts, rhs.pts, nbpts*sizeof(Point2D));
        return *this;
      }
      __device__ void cut(const Point2D &inside_pt, const Point2D &outside_pt) {

        int new_nbpts = 0;
        Point2D newpts[128];
        Point2D AB(outside_pt-inside_pt);
        Point2D M(0.5*(outside_pt+inside_pt));
        double ABM = dot(AB, M);

        Point2D S = pts[nbpts-1];

        for (int i=0; i

Ответы на вопрос(1)

Ваш ответ на вопрос