).

F выглядит так:

    bid        ts    latitude  longitude
1  827566 1999-10-07 42.40944 -88.17822
2  827566 2013-04-11 41.84740 -87.63126
3 1902966 2012-05-02 45.52607 -94.20649
4 1902966 2013-03-25 41.94083 -87.65852
5 3211972 2012-08-14 43.04786 -87.96618
6 3211972 2013-08-02 41.88258 -87.63760

Я хочу создать новый df, который вычисляет разницу во времени и расстоянии от каждой последующей точки. Я хотел бы рассчитать одинаковые строки, сгруппированные по ставкам. Я использовал следующее для цикла, чтобы выполнить это:

library(geosphere)
   lengthdata <- nrow(twopoint)
   twopointdata <- data.frame(matrix(ncol = 4, nrow =lengthdata))
   x <- c("bid", "time", "d", "dsq")
   colnames(twopointdata) <- x
   n <- numeric()
   n <- 1

   for (i in 1:lengthdata)
   {
     if (twopoint[i+1,1] == twopoint[i,1]) 
     {
       twopointdata[n,1] <- twopoint[i+1,1]
       twopointdata[n,2] <- as.numeric(twopoint[i+1,5]-twopoint[i,5])
       twopointdata[n,3] <- distm(c(twopoint[i+1,10], twopoint[i+1,9]), 
                              c(twopoint[i,10],twopoint[i,9]), fun = 
                                   distHaversine)
       twopointdata[n,4] <- twopoint[n,3]^2
       n <- n+1
     }

   }
   attach(twopointdata)
   head(twopointdata)

(некоторые номера столбцов отключены, потому что я вынул несколько строк, чтобы отобразить их более четко)

Мой результат выглядит так:

      bid time    d          dsq
1  827566 4935  77159.8 5.677201e+11
2 1902966  327 660457.0 6.436004e+16
3 3211972  353 132494.8 3.540118e+12
4 3692174 4722 727359.6 6.394166e+16
5 4404655 4833 201644.7 1.092944e+13
6 6644203 4518 210485.9 6.721980e+16

Он имеет идентификаторы для каждой точки данных, разницу во времени между ними, расстояние, рассчитанное по long и lat, и квадрат расстояния. ПРОБЛЕМА: это очень медленно, и в конце концов я буду делать это на очень большом наборе данных.

Я смог сделать это без цикла for успешно с разницей во времени, используя dplyr, как это:

 library(dplyr)
 library(geosphere)
 latlongdata2 <- latlongdata 
 latlongdata2 %>%
  group_by(bid)%>%
  transmute(
    bid = bid,
    t = c(NA,diff(ts)))

Я не могу понять, как это сделать с широтой и долготой, потому что в отличие от значений ts они находятся в двух разных столбцах. У кого-нибудь есть предложения?

Постскриптум общая цель проекта - провести среднеквадратичный анализ смещения данных.

Ответы на вопрос(1)

Ваш ответ на вопрос