Я попробую вашу идею визуализации, большое спасибо за вашу помощь!
исал приложение, которое анализирует данные и записывает результаты в файл CSV. Он содержит три столбца:Я бы, разница а такжеподсчитывать.
1.Я бы является идентификатором цикла - в теории, чем больше идентификатор, тем нижеразница должно быть
2.разность этосумма из
(Estimator - RealValue)^2за каждое наблюдение в цикле
3 подсчитывать количество наблюдений за цикл
Для 15 различных значений параметра K я создаю файл CSV с именем:% K% .csv, где% K% - это используемое значение. Мое общее количество файлов 15.
То, что я хотел бы сделать, это написать в R простой цикл, который будет в состоянии изобразить содержимое моих файлов, чтобы позволить мне решить, какое значение K является лучшим (для которого в общем случаеразница самый низкий.
Для одного файла я делаю что-то вроде
ggplot(data = data) + geom_point(aes(x= id, y=sqrt(diff/count)))
Имеет ли смысл то, что я пытаюсь сделать? Обратите внимание, что статистика не является ни моим доменом, ни R (но вы, вероятно, уже могли это выяснить).
Есть ли лучший подход, который я могу выбрать? И с теоретической точки зрения, делаю ли я то, что ожидаю?
Буду очень признателен за любые комментарии, подсказки, критику и ответы