Я попробую вашу идею визуализации, большое спасибо за вашу помощь!

исал приложение, которое анализирует данные и записывает результаты в файл CSV. Он содержит три столбца:Я бы, разница а такжеподсчитывать.
1.Я бы является идентификатором цикла - в теории, чем больше идентификатор, тем нижеразница должно быть
2.разность этосумма из

(Estimator - RealValue)^2
за каждое наблюдение в цикле

3 подсчитывать количество наблюдений за цикл

Для 15 различных значений параметра K я создаю файл CSV с именем:% K% .csv, где% K% - это используемое значение. Мое общее количество файлов 15.

То, что я хотел бы сделать, это написать в R простой цикл, который будет в состоянии изобразить содержимое моих файлов, чтобы позволить мне решить, какое значение K является лучшим (для которого в общем случаеразница самый низкий.

Для одного файла я делаю что-то вроде

 ggplot(data = data) + geom_point(aes(x= id, y=sqrt(diff/count)))

Имеет ли смысл то, что я пытаюсь сделать? Обратите внимание, что статистика не является ни моим доменом, ни R (но вы, вероятно, уже могли это выяснить).

Есть ли лучший подход, который я могу выбрать? И с теоретической точки зрения, делаю ли я то, что ожидаю?

Буду очень признателен за любые комментарии, подсказки, критику и ответы

Ответы на вопрос(2)

Ваш ответ на вопрос