, Это поможет вам выбрать «лучшую» модель. В любом случае, вам понадобится ДОЛГОЕ время, чтобы выполнить все возможные комбинации на 100 столбцах, особенно если у вас много наблюдений. протестируйте МАЛЕНЬКОЕ подмножество строк, чтобы убедиться, что у вас сначала настроены модели. Но вам определенно следует попытаться создать это самостоятельно ... прочитать документы, чтобы вы могли объяснить, что вы сделали, с определенными полномочиями.

Question

Aug 14, 2017, 10:03 PM

, Это поможет вам выбрать «лучшую» модель. В любом случае, вам понадобится ДОЛГОЕ время, чтобы выполнить все возможные комбинации на 100 столбцах, особенно если у вас много наблюдений. протестируйте МАЛЕНЬКОЕ подмножество строк, чтобы убедиться, что у вас сначала настроены модели. Но вам определенно следует попытаться создать это самостоятельно ... прочитать документы, чтобы вы могли объяснить, что вы сделали, с определенными полномочиями.

у запустить линейную регрессию на приведенном ниже кадре данных.

test<-data.frame(abc=c(2.4,3.2,8.9,9.8,10.0,3.2,5.4),
             city1_0=c(5.3,2.6,3,5.4,7.8,4.4,5.5),
             city1_1=c(2.3,5.6,3,2.4,3.6,2.4,6.5),
             city1_2=c(4.2,1.4,2.6,2,6,3.6,2.4),
             city1_3=c(2.4,2.6,9.4,4.6,2.5,1.2,7.5),
             city1_4=c(8.2,4.2,7.6,3.4,1.7,5.2,9.7),
             city2_0=c(4.3,8.6,6,3.7,7.8,4.7,5.8),                               city2_1=c(5.3,2.6,3,5.4,7.8,4.4,5.5))

Dataframe "test" - это образец данных. Но оригинальный фрейм данных содержит 100 столбцов. Я хочу создать скрипт для прогнозирования значений с использованием линейной регрессии. В этом случае я хочу построить много моделей с разными входными переменными.

Например, в данном кадре данных,азбука является переменной у. Я хочу построить одну модель city1_1, city1_2, city1_3, city1_4 (оставляя city1_0, city2_0). Затем другая модель с city1_2, city1_3, city1_4 (с выходом city1_0, city1_1, city2_0, city2_1), а затем 3-я модель с входной переменной city1_3, city1_4 (с выходом city1_0, city1_1, city1_2, city2_0, city2_1) и так далее.

Все эти переменные являются входными данными для линейной регрессии.

Это я должен сделать для 40 кадров данных. Имя переменной O / P остается одинаковым для каждого кадра данных.

Ответы на вопрос(0)

Ваш ответ на вопрос

Популярные вопросы

Вы очень активны! Это здорово!

Ответы на вопрос(0)

Ваш ответ на вопрос

Популярные вопросы