2014-12-12 5 views
1

Проблема с математикой действительно я думаю ... У меня есть некоторые исторические данные для некоторых выходов электронных таблиц, а также количество строк и столбцов.Как я могу предсказать использование памяти и время, основанное на исторических значениях

Что я хотел бы сделать, это использовать эти данные, чтобы предсказать пиковое использование памяти и время, затраченное на основе известных строк и столбцов.

Итак, если исторических данных не существует, предсказаний не будет. 1 или 2 исторических значения будут очень неточными, но я надеюсь, что, учитывая достаточно широкий набор исторических ценностей, можно было бы сделать разумно точное предсказание?

У меня есть стол на jsfiddle. Любая помощь или идеи будут действительно оценены. Я не знаю, с чего начать.

http://jsfiddle.net/JelbyJohn/kwje9chf/3/

<table class="table table-condensed"> 
</table> 

ответ

1

Вы могли бы соответствовать linear regression модели.

Поскольку это сайт программирования, вот некоторые R код:

> d <- read.table("data.tsv", sep="\t", header=T) 
> summary(lm(log(Bytes.RAM) ~ log(Rows) + log(Columns), d)) 

Call: 
lm(formula = log(Bytes.RAM) ~ log(Rows) + log(Columns), data = d) 

Residuals: 
    Min  1Q Median  3Q  Max 
-0.4800 -0.2409 -0.1618 0.1729 0.6827 

Coefficients: 
      Estimate Std. Error t value Pr(>|t|)  
(Intercept) 12.42118 0.61820 20.093 8.72e-09 *** 
log(Rows)  0.51032 0.09083 5.618 0.000327 *** 
log(Columns) 0.58200 0.07821 7.441 3.93e-05 *** 
--- 
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1 

Residual standard error: 0.4052 on 9 degrees of freedom 
Multiple R-squared: 0.9062, Adjusted R-squared: 0.8853 
F-statistic: 43.47 on 2 and 9 DF, p-value: 2.372e-05 

Эта модель объясняет данные довольно хорошо ( 0,89) и предполагает следующее соотношение между размером таблицы и памяти использование:

Bytes.RAM = exp(12.42 + 0.51 * log(Rows) + 0.58 * log(Columns)) 

Аналогичная модель может быть использована для прогнозирования времени выполнения (The Seconds столбца). Там, R² - 0.998.

+0

Это выглядит блестящим, хотя и немного над моей головой прямо сейчас. Я прокладываю себе путь, пытаясь понять это. –

+0

Кажется, я разбиваю это на две полезные части: 1) уравнение конца, которое основано на константах, полученных из ... 2) вычисление констант Это полезно, поскольку я могу написать задачу для определения/обновлять константы так часто, как мне нравится, и, очевидно, самые последние константы будут использоваться при запуске уравнения. Уравнение легко программировать, но теперь мне нужно выяснить, как получить цифры в PHP или JQuery (извинения за то, что я не буду упоминать, какой язык я намерен использовать). Я смотрел в R, но я хотел бы сделать это в php vanilla, если это возможно. –

+0

@ Jelby-John: Если вы google "php linear regression", это должно дать вам несколько указателей. – NPE

 Смежные вопросы

  • Нет связанных вопросов^_^