Найти уравнение «наилучшего соответствия»

Прошло много времени с тех пор, как я учился в колледже и знал, как рассчитать линию наилучшего соответствия, но мне это нужно. Предположим, у меня есть набор точек, и я хочу найти линию, которая является лучшей из этих точек.

Что такое уравнение для определения линии наилучшего соответствия? Как бы я сделал это с PHP?

13.12.2008 00:25:06
8 ОТВЕТОВ
РЕШЕНИЕ

Дополнительный интерес, вероятно, в том, насколько хорошо подходит линия. Для этого используйте корреляцию Пирсона, здесь в функции PHP:

/**
 * returns the pearson correlation coefficient (least squares best fit line)
 * 
 * @param array $x array of all x vals
 * @param array $y array of all y vals
 */

function pearson(array $x, array $y)
{
    // number of values
    $n = count($x);
    $keys = array_keys(array_intersect_key($x, $y));

    // get all needed values as we step through the common keys
    $x_sum = 0;
    $y_sum = 0;
    $x_sum_sq = 0;
    $y_sum_sq = 0;
    $prod_sum = 0;
    foreach($keys as $k)
    {
        $x_sum += $x[$k];
        $y_sum += $y[$k];
        $x_sum_sq += pow($x[$k], 2);
        $y_sum_sq += pow($y[$k], 2);
        $prod_sum += $x[$k] * $y[$k];
    }

    $numerator = $prod_sum - ($x_sum * $y_sum / $n);
    $denominator = sqrt( ($x_sum_sq - pow($x_sum, 2) / $n) * ($y_sum_sq - pow($y_sum, 2) / $n) );

    return $denominator == 0 ? 0 : $numerator / $denominator;
}
2
13.12.2008 00:45:22
Кстати, коэффициент Пирсона колеблется от 0 (без корреляции) до 1,0 (точки лежат на прямой линии)
ruquay 13.12.2008 00:46:46

Часто используемый подход состоит в том, чтобы итеративно минимизировать сумму квадратов y-разностей между вашими точками и функцией подбора.

0
13.12.2008 00:29:57

Хотя вы можете использовать итеративный подход, вы можете напрямую рассчитать наклон и точку пересечения линии с учетом набора наблюдений, используя метод наименьших квадратов. См. Раздел «Одномерный линейный случай» статьи в Википедии о линейной регрессии, чтобы узнать, как рассчитать коэффициенты aи bв y = a + bxзаданных наборах (x,y)точек.

4
13.12.2008 00:35:40

Метод наименьших квадратов http://en.wikipedia.org/wiki/Least_squares . В этой книге « Численные рецепты», 3-е издание: «Искусство научных вычислений» (в твердом переплете) есть все, что нужно для алгоритмов реализации наименьших квадратов и других методов.

5
13.12.2008 00:35:51

Вы можете проверить линейную регрессию или, в более общем случае, подгонку кривой .

2
13.12.2008 00:39:21

Вот статья, сравнивающая два способа подгонки строки к данным. Следует обратить внимание на то, что существует прямое решение, которое является правильным в теории, но может иметь численные проблемы. В статье показано, почему этот метод может потерпеть неудачу, и дается другой метод, который лучше.

6
13.12.2008 13:10:48
+1 Это, безусловно, лучший ответ, другой метод значительно уступает, хотя и более популярен.
Muhd 8.06.2011 18:02:02

Реализовано со страницы вики, не проверено.

$sx = 0;
$sy = 0;
$sxy = 0;
$sx2 = 0;
$n = count($data);
foreach ($data as $x => $y)
{
    $sx += $x;
    $sy += $y;
    $sxy += $x * $y;
    $sx2 += $x * $x;
}
$beta = ($n*$sxy - $sx*$sy) / ($n*$sx2 - $sx*$sx);
$alpha = $sy/$n - $sx*$beta/$n;

echo "y = $alpha + $beta x";
3
13.12.2008 00:43:17

Чтобы добавить ответ FryGuy, если вам нужна функция, которая также дает R ^ 2 (чтобы показать, насколько хорошо подходит):

function mathTrend($data) {
    $sx = 0;
    $sy = 0;
    $sxy = 0;
    $sx2 = 0;
    $yTotal = 0;
    $n = count($data);
    if($n <= 1) {
        return false;
    }
    foreach ($data as $row)
    {
        $row = array_values($row);
        $x = $row[0];
        $y = $row[1];
        $yTotal += $y;
        $sx += $x;
        $sy += $y;
        $sxy += $x * $y;
        $sx2 += $x * $x;
    }
    $yAvg = $yTotal / $n;
    $m = ($n*$sxy - $sx*$sy) / ($n*$sx2 - $sx*$sx);
    $b = $sy/$n - $sx*$m/$n;

    //Go through again to determine rSquared
    //Using method from https://www.youtube.com/watch?v=w2FKXOa0HGA
    $diffActual = 0;
    $diffEstimated = 0;
    foreach($data as $row) {
        $row = array_values($row);
        $x = $row[0];
        $y = $row[1];

        $expectedY = $m*$x+$b;
        $diffActual += ($y - $yAvg)**2;
        $diffEstimated += ($expectedY-$yAvg)**2;
    }
    $rSquared = $diffEstimated / $diffActual;

    $result = ['m'=> $m, 'b' => $b, 'rSquared' => $rSquared];
    return $result;
}
0
31.07.2019 13:51:37