If you're seeing this message, it means we're having trouble loading external resources on our website.

Ако си зад уеб филтър, моля, увери се, че домейните *. kastatic.org и *. kasandbox.org са разрешени.

Основно съдържание

Пример за линия на регресия

Пример за линия на регресия. Създадено от Сал Кан.

Искаш ли да се присъединиш към разговора?

Все още няма публикации.
Разбираш ли английски? Натисни тук, за да видиш още дискусии в английския сайт на Кан Академия.

Видео транскрипция

В последните няколко клипа, имахме доста сложни сметки. Дори може би си ги пропуснал/а. Но стигнахме до един доста приличен резултат. Намерихме формула за наклона и пресечната точка с оста у като най-подходящата линия на регресия, когато измерваме грешката чрез квадратичното отклонение от тази права. И нашата формула е, ще я препиша тук, за да имаме нещо подредено, което да поглеждаме. Та наклонът на тази права е средната стойност на хиксовете, умножена по средната стойност на игреците минус средната стойност на членовете ху. И не се тревожи – изглежда наистина объркващо, но след малко ще решим един такъв пример. Разделено на средната стойност на х квадрат минус средната стойност на х на квадрат. И ако това изглежда малко по-различно от това, което виждаш в часовете ви по статистика или в учебника ти, може би тук нещата ти се виждат разменени. Ако умножим числителя и знаменателя по минус 1, можем да видим това записано като средната стойност на членовете ху, минус средната стойност на х, умножена по средната стойност на игреците. Всичко това върху средната стойност на квадратите на х минус средната стойност на квадратите на х. Очевидно тези представляват същото. Само умножаваме числителя и знаменателя по минус 1, което си е същото като умножение на цялото това по 1. И естествено, каквото и да получим за m, можем просто да заместим тук, за да получим нашето b. To ще е равно на средната стойност на тези у минус m. Нека оцветя в жълто това, за да е много ясно. Намерихме стойността на m. Минус m, умножено по средната стойност на хиксовете. И това е всичко, от което имаме нужда. Така че нека го приложим. Да кажем, че имам три точки, и ще се уверя, че тези точки не са колинеарни. Защото иначе не би било интересно. Та нека тук нанеса три точки. Да кажем, че в една точка има координати (1; 2). Така, имаме (1; 2), точката е ето тук. И след това имаме точката (2; 1). И след това, да кажем, че имаме и точката... нека направим нещо малко щуро – (3; 4). Нека да е всъщност (4; 3), за да се вмести на страницата. Та това са нашите три точки. И сега искаме да намерим най-добрата, най-подходящата линия на регресия, която подозираме, че ще изглежда по следния начин. Ще видим как всъщност изглежда тя, като използваме нашите формули, които доказахме. И хубаво би било да започнем, като пресметнем тези неща предварително, и тогава да ги заместим обратно в уравнението. Та каква е средната стойност на нашите хиксове? Средната стойност на хиксовете ще е 1, плюс 2, плюс 4, делено на 3. А какво дава това? 1 плюс 2 е 3, плюс 4 е 7, делено на 3. Равно е на 7/3. Така, каква е средната стойност на тези у? Средната им стойност е равна на 2, плюс 1, плюс 3. Всичко това върху 3. Така че това е 2 плюс 1, т.е. 3. Плюс 3 дава 6. Делено на 3 е равно на 2. Това е 6, делено на 3, дава 2. Така, каква е средната стойност на тези, ху? Първото ху тук е 1, умножено по 2. Плюс 2 пъти по 1, плюс 4 пъти по 3. И имаме три от тези ху. Та разделяме на 3. И на какво ще е равно това? Имаме 2 плюс 2, което е 4. 4 плюс 12 дава 16. Така че ще е 16/3. И след това последното, което трябва да пресметнем, е средната стойност на квадратите на х. И каква е средната стойност на тези квадрати? Първото х на квадрат ще е 1 на квадрат. Плюс това 2 на квадрат, плюс това 4 на квадрат. И пак имаме три точки данни. Така че тук това е 1 плюс 4, което е 5. Плюс 16. Това е равно на 21/3, което е равно на 7. И сметките доведоха до едно доста прилично число. Нека сега намерим нашите m и b. И нашият наклон, оптималният наклон за линията на регресия... средната стойност на хиксовете е 7/3. Умножено по средната стойност на игреците. Средната стойност на игреците е 2. Минус средната стойност на ху. Това е 16/3. И тогава, всичко това върху средната стойност на хиксовете. Средната стойност на хиксовете е 7/3 на квадрат. Минус средната стойност на квадратите на х. Така имаме минус това 7 тук. И просто трябва да направим малко математически сметки. Изкушен съм да извадя калкулатора си, но ще устоя на изкушенето. Хубаво е за запазим нещата във вид на обикновени дроби. Да видим дали мога да пресметна това. Имаме 14/3 минус 16/3. Всичко това върху... тук това дава 49/9; 7/3 на квадрат е 49/9. И след това минус 7. Ако искам да изразя това като нещо върху 9, това е точно равно на 63/9. Така че в нашия числител получаваме минус 2/3. А в знаменателя – какво дава 49 минус 63? Отговорът е минус 14/9. Което е равно на –2/3, умножено по минус 9/14. Разделяме числителя и знаменателя на 3. Добре, най-напред ще изчезнат минусите. Разделяме на 3. Това става 1. Това пък 3. Разделяме на 2. Става 1. Това става 7. Така че нашият наклон е 3/7. Не е зле. Сега можем да се върнем тук и да намерим ординатата на пресечната точка с оста у. Нека намерим пресечната точка с оста у с помощта на това тук. Ординатата на пресечната точка с у, която е b, ще е равна на средната стойност на игреците, която е 2, минус нашия наклон. Тъкмо намерихме, че нашият наклон е 3/7. Значи минус 3/7. Умножено по средната стойност на хиксовете, която е 7/3. Тези дроби са реципрочни една на друга, така че се съкращават. Това си става 1. И нашата ордината е буквално 2 минус 1. Така че е равно на 1. И имаме налице уравнението за нашата права. Нашата линия на регресия има уравнение у е равно на – намерихме m. m e 3/7. у е равно на 3/7х плюс ординатата на пресечната точка с оста у, която е 1. И сме готови. И нека сега се опитаме графично да изобразим това. Ординатата на пресечната точка с оста у е 1. Пресечната точка ще се намира тук. И наклонът на нашата ос ще е 3/7. Така че за всеки 7, с които се изместваме по х, се издигаме с 3 единици по оста у. Или друг начин, по който можем да помислим тук, за всеки 3,5, които се изместваме по оста х, се издигаме с 1,5 по оста у. Така че тук ще отидем на 1,5. И тази права, ако я изобразим графично, аз очевидно го правя на ръка, поради което няма да е толкова точно, тя ще изглежда ето така. То всъщност няма да мине директно така. Не искам да оставям у теб това впечатление. Така че може да изглежда подобно на това. И показахме, че тази права... формулата минимизира квадратичните отклонения от всяка точка тук до тази права. Както и да е, това, което свършихме, поне за мен, е доста добра работа.