Интервал на доверие

Какво е интервал на доверие:

Това е оценка на диапазон, използван в статистиката, която съдържа параметър на населението. Този неизвестен популационен параметър се намира чрез модел на извадка, изчислен от събраните данни .

Пример: средната стойност на събраната проба x̅ може или не може да съвпада с истинската средна стойност на населението μ. За тази цел е възможно да се разгледа набор от извадкови средства, където тази средна популация може да бъде ограничена. Колкото по-дълъг е този интервал, толкова по-голяма е вероятността това да се случи.

Доверителният интервал се изразява като процент, деноминиран от нивото на доверие, като най-често се посочват 90%, 95% и 99%. Например, на изображението по-долу имаме 90% доверителен интервал между неговите горни и долни граници (а и -а ).

Пример за 90% интервал на доверие между горните граници (а) и долните (-а) граници.

Интервалът на доверие е един от най-важните понятия в тестването на хипотези в статистиката, защото се използва като мярка за несигурност. Терминът е въведен от полския математик и статистик Йежи Нейман през 1937 година.

Какво е значението на доверителния интервал?

Доверителният интервал е важен, за да се посочи границата на несигурност (или неточност) спрямо направеното изчисление. Това изчисление използва извадката на проучването, за да се оцени действителният размер на резултата в изходната популация.

Изчисляването на доверителния интервал е стратегия, която взема предвид извадката на грешките. Размерът на резултата от вашето проучване и вашият интервал на доверие характеризират предполагаемите стойности за първоначалната популация.

Колкото по-малък е доверителният интервал, толкова по-голяма е вероятността процентът на изследваната популация да представлява реалния брой на изходната популация, давайки по-голяма сигурност по отношение на резултата от проучвания обект.

Как да интерпретираме доверителния интервал?

Правилното тълкуване на доверителния интервал е може би най-предизвикателният аспект на тази статистическа концепция. Пример за най-разпространеното тълкуване на концепцията е следното:

Има 95% вероятност, че в бъдеще истинската стойност на параметъра на населението (напр. Средна стойност) ще попада в обхвата X (долна граница) и Y (горна граница).

Така интервалът на доверие се интерпретира по следния начин: 95% е уверен, че интервалът между X (долна граница) и Y (горна граница) съдържа истинската стойност на параметъра на населението.

Би било напълно погрешно да се твърди, че: има 95% вероятност, че интервалът между X (долна граница) и Y (горна граница) съдържа реалната стойност на параметъра на населението.

Горното твърдение е най-честото погрешно схващане за доверителния интервал. След като се изчисли статистическият обхват, той може да съдържа само параметъра на населението или не.

Въпреки това, интервалите могат да варират между пробите, докато истинският параметър на популацията е един и същ, независимо от пробата.

Следователно, декларацията на доверието на доверителния интервал може да бъде направена само в случаите, когато доверителните интервали са преизчислени за броя на пробите.

Стъпките за изчисляване на доверителния интервал

Диапазонът се изчислява, като се използват следните стъпки:

Съберете данните от извадката: n ;
Изчислете средната стойност на пробата x̅;
Да се определи дали стандартното отклонение на популацията ( σ ) е известно или неизвестно;
Ако е известно стандартно отклонение на населението, може да се използва z- точка за съответното ниво на достоверност;
Ако стандартното отклонение на населението е неизвестно, можем да използваме статистика t за съответното ниво на достоверност;
По този начин долната и горната граница на доверителния интервал се намират, като се използват следните формули:

а) Стандартно отклонение на известна популация :

Формула за изчисляване на стандартното отклонение на известна популация.

б) Стандартно отклонение на неизвестна популация :

Формула за изчисляване на стандартното отклонение на неизвестна популация.

Практически пример за доверителен интервал

Клинично проучване оценява връзката между наличието на астма и риска от развитие на обструктивна сънна апнея при възрастни.

Някои възрастни бяха наети на случаен принцип от списък на държавни служители, които трябва да бъдат следвани в продължение на четири години.

Участниците с астма, в сравнение с тези без, са имали по-голям риск от развитие на апнея след четири години.

При провеждането на клинични изследвания, като този пример, обикновено се набира подгрупа от интересуващата се популация, за да се увеличи ефективността на изследването (по-малко разходи и по-малко време).

Тази подгрупа от индивиди, изследваната популация, се състои от тези, които отговарят на критериите за включване и са съгласни да участват в проучването, както е показано на изображението по-долу.

Обяснителната графика на изследваното население в примера.

След това проучването е завършено и се изчислява размер на ефекта (например средна разлика или относителен риск ), за да се отговори на въпроса за изследването.

Този процес, наречен извод, включва използването на данни, събрани от изследваната популация, за да се оцени размерът на действителното въздействие върху популацията, която представлява интерес, т.е.

В дадения пример изследователите набират произволна извадка от държавни служители (източник на популация), които са били допустими и са се съгласили да участват в проучването (проучвана популация) и съобщават, че астмата увеличава риска от развитие на апнея в изследваната популация.

За да се вземе предвид извадковата грешка, дължаща се на набирането само на подгрупа от интересуващата се популация, те също така изчислиха 95% доверителен интервал (около оценката) от 1.06 - 1.82, което показва вероятност от 95 %, че истинският относителен риск в изходната популация ще бъде между 1.06 и 1.82 .

Интервал на доверие за средно

Когато има информация за стандартното отклонение на дадена популация, може да се изчисли доверителен интервал за средната стойност или средната стойност на тази популация.

Когато измерваната статистическа характеристика (като доход, коефициент на интелигентност, цена, височина, количество или тегло) е числена, в повечето случаи се оценява, че средната стойност за населението е намерена.

По този начин, ние се опитваме да намерим средната стойност на популацията ( μ ), използвайки средна стойност на пробата ( x̅ ), с граница на грешка. Резултатът от това изчисление се нарича доверителен интервал за средната стойност на населението .

Когато е известно стандартното отклонение на популацията, формулата за доверителен интервал (CI) за средна популация е:

когато:

x̅ е средната проба;
σ е стандартното отклонение на населението;
n е размерът на извадката;
Represents * представлява подходящата стойност на стандартното нормално разпределение за желаното ниво на доверие.

Следните стойности за различните нива на доверие () * ):

Ниво на доверие	Стойност на Z * -
80%	01:28
90%	1, 645 (конвенционален)
95%	1.96
98%	02:33
99%	02:58

Таблицата по-горе показва стойностите на z * за предоставените нива на доверие. Отбележете, че тези стойности са получени от стандартното нормално разпределение (Z-).

Областта между всяка стойност z * и отрицателната стойност на тази стойност е (приблизителния) процент на доверие. Например, площта между z * = 1.28 и z = -1.28 е приблизително 0.80. Следователно тази таблица може да бъде разширена и до други проценти на доверие. Таблицата показва само най-често използваните проценти на доверие.

Виж също значението на хипотезата.