1、百分位数:统计学术语,如果将一组数据从大到小排序,并计算相应的累计百分位,则某一百分位所对应数据的值就称为这一百分位的百分位数。
2、可表示为:一组n个观测值按数值大小排列如,处于p%位置的值称第p百分位数。
(资料图片)
3、中位数是第50百分位数。
4、第25百分位数又称第一个四分位数(FirstQuartile),用Q1表示;第50百分位数又称第二个四分位数(SecondQuartile),用Q2表示;第75百分位数又称第三个四分位数(ThirdQuartile),用Q3表示。
5、若求得第p百分位数为小数,可完整为整数。
6、分位数是用于衡量数据的位置的量度,但它所衡量的,不一定是中心位置。
7、百分位数提供了有关各数据项如何在最小值与最大值之间分布的信息。
8、对于无大量重复的数据,第p百分位数将它分为两个部分。
9、大约有p%的数据项的值比第p百分位数小;而大约有(100-p)%的数据项的值比第p百分位数大。
10、对第p百分位数,严格的定义如下。
11、第p百分位数是这样一个值,它使得至少有p%的数据项小于或等于这个值,且至少有(100-p)%的数据项大于或等于这个值。
12、扩展资料应用:在传统的直线回归分析中, 常采用最小二乘法,同时要求数据的独立性、正态性及常数方差,即给定自变量 时因变量的条件分布为正态分布,且不同时的方差相同。
13、其目的是根据给定的自变量估计因变量的均数及其可信区间或估计因变量的容许区间或参考值范围等。
14、但医学研究中,某些资料不满足上述要求,特别当观察值中有离群值、强影响点时,所拟合的回归直线因“迁就”这个些离群值、强影响点而使整体的拟合结果产生不同程度的偏离 以致影响了稳定性。
15、再者,当条件分布不是正态或方差不为常数时,亦不宜用最小二乘法估计回归系数。
16、 经过变量变换法的处理虽能解决部分问题,但由于各种变换法的规律难以掌握,对变换效果的估计往往不准。
17、有时甚至经多种尝试而终未见效。
18、 不满足上述条件时可采用直线回归方法——百分位数回归。
19、参考资料来源:百度百科-百分位数。
本文到此分享完毕,希望对大家有所帮助。
标签: