样本集要有多少才合适
① 随机抽样样本数多少合适
简单随机抽样样本数用(Freese 1962)计算: t 2 52 n“一~亩厂下面关系式(1) 或式中 Nt“s“n二冈砂下丁云丁(2)N=总体个数n=计算的样本个数E=样本与未知总体平均;数之 间的最大允许误差e se 1962) 样本数是可能在一个步骤里计算出来的。之所以可能是因为Z、t和n之间的一个独特的经验关系式。 公式(l)可以改写为: ns忆 t“E“应用这个关系式我们可以计算出样本数n,式中Z值代替了t值。于是:n,=22一52E“nzZt2 s二总体标准差的估计值 t=对应于置信水平为(1一a)和(n一1)个自由度的t分布值。 公式(2)将得出一个比公式(1)要小的样本数量。而且每当n/N的比值超过。。05时,一般总是用公式(2)。 样本数的确定需要有关t的数据,而t本身取决于样本大小。如果计算的样本数大,并且较好地遵从标准正态分布,上式(1)和(2)中的t值可以用正态分布值代替;但是,如果样本数小,Z值的应用将对样本大小估计过低。
② 抽样占样本容量多少才具备代表性
40-50个样本在统计上属于小样本,t-检验,如果样本大于60或理想120以上,t分布就是正态分布了,所以40个样本在统计上是最小推断总体的样本,换句话说40-50个样本是介于小样本和正态分布大样本的临界样本量;如果不严格的话40个样本就可以比较总体之间的统计差异了;
③ 样本量多少才有统计学意义
1、 根据数理统计学的最少样本法则 可以得出 n》k+1 (k为解释变量的个数,n为样本数).
2、 如果要有效估计参数 可以根据有效样本得出 n》30或者n》3*(k+1).
只看你要多大的精度 如果精度随着样本数的增加而增加 .
④ 临床实验中合适的样本量是多少
1 与样本含量估计有关的几个统计学参数 在估计样本含量之前,首先要对以下几个统计学参数加以确定或作出估计。 1.1 规定有专业意义的差值δ,即所比较的两总体参数值相差多大以上才有专业意义。δ是根据试验目的人为规定的,但必须有一定专业依据。习惯上把δ称为分辨力或区分度。δ值越小表示对二个总体参数差别的区分度越强,因而所需样本含量也越大。 1.2 确定作统计推断时允许犯Ⅰ类错误(“弃真”的错误)的概率α,即当对比的双方总体参数值没有差到δ。但根据抽样观测结果错误地得出二者有差别的推断结论的可能性,α确定的越小,所需样本含量越大。在确定α时还要注意明确是单侧检验的α,还是双侧检验的α。在同样大小的α条件下;双侧检验要比单侧检验需要更大的样本含量。 1.3 提出所期望的检验效能power,用1-β表示。β为允许犯Ⅱ类错误(“取伪”的错误)的概率。检验效能就是推断结论不犯Ⅱ类错误的概率1-β称把握度。即当对比双方总体参数值间差值确实达到δ以上时,根据抽样观测结果在规定的α水准上能正确地作出有差别的推断结论的可能性。
⑤ 统计 样本容量一般选到总体的百分之多少比较合适
此题的实际情况,不定性因素太多,样本抽样视统计的东西的数量而定。可以随机抽样三分之一;容量太大的话,可以划分区域或者板块(区间)编号随机抽样。无固定的答案哈,结合生活实际情况,看人为的工作量而定哈。
⑥ 总量一万,样本多少比较合适
总量一万元样板应该是200是最合适的,一服务快200左右
⑦ 样本容量需要多大才能最大限度地满足调查要求
在95%的置信度下,允许误差5%,样本容量需要400才能最大限度地满足调查要求。
样本容量又称“样本数”。指一个样本的必要抽样单位数目。在组织抽样调查时,抽样误差的大小直接影响样本指标代表性的大小,而必要的样本单位数目是保证抽样误差不超过某一给定范围的重要因素之一。因此,在抽样设计时,必须决定样本单位数目,因为适当的样本单位数目是保证样本指标具有充分代表性的基本前提。
样本容量的大小涉及到调研中所要包括的单元数。样本容量是对于你研究的总体而言的,是在抽样调查中总体的一些抽样。比如:中国人的身高值为一个总体,你随机取一百个人的身高,这一百个人的身高数据就是总体的一个样本。某一个样本中的个体的数量就是样本容量。注意:不能说样本的数量就是样本容量,因为总体中的若干个个体只组成一个样本。样本容量不需要带单位。
在假设检验里样本容量越大越好。但实际上不可能无穷大,就像你研究中国人的身高不可能把所有中国人的身高都量一量一样。
样本容量问题
回归分析是从已经发生的经济活动的样本数据中寻找经济活动中内含的规律性,它对样本数据具有很强的依赖性。样本的容量太小会导致参数估计值的大小和符号违反经济理论和实际经验。从建模需要来讲,样本容量越大越好,但收集与整理样本数据是一件困难的工作,因此,选择合适的样本容量,既能满足模型估计的需要,又能减轻收集数据的困难,是一个重要的实际问题。
(1) 最小样本容量
所谓“最小样本容量”,即从普通最小二乘法原理出发,欲得到参数估计量,不管其质量如何,所要求的样本容量的下限,它是:n≥k+1
其中,k为解释变量的数目。
(2) 满足基本要求的样本容量
一般经验认为,当n≥30或者至少n≥3(k+1)时,才能满足模型估计的基本要求。
⑧ 样本总体较大时,样本量和样本总体的比例为多少合适
当样本总体较大时,样本量和样本总体的比例可以小点,10万个客户,采集样本达到1.5%,已经蛮高了。
最好是对客户群体进行分层,然后各层按一定比例抽样。(分层比例抽样),这样更科学点。
⑨ 实证分析需要的样本数至少达到多少以上才有意义
统计上一般认为大于30个样本数就是大样本,这样就可以减少样本误差,所以老师说至少三十个样品。
⑩ 统计样本多少合适
如具典型、代表性的,可在7万左右。