基本信息出版社:科学出版社
页码:404 页
出版日期:2002年07月
ISBN:9787030104588
条形码:9787030104588
版本:第1版
装帧:平装
开本:16
正文语种:中文
丛书名:高等院校信息科学系列教材
图书品牌:科瀚伟业
内容简介 《数据分析》介绍了数据分析的基本内容与方法,其特点是既重视数据分析的基本理论与方法的介绍,又强调应用计算机软件SAS进行实际分析和计算能力的培养,主要内容有:数据描述性分析、非参数方法、回归分析、主成分析、判别分析、聚类分析、时间序列 分析、Bayes统计分析以及常用数据分析方法的SAS过程简介,《数据分析》每章末附有大量实用、丰富的习题,并要求学生独立上机完成。《数据分析》可作为高等院校信息科学及数理统计专业的本科生教材,也可供有关专业的研究生及工程技术人员参考。
编辑推荐 《数据分析》由科学出版社出版。
目录
第1章 数据描述性分析
1.1 数据的数字特征
1.1.1 均值、方差等数字特性
1.1.2 中位数、分位数、三均值与极差
1.2 数据的分布
1.2.1 直方图、经验分布函数与QQ图
1.2.2 茎叶图、箱线图及五数总括
1.2.3 正态性检验与分布拟合检验
1.3 多元数据的数字特征与相关分析
1.3.1 二元数据的数字特征及相关系数
1.3.2 多元数据的数字特征及相关矩阵
1.3.3 总体的数字特征及相关矩阵
习题一
第2章 非参数方法
2.1 两种处理方法比较的秩检验
2.1.1 两种处理方法比较的随机化模型及秩的零分布
2.1.2 Wilcoxon秩和检验
2.1.3 总体模型的Wilcoxon秩和检验
2.1.4 Smirnov检验
2.2 成对分组设计下两种处理方法的比较
2.2.1 符号检验
2.2.2 Wilcoxon符号秩检验
2.2.3 分组设计下两处理方法比较的总体模型
2.3 多种处理方法比较的Krukal-Wallis检验
2.3.1 多种处理方法比较中秩的定义及Kruskal-Wallis统计量
2.3.2 Kruskal-Wallis统计量的零分布
2.4 分组设计下多种处理方法的比较
2.4.1 分组设计下秩的定义及其零分布
2.4.2 Friedman检验
2.4.3 改进的Friedman检验
2.5 列联表的独立性检验
2.5.1 定性变量与列联表
2.5.2 二维rXs列联表的独立性检查
2.5.3 三维rXsXt列联表的独立性检验
习题二
第3章 回归分析
3.1 线性回归模型
3.1.1 线性回归模型及其矩阵表示
3.1.2 估计
3.1.3 有关的统计推断
3.2 残差分析
3.2.1 误差项的正态性检验
3.2.2 残差图分析
3.3 回归方程的选取与系统建模概述
3.3.1 穷举法
3.3.2 逐步回归法
3.3.3 系统建模过程概述
3.4 Logistic回归模型
3.4.1 线性Logistic回归模型
3.4.2 参数的最大似然估计与Newton-Raphson迭代解法
3.4.3 Logistic模型的统计推断
习题三
第4章 主成分分析
4.1 引言
4.2 总体主成分
4.2.1 总体主成分的定义
4.2.2 总体主成分的求法
4.2.3 总体主成分的性质
4.2.4 标准化变量的主成分
4.3 样本主成分
习题四
第5章 判别分析
5.1 距离判别
5.1.1 判别分析的基本思想及意义
5.1.2 两个总体的距离判别
5.1.3 判别准则的评价
5.1.4 多个总体的距离判别
5.2 Bayes判别
5.2.1 Bayes判别的基本思想
5.2.2 两个总体的Bayes判别
5.2.3 多个总体的Bayes判别
5.3 逐步判别
5.3.1 判别效果的检验
5.3.2 逐步判别的步骤
习题五
第6章 聚类分析
6.1 距离与相似系数
6.1.1 聚类分析的基本思想及意义
6.1.2 样品间的相似性度量——距离
6.1.3 变量间的相似性度量——相似系数
6.2 谱系聚类法
6.2.1 类间距离
6.2.2 类间距离的递推公式
6.2.3 谱系聚类法的步骤
6.2.4 谱系聚类法的统计量
6.2.5 变量聚类
6.3 快速聚类法
6.3.1 快速聚类法的步骤
6.3.2 用删距离进行快速聚类
习题六
第7章 时间序列分析
7.1 平稳时间序列
7.1.1 时间序列分析及其意义
7.1.2 随机过程概念及其数字特征
7.1.3 平稳时间序列与平稳随机过程
7.1.4 平稳性检验及自协方差函数、自相关函数的估计
7.2 ARMA时间序列及其特性
7.2.1 ARMA时间序列的定义
7.2.2 ARMA序列的平稳性与可逆性
7.2.3 ARMA序列的相关特性
7.3 ARMA时间序列的建模与预报
7.3.1 ARMA序列参数的矩估计
7.3.2 ARMA序列参数的精估计
7.3.3 ARMA模型的定阶与考核
7.3.4 平稳线性最小均方预报
7.3.5 ARMA序列的预报
7.4 ARIMA序列与季节性序列
7.4.1 ARIMA序列及其预报
7.4.2 季节性序列及其预报
习题七
第8章 Bayes统计分析
第9章 常用数据分析方法的SAS过程简介
常用统计数值表
主要参考文献
……
序言 1998年教育部进行高校专业调整时,设立了“信息与计算科学”专业。该专业的设立,受到很多高等院校的热烈响应。据不完全统计,几年来已有约280所院校招收了该专业的本科生,其中大部分院校计划开设信息科学方面的系列课程。
为了配合高等院校在学科专业设置上的改革与深化,来自几十所高等院校有关专业的部分领导和教师,于1999年、2000年召开了第一、二届“信息科学专业发展与学术研讨会”,与会者热烈讨论并探讨了许多关于信息学科的学科发展和建设的基本问题。会议一致认为教材建设是目前最为紧迫的任务,因此成立了教材编审协调组来组织该系列教材的编写。
2001年教材编写协调组召集了有多位经验丰富的教师和出版社参加的教材建设会议。会议明确了教材建设是一项长期的工作,并决定首先编写和出版本套教材来满足近期急需。为了保证教材的质量,会议对每本教材的要求、内容和大纲进行了具体研讨,并请具有多年教学经验的重点院校教授担任各教材的负责人。
为了贴近教学的实际,每本教材都配有习题或思考题,同时对内容也作了结构化安排,以便教师能根据实际情况部分选讲。本套教学用书不仅适用于教学,也可供相关读者参考。
在教材编写和出版过程中,作者对内容的取舍、章节的安排、结构的设计以及表达方式等方面多方听取意见,并进行了反复修改。在感谢作者们辛勤劳作的同时,编委会还特别感谢科学出版社的鞠丽娜编辑,她不辞辛劳,在统筹印刷出版、督促进度、征求意见、组织审校等方面做了大量工作。这套教材能在保证质量的前提下及时与读者见面,是和她的努力分不开的。
从长远的教学角度考虑,为了适应不同类型院校、不同要求的课程需要,教材编审协调组将不断组织教材的修订、编写(译),从而使信息科学教学用书做到逐步充实、完善、提高和多样化。在此衷心希望采用该系列用书的教师、学生和读者对书中存在的问题及时提出修改意见和建议。
文摘 插图:
