首页 > 图书中心 >图书详情

大话统计学(溢彩实训版)——基于R语言+中文统计工具

文科生都能看懂的全彩印刷学习体验上佳的统计学奇书。夯实人工智能,深度学习,机器学习,模式识别,数据挖掘,大数据,金融科技,网络存储,数据库管理,数据可视化,用户体验等专业之基础。

作者:陈文贤
定价:139
印次:1-1
ISBN:9787302593515
出版日期:2022.05.01
印刷日期:2022.04.19

“统计学”是兼具数学计算与图形可视化的课程,也是大数据、运筹学、数据挖掘、数据科学、统计计算、统计学习、机器学习、深度学习和人工智能等技术的基础学科。 目前学习统计学的难点在于先学理论还是先学统计工具。统计学的理论体系庞杂而精密,学习起来枯燥艰辛;而如果从统计工具应用上手,则会有其他问题出现,所有的统计软件(如SPSS),并非计算机辅助教学(CAI),它们并非“教你学会统计”,而是应该在“学会了统计”以后,再来用它。针对这个矛盾,《大话统计学溢彩实训版:基于R语言+中文统计工具》将从零开始接触统计学,利用自行开发的统计小工具配合理论学习,将其真正应用到工作中,稳步跟进大数据时代。 《大话统计学溢彩实训版:基于R语言+中文统计工具》内容前后连贯—从概率到抽样,从描述到推断,从检验到因果。全书思路清晰,用大量图表将内容贯穿到一起。形式上有引言、观念图、流程图、思维导图、阶层图、分类图、关联图、步骤图、流程图,以及因果表、比较表、决策法则表等。 《大话统计学溢彩实训版:基于R语言+中文统计工具》因图表和数据可视化的需要,采用彩色印刷,不仅可以更好地展示统计图表细节,更让《大话统计学溢彩实训版:基于R语言+中文统计工具》的各类流程图、思维导图等学习图谱更精准易读。 《大话统计学溢彩实训版:基于R语言+中文统计工具》专门的配套软件《中文统计》是在Excel(2003—2016版本适用)环境下,安装一个“加载项”,输入统计资料,就可以得到统计结果。另外,《大话统计学溢彩实训版:基于R语言+中文统计工具》提供PPT课件和代码。 《大话统计学溢彩实训版:基于R语言+中文统计工具》适合所有想掌握统计学的读者,也可以作为高校教材,由于内容较多,教师可自行选择教学内容。

more >

Preface 前言 百闻不如一见,兵难隃度,臣愿驰至金城,图上方略。 —《汉书·赵充国传》公元前61年 千言不如一图。(One picture is worth a thousand words.) —F. R. Barnard 1921 没有图画或对话的书,有什么用?(What is the use of a book without pictures or conversations?) —刘易斯·卡罗《爱丽丝梦游仙境》1865 统计学因为计算机的普及,在教程与教学方法方面有结构性的改变,尤其是有关 “数学计算”或“图形显示”的课程。这些教程应该附有应用软件的使用以配合教学。 “统计学”就是有数学计算与图形显示的课程。本书附有《中文统计》软件,在 Excel上安装“加载项”操作,还有 R 语言—以数据分析为主要目的的程序语言。 统计软件并非计算机辅助教学(CAI),因为它们并非“教你学会统计”,而是你“学 会了统计”以后再来用它。有了统计软件以后,大多数的统计问题,只要选择统计功能 (菜单),输入数据,就可以得到答案。虽然 R 语言没有菜单,但是绘图功能强,又有强大 的支持软件包。使用统计软件要注意下列应用: ■能够判断统计数据应该(适合)用哪一个统计方法(模型)。 ■了解并解释统计方法计算结果(答案)的意义。 学习要有地图,学习地图会告诉你:你在这里(here),要往那里去(where),如何去 (how),会得到什么(what),为什么这样走(why)。其中,here是当前课程,where是目的, how是方法模型,what是答案,why是假定条件(为何适用这个方法)。 1980年Wonnacott 统计学第1章开头引用一句话: “He uses statistics as a drunken man uses lampposts —for support rather than for illumination.” “人们利用统计,就好像醉汉利用路灯,是为了支撑,而不是照明。” 还有一个醉汉与路灯的故事: 一个醉汉在夜晚的路灯下找东西,有个路人问他在找什么,醉汉说:“钱包”。 路人就帮他找,两个人找了很久,但就是找不到。路人问:“你确定是掉在‘这里’ 吗?”醉汉说:“我不知道掉在‘哪里’。”路人问:“为什么要在‘这里’找?”醉 汉说:“因为‘这里’有路灯比较亮。”钱包是答案,路灯是统计模型,‘哪里’是用 哪个模型。 II 大话统计学(溢彩实训版)—基于R语言+中文统计工具 利用统计学,要注意是否符合假定条件,不要削足适履,不要因为“这个”方法比 较熟悉、比较容易用,就要用它来找答案,结果找到的答案根本不对。 Statisticians, like artists,have the bad habit of falling in love with their models. —George Box 统计学者像艺术家,有坏习惯:爱上他们的模型(模特儿)。 1976年统计学者、时间序列专家George Box说: 所有的模型都是错误的,但是有些是有用的。(All models are wrong, but some are useful.) 40多年后的现在,这两句话应该改为: 所有的模型都是基于错误的。统计学是为了照明。 本书目标是统计学的航拍机、学习地图和交通工具,可以站在更高的视野,看得 广,走得对,跑得快。《大话统计学》不是说大话的统计学,而是让读者可以“大声说 话”的统计学。因为图表很多,所以也是“大画统计学”,但不是“漫画统计学”,而 是能让老师和计算机对话“对话统计学”。 本书特色 1. 本书前后连贯,有前言、总论、结语。最后结语有统计问题分类、统计概念 复习。 2. 各章之间先后呼应。例如:从概率到抽样,从描述到推断,从检验到因果。 3. 每章也有连贯,开头有引言、概念图,结尾有流程图、思维导图。 4. 书中有许多阶层图、分类图、关联图、步骤图、流程图,以及因果表、比较表、 决策法则表等。 5.《中文统计》软件是在Excel (2016—2019版本适用)环境下,安装一个“加载 项”,输入统计数据资料,就可以得到统计结果。《中文统计》软件仅提供给教师和购 买本书的读者使用。 6.《中文统计》的功能列表(菜单),配合本书章节设计。输入原始数据(观测值),可 进行描述或推断统计的计算。如果只有样本容量、样本平均数、方差、比例等数据,有 “快速估计”或“快速检验”,可以得到推断结果。 7. 每章有例题、习题,为了节省篇幅,放在互联网供下载。 8. 补充教材,如分组资料描述统计、Bootstrap估计法、非参数统计补充、多因素方 差分析、多元回归等,也放在互联网。 9. 因为配合计算机程序,包括Excel函数和R语言,所有的统计公式和计算步骤,都 很清楚地一一列举出来。由于强调应用导向,所以多数公式没有证明。 10. 再版增加时间序列的Holt指数平滑ETS模型和Box自回归ARIMA模型。 大话统计学(溢彩实训版)—基于R语言+中文统计工具 表 《中文统计》软件的菜单 主菜单 次菜单 子菜单 1.描述统计 描述统计 原始数据,分组数据 位置量数 四分位数,Z分数,百分等级 区间尺度统计图 直方图,茎叶图,箱线图,多边形图 分类尺度统计图 饼图,条形图,帕累托图 散点图 2.时间序列 移动平均法,指数平滑法,趋势指数平滑,季节指数, 季节因素考虑,预测误差 3.统计指数 个体指数,简单指数(物价指数),简单指数(数量指数),加权指数(3个商品), 加权指数(4个商品),加权指数(5个商品) 4.概率理论 排列组合,贝叶斯定理,Monty Hall问题,贝叶斯公式计算 5.随机变量 一个离散型随机变量的统计值,两个离散型随机变量的统计值, 多个随机变量的线性组合 6.概率分布 离散型概率分布 二项,泊松,超几何,负二项,几何 连续型概率分布 正态,指数,卡方,t,F,对数正态,Weibull 正态分数qqplot,概率分布查表 7.抽样理论 随机数产生器,抽样(重置抽样),中心极限定理 8.区间估计(一个 总体) z分布:总体均值估计;t分布:总体均值估计;z分布:总体比例估计; 卡方分布:总体方差估计,计算样本量,刀切法(Jackknife方法) 快速估计 z估计-均值,t估计-均值,总体方差估计,z估计-比例值, 总体比例值估计 9.假设检验(一个 总体) z检验:总体均值检验;t检验:总体均值检验;z检验:总体比例检验; 卡方检验:总体方差检验,计算样本量 快速检验 z检验-均值,t检验-均值,总体方差检验,z检验-比例, 二项检验-比例 计算第二类错误、功效、QC曲线 均值检验,比例检验,方差检验 10.假设检验(两个 总体) z检验:两个总体均值之差估计检验;t检验:两个总体均值之差(方差相等); t检验:两个总体均值之差(方差不相等);t检验:配对样本总体均值之差; z检验:两个总体比例之差;F检验:两个总体方差比; McNemar检验:配对样本总体比例差检验 快速检验 均值差检验(总体方差已知),均值差检验(总体方差未知但相等), 均值差检验(总体方差未知且不等),比例值差检验(比例差=0), 比例值差检验(比例差<>0),F检验-双总体方差检定 11.方差分析 单因素方差分析,多重比较法,双因素方差分析:无重复(无交互作用), 双因素方差分析:有重复(有交互作用),Baetlett检验 快速检验 2总体,3总体,4总体,5总体,6总体,7总体,Hartley 12.相关与回归 一元线性回归,一元与多元线性回归,均值预测与个值预测,逆矩阵与行列 式相关系数与协方差,Dubin-Watson检验,逐步回归法,多元回归之偏相关 系数 V 前 言 主菜单 次菜单 子菜单 13.分类数据分析 拟合优度检验,列联表—独立性检验,列联表—独立性检验(原始数据), 卡方检验—正态分布检验,卡方检验—中位数检验 14.非参数统计 符号检验,Wilcoxon符号秩检验,游程检验,秩和检验,Friedman检验, Kruskal-Wallis检验,Spearman秩相关系数,Lilliefors检验,快速检验与查表, Bootstrap自助法估计,Kendall相关系数 R 语言安装说明 1. 下载R软件,到 www.r-project.org。 2. 在R 主页左上角 Download下单击 CRAN。 3. CRAN链接,选择一个镜像Mirrors链接地址,如 China 选项下的清华大学 https://mirrors.tuna.tsinghua.edu.cn/CRAN/ 4. 选择Download R for Windows [或 Download R for Linux,Download R for (Mac) OS]。 5. 如果选择Download R for Windows,单击 base 基础包。 6. 单击Download R 4.0.3 for Windows,下载执行文件 R-4.0.3-win.exe ,安装 R。 7. 启动R,出现 R 的提示符 > ,开始 R的命令内容。 8. R的 # 表示文件批注,程序不会执行。 9. 一行多个表达式可以使用;号隔开,一个表达式可分成多行。 10.“+”表示尚未输入完成,接续上一个命令,可按“Esc”键离开。 11.“↑”键可自动重复上一个命令,如果打错一个命令行,可以按此方法修改。 12. 对象(数据)名称是英文和数字加底线或句点,第一个字符是英文,大小写有 差异。 13. 创建对象用 <- 或 = 号,以“( )”括住命令直接显示数据。 14. 文件路径可写成 “C:/R/babies.txt” 或 “C:\\R\\babies.txt”。 15. 下载R 程序包 (packages) ,输入“> install.packages("arules")”选择一个镜像 链接。 16. 调用已安装的包,输入“> library(arules)”。 17. > if(!require(zoo)){install.packages("zoo")};library(zoo) # 若尚未下载R 包,则下 载并调用。数据的衡量尺度有定比尺度、定距尺度、定序尺度、定类尺度。R 语言是以 面向对象为主的程序设计语言,R的数据对象属性有数值(numeric)、整数(integer)、因子 (factor)、逻辑(logical)和字符串(character),数据对象结构有向量(vector)、因子(factor)、 矩阵(matrix)、数据框(data.frame)、数组(array)、列表(list)、时间序列(time series)等。 > install.packages("zoo") # 下载并安装R 程序包 zoo > library(zoo) # 每次重新执行 R 要调用library载入包 续表 大话统计学(溢彩实训版)—基于R语言+中文统计工具 > if(!require(zoo)){install.packages("zoo")} ; library(zoo) # 若尚未下载R 包,则下载并调用 > search() # 了解目前 R 工作空间已调用的 library > AB <- read.csv("C:/STAT/Chap2_1.csv",header=F) # 读入Excel数据 Chap2_1.csv,命名称为 AB > str(AB) # 查看 AB 的数据结构,输出结果如下: ‘data.frame’: 30 obs. of 1 variable: $ V1: int 25 32 35 35 35 36 40 42 44 46 ... > CD <- as.matrix(AB) # 将数据框对象 AB 转换为矩阵对象 CD > AB <- as.data.frame(CD) # 将矩阵对象CD 转换为数据框对象 AB > write.csv(AB, file = "C:/ STAT/Chap2_1.csv") # 保存AB 为Excel 数据命名为Chap2_1.csv > aTSA::MA() # 调用包 aTSA 函数 MA R语言的数据对象介绍,请见《大话数据科学》(清华大学出版社,2020年)。 统计学R语言程序包::函数 本书章节 R 语言 程序包::函数 Package::functions 1. 安装加载程序包 if(!require(qcc)){install.packages("qcc")} ; library(qcc) 2. 描述统计 stats::summary , mean , median , quantile , IQR , weighted.mean, var, sd matrixStats::weightedMean , weightedMedian , weightedVar spatstat.geom::weighted.quantile; modi::weighted.quantile; pastecs::stat.desc DescTools::PercentRank, PlotQQ, SD; TSA:: skewness, kurtosis EnvStats::geoMean, skewness, kurtosis; e1071:: skewness, kurtosis SparkR::percent_rank; dplyr::percent_rank; fBasics:: skewness, kurtosis graphics::hist, boxplot, pie; plotrix::pie3D; graphics::mosaicplot aplpack::stem.leaf; qcc::pareto.chart; profvis::pause; ggpubr::ggviolin 3. 概率理论 LaplacesDemon::BayesTheorem; VennDiagram::venn.diagram gtools::permutations; DescTools::CombN (请见C:/R-code/R_Chap3.doc) 4. 随机变量 discreteRV::RV, P, E, V, SD, SKEW, KURT 5. 概率分布 stats::dbinom, pbinom, qbinom, rbinom, dnorm, pnorm, qnorm, rnorm, ecdf distr::Binom, Norm, Hyper, Pois, Td, Chisq, Fd, Exp, Geom, Unif fitdistrplus::fitdist(x, "norm"), descdist; MASS::fitdistr (分布拟合) 正态分布检验 stats::shapiro.test, ks.test, qqnrom; nortest::ad.test, sf.test, cvm.test, lillie.test moments::jarque.test , agostino.test (检验偏度); car::qqPlot 6. 抽样理论 base::sample ConvergenceConcepts::investigate, generate, law.plot3d 7. 区间估计(一个总体) stats::binom.test; epitools::binom.exact exactci::binom.exact; boot::boot, boot.ci; PASWR::CIsim (模拟置信区间) DescTools::MeanCI, MedianCI, MeanDiffCI, VarCI 前 言 本书章节 R 语言 程序包::函数 Package::functions 8. 假设检验(一个总体) stats::t.test, binom.test, prop.test, shapiro.test, sigma.test, power.t.test BSDA::z.test; asbio::one.sample.z, power.z.test; EnvStats::varTest 9. 假设检验(两个总体) stats::t.test, var.test, prop.test, wilcox.test BSDA::z.test; distributions3::cdf 10. 方差分析 stats::aov, bartlett.test, shapiro.test, pairwise.t.test, oneway.test (非齐性方差) stats::anova(lm()), TukeyHSD; car::Anova, leveneTest lawstat:: levene.test; multcomp::glht, cld asbio::LSD.test, TukeyCI, ScheffeCI, BonferroniCI, Pairw.test(Y,A,method=) 11. 回归与相关 stats::lm, predict, cor, cor.test graphics::segments ; magrittr::%>% 12. 分类数据分析 stats::chisq.test, prop.test, mcnemar.test, fisher.test, mantelhaen.test; stats::pairwise.prop.test, prop.trend.test; lawstat::cmh; vcd::assocstats DescTools::power.chisq.test, Phi, ContCoef, CramerV; rcompanion::CramerV 13. 非参数统计 stats::kruskal.test, friedman.test, pairwise.wilcox.test, wilcox.test, ks.test rstatix::friedman_test, wilcox_test, sign_test BSDA::SIGN.test; snpar::runs.test; TSA::runs DescTools::RunsTest, SignTest, LillieTest; tseries::runs.test nortest::lillie.test; PairedData::wilcox.test; UsingR::simple.median.test 14. 时间序列 base & stats::diff, ts, stl, acf, pacf, ar, window, arima, arima.sim stats::Box.test, shapiro.test, decompose, HoltWinters, ARMAacf aTSA::MA, expsmooth, Winters, Holt, pp.test forecast::ma, ses, hw, holt, Arima, auto.arima, forecast, ets, ndiffs astsa::sarima; tseries::adf.test, kpss.test, arma fUnitRoots::unitrootTest, adfTest; urca::ur.kpss, ur.df 15. 统计指数 IndexNumR::priceIndex, quantityIndex 续表 大话统计学(溢彩实训版)—基于R语言+中文统计工具 本书资源下载 本书资源分两组:自学资源和教师资源。 ●自学资源包含:R语言代码、各种数据源、例题和习题、部分习题解答,另外 还提供了本书附加电子书,共计223页内容,电子书用来配合图书,无须单独阅 读,教材正文相关位置提醒阅读时再去参考。 C:\Users\E44Luan\AppData\Local\Temp\1631517077(1).png 扫码获取自学资源包: https://www.wqyunpan.com/bookQr/file/view/bfea358d-5062-4fca-805b-ba8fdb28c247 前 言 ●教师资源包含:高清思维导图和可编辑的PPT课件。教师资源便于老师授课,其 学习功能已经分散到书中。自学读者或者学生,无须下载。 C:\Users\E44Luan\AppData\Local\Temp\1631517492(1).png 关注“书圈” 注意:教师资源仅提供给“书圈”公众号输入书号下载。 本书读者群 本群不定期更新本书勘误表。学习上遇到的困难,本书的错误等问题,都可以在本 群讨论。 QQ群:924729834

more >
扫描二维码
下载APP了解更多
图书分类全部图书
more >
  • 陈文贤  加州大学伯克利分校(University of California, Berkeley)工业工程博士,台湾大学信息管理系教授兼系主任,雪城大学(Syracuse University)客座教授,悉尼科技大学(UTS)客座教授,德明财经科技大学信息管理系特聘教授。
  • 统计学是当前所有热门技术与理念的重要基础。无论是数据分析、金融科技,还是人工智能、深度学习,甚至企业决策、用户体验等,其背后都需要进行大量的统计学相关工作。如果你是学生,《大话统计学》绝对是你突击通过考试的神器;如果你是人工智能/大数据/金融/管理等行业中需要处理数据的相关从业人员,《大话统计学》真心需要恶补一下;如果您是老师,《大话统计学》绝对可以让您的课堂轻松活泼,翘课率降至新低……
more >
  • Contents

    目录

    第1章总论 · 1 

    1.1 统计是什么 ·2 

    1.2 统计学的基本概念 4 

    1.3 统计学的分类 6 

    1.4 抽样误差 7 

    1.5 统计数据的收集 ·9 

    1.6 变量与数据的衡量尺度  10 

    1.7 数据的类型 · 11 

    1.8 因果关系  13 

    1.9 统计的应用步骤 · 15 

    1.10 统计学与大数据比较  18 

    1.11 本书流程图  20 

    1.12 本章思维导图 · 21 

    1.13 习题 · 22

    第2章描述统计 23 

    2.1 描述统计  24 

    2.2 统计表 · 24 

    2.3 统计图 · 26 

    2.4 总量指标与相对指标 · 32 

    2.5 平均指标、集中趋势量数 · 33 

    2.6 相对位置量数  39 

    2.7 离差量数  42 

    2.8 形态量数  46 

    2.9 《中文统计》应用  51 

    2.10 R 语言应用  55 

    2.11 本章流程图  60 

    2.12 本章思维导图 · 61 

    2.13 习题 · 62 

    第3章概率理论 63 

    3.1 试验与样本空间 · 64 

    3.2 事件概率  66 

    3.3 排列组合的公式 · 68 

    3.4 事件概率的计算 · 71 

    3.5 条件概率  73 

    3.6 独立事件与互斥事件 · 76 

    3.7 贝叶斯公式 · 78 

    ...

精彩书评more >

标题

评论

版权所有(C)2023 清华大学出版社有限公司 京ICP备10035462号 京公网安备11010802042911号

联系我们 | 网站地图 | 法律声明 | 友情链接 | 盗版举报 | 人才招聘