Log-linear Models for Event Histories pdf epub mobi txt 电子书下载 2026

简体网页||繁体网页

☆☆☆☆☆

出版者:

作者:Vermunt, Jeroen K.

出品人:

页数:360

译者:

出版时间:1997-5

价格:$ 177.41

装帧:

isbn号码:9780761909378

丛书系列:

图书标签:

Log-linear Models
Event History Analysis
Statistical Modeling
Survival Analysis
Longitudinal Data
Causal Inference
Sociological Methods
Quantitative Research
Demography
Time-to-Event Modeling

下载链接在页面底部

facebook linkedin mastodon messenger pinterest reddit telegram twitter viber vkontakte whatsapp 复制链接

想要找书就要到小哈图书下载中心

qciss.net

立刻按 ctrl+D收藏本页

你会得到大惊喜!!

具体描述

Event history analysis has been a useful method in the social sciences for studying the processes of social change. However, a main difficulty in using this technique is to observe all relevant explanatory variables without missing any variables. This book presents a general approach to missing data problems in event history analysis which is based on the similarities between log-linear models, hazard models and event history models. It begins with a discussion of log-rate models, modified path models and methods for obtaining maximum likelihood estimates of the parameters of log-linear models. The author then shows how to incorporate variables with missing information in log-linear models - including latent class models, modified path models with latent variables and log-linear models for non-response.Other topics covered are: the main types of hazard models; censoring; the use of time-varying covariates; models for competing risks; multivariate hazard models; and a general approach for dealing with missing data problems - including measurement error in the dependent variable, measurement error in the covariates, partially missing information in the dependent variable and partially observed covariate values.

现代统计推断与数据科学的基石：基于机器学习与因果推断的深度学习方法本书聚焦于在复杂高维数据环境中，如何运用前沿的机器学习（Machine Learning, ML）技术和严谨的因果推断（Causal Inference, CI）框架，构建高效、可解释且具有预测能力的统计模型。面对海量、异构的数据流，传统的线性模型已显不足，本书旨在为统计学家、数据科学家以及计量经济学家提供一套系统化、可操作的理论与实践指南，以应对当代数据科学中的核心挑战。第一部分：高维数据建模与正则化理论的深化本书开篇深入探讨了在大数据背景下，模型参数估计面临的“维度灾难”问题。我们超越了传统的最小二乘法（OLS）局限，详细阐述了高维线性模型的选择与收缩方法。第一章：精选与收缩：从LASSO到Adaptive LASSO 本章全面剖析了L1正则化（LASSO）在特征选择中的作用及其局限性，特别是其对稀疏模型的选择偏差问题。随后，重点介绍并推导了Adaptive LASSO的渐近性质和有效性，展示了如何在模型选择与参数估计精度之间找到更优的平衡点。我们引入了Group LASSO及其在结构化变量选择中的应用，特别是针对生物信息学和金融时间序列数据的分组效应识别。第二章：非线性建模的结构化引入：广义可加模型（GAMs）与核方法在高维空间中，参数化模型难以捕捉数据的内在非线性结构。本章致力于广义可加模型（GAMs）的现代回归框架。我们详细讨论了如何利用惩罚样条（Penalized Splines）和高维平滑估计量（如P-样条和平滑样条）来估计复杂的非线性函数，同时保持模型的可解释性。此外，核回归方法，特别是随机特征（Random Features）和核岭回归（Kernel Ridge Regression），被引入作为理解高维特征映射空间的有效工具。第三章：稀疏与低秩的统一：矩阵分解技术在数据压缩与降维中的应用本书强调数据结构的重要性。对于具有内在低秩结构或高稀疏性的数据集（如推荐系统中的用户-物品交互矩阵），传统的PCA或SVD分析往往不够。我们深入探讨了非负矩阵分解（NMF）在特征提取中的应用，以及张量分解（Tensor Factorization）如何处理多维数据，并将其作为正则化项嵌入到回归框架中，以实现更鲁棒的维度约减。第二部分：机器学习范式的融合与模型选择的严谨性现代统计模型构建必须借鉴机器学习中的泛化能力评估标准。本书将统计推断的严谨性与ML的预测能力相结合。第四章：泛化误差的估计与模型选择的统计保证模型的泛化能力是其价值的核心。本章系统介绍了交叉验证（Cross-Validation, CV）的理论基础，包括$K$折、留一法（LOOCV）的偏差与方差特性。更重要的是，我们引入了信息论标准（如AIC、BIC）在高维设置下的修正版本（AICc、BICq），并探讨了一致性选择准则的构建，确保模型选择的统计效率。第五章：集成学习的理论基础：从Bagging到Gradient Boosting 集成方法是当前预测任务中的主流。本章首先解释了Bagging（Bootstrap Aggregating）如何通过方差缩减提升模型的稳定性。随后，我们详细构建了随机森林（Random Forests）的推导过程，并着重分析了Gradient Boosting Machines (GBM) 的迭代优化机制，特别是XGBoost和LightGBM在损失函数最小化和正则化控制方面的工程创新。我们特别关注集成模型的可解释性（Interpretability），如特征重要性排序的统计学意义。第六章：深度学习在结构化数据中的应用与挑战虽然深度学习（DL）在图像和文本处理中占据主导，但其在表格化、结构化数据上的应用仍需统计学指导。本章探讨了多层感知机（MLP）作为一种高度非线性模型的替代性。关键在于正则化策略（如Dropout、Batch Normalization）的引入如何影响模型的收敛性与泛化边界。我们还讨论了如何利用贝叶斯深度学习（Bayesian Deep Learning）来量化模型预测中的不确定性，以适应需要风险评估的决策场景。第三部分：超越相关性：因果推断的统计建模理解“为什么”比仅仅预测“会发生什么”更为关键。本书将因果推断的严谨性嵌入到现代统计建模中。第七章：潜在结果框架与混杂因素的校正本章奠定了因果推断的理论基础，聚焦于Rubin Causal Model (RCM)。我们详细分析了混杂因素（Confounders）识别的必要性，并推导出在观测数据中估计平均处理效应（ATE）的关键障碍——“可忽略性假设”（Ignorability Assumption）。第八章：匹配、分层与倾向性得分的精细化为了在非随机试验中模拟随机化，我们系统探讨了校正方法。倾向性得分（Propensity Score, PS）的估计和应用（如PS匹配、IPW加权）被详细剖析，强调了PS模型选择的准确性对因果估计偏差的影响。此外，我们还介绍了双重稳健（Doubly Robust）估计器，它结合了结果模型和倾向性得分模型的优势，提供了更强大的估计保证。第九章：结构方程模型（SEM）与因果发现的现代迭代超越传统的路径分析，本章探讨了结构方程模型（SEM）在复杂假设检验中的应用。重点转向因果发现（Causal Discovery）的前沿进展，特别是基于条件独立性检验的约束方法（如PC算法、FCI算法）如何在有/无潜在混杂因素的情况下，从高维观测数据中推断出潜在的因果图结构。我们探讨了将这些结构约束集成到高维回归模型中的可行性。第十章：时间序列中的因果关系识别与动态效应评估对于依赖时间顺序的领域（如宏观经济学、流行病学），静态的因果模型不足以应对动态性。本章专注于向量自回归（VAR）模型中的格兰杰因果关系（Granger Causality）检验的局限性，并引入了更强大的结构向量自回归（SVAR）识别策略，特别是基于经济理论约束或冲击符号识别的方法。同时，我们也探讨了利用固定效应模型和事件研究法来评估处理效应在时间上的动态演变。总结：整合模型的鲁棒性与可解释性全书的最终目标是引导读者构建一个能够同时满足高预测精度（通过ML技术）、严谨统计推断（通过正则化和模型选择）以及明确因果解释（通过CI框架）的混合模型。本书强调，在数据驱动的决策时代，统计学家必须掌握这三者之间的协同作用，以确保模型的科学价值和实际应用的可信赖性。每章后附有基于R和Python的实际案例演示，巩固理论与实践的桥梁。