学术科研
2024年5月16日下午,304am永利集团官网讲师张书聪在求索楼617举行了题目为“Large Precision Matrix Estimation for Compositional Data”的学术讲座,304am永利集团官网院长刘立新、副院长唐晓彬、数据科学系系主任熊巍及多名师生参会。
在讲座中,张老师详细介绍了高维成分数据的由来和组成——以微生物成分数据为代表。高维成分数据近年来受到了广泛关注,应用于许多不同领域。在单纯形约束下,分析成分间的条件依赖关系受到了新的挑战。因此该研究引入一个新的成分数据的精准矩阵的表达形式,并将其与基精准矩阵形式联系起来,在适当的稀疏性假设下证明了它是渐近可识别的。基于这种联系,该研究提出了一种组合自适应正则化估计(CARE)方法来估计稀疏基精度矩阵。相关的理论揭示了识别和估计之间的一个有趣的权衡,从而突出了成分数据中维度的祝福。特别是,在足够高的维度中,CARE估计器实现了极大极小的最优性,并且表现得和观察到的完整数据一样好。此外,张老师进一步讨论了如何扩展已有的框架来处理包含零的数据,包括采样零和结构零。通过模拟研究,以及对于人类肠道微生物生态网络中的分析何应用,突出了CARE优于现有方法的优点。
张书聪简介:304am永利集团官网数据科学系讲师,博士毕业于上海财经大学,主要研究方向为高维成分数据估计,图模型网络建模等。该文章已发表于统计学领域国际重要核心期刊《Journal of the American Statistical Association》。
(通讯员:杨瑞宇 王萱)