近期,意大利帕多瓦大学王海峰等人采用梯度提升决策树新算法(GBDT)估计了LAMOST 红巨星(RGB)恒星的年龄,测试了该新方法的可行性。与疏散星团的年龄相比,最终测量的年龄精度约为15%-30%,年老恒星系统误差约为1-2 Gyr。该成果已被国际天文期刊《天体物理学报》(Wang, H.-F.,et al.2024,ApJ)接受。
银河系是研究星系考古学的独特实验室,天文学家可以利用多维信息来研究恒星星族的性质及其历史。恒星表面的化学元素丰度可以为恒星诞生时的银河系环境提供化石证据,恒星年龄更有助于追溯银河系的历史。大样本恒星年龄的准确估计对于全面了解银河系中不同恒星星族的结构、运动学和动力学至关重要,测量大样本恒星年龄一直是恒星和银河系领域的热点问题。所以该团队一方面充分利用所有的公开数据,另一方面基于新方法提升对恒星参数的准度、精度和系统误差的认识。(注:该课题旨在AI时代进行学科交叉与探索,而非仅提供增值星表)。
在PLATO巡天到来之前,红巨星在星震学和光谱学的共同约束下的年龄测量主要适用于某些区域的特定样本,例如:Kepler、 CoRoT、 K2 或TESS连续观测天区。因此,像APOGEE、GALAH或LAMOST这样的大规模光谱巡天,致力于为银河系考古学研究提供基于光谱数据的大样本年龄估计,一般使用星震学小样本作为基准数据。
在机器学习方面,可以依靠一个具有高质量恒星参数的训练集,然后将该工具应用于巡天数据中以预测大样本恒星的年龄。在2022年,该团队使用基于星震学数据分析后的恒星年龄作为训练样本,采用随机森林(RF)新方法和凸包算法来预测红巨星RGB和红团簇星RCG的质量,以及红团簇星RCG的年龄。
在本次工作进展中,该合作组将重整化思路和机器学习相结合,在LAMOST同事们的前期星表基础上,对不同恒星参数做了权重和相关性的全新分析,测试集结果的误差约为11%。该团队克服并解决了方法测试过程中的过拟合问题,进一步探讨了系统误差,结果显示年老恒星系统误差约为1-2 Gyr, 而系统误差来源可能是由于恒星自转、质量损失、微观湍流等物理过程造成。
图一:左图为该工作中所使用的高分辨率星震学样本的元素丰度与恒星年龄的相关性分析,右图为该工作所得到的恒星样本与疏散星团年龄的比较。
此外,该团队还对元素丰度及其与年龄的物理相关性做出了讨论分析,他们指出,恒星的元素[a/Fe]来自核塌缩超新星,[Fe/H]来自Ia型超新星,其他重元素来自AGB恒星或双中子星并合等物理过程。恒星的元素丰度涉及到恒星演化、元素输运、星系环境化学增丰、恒星形成历史等物理过程,未来需要更多工作进行分析。最后,该团队对样本在银河系外盘的分布做了初步分析,并对恒星年龄的科学应用做出了展望。审稿人评价“这是一篇针对恒星年龄测量方法经过了深入比较分析的文章”,文章上线后也很快得到该领域国际资深团队APO-K2系列文章的关注。
未来该团队会继续充分利用公开数据的同时,努力开发和测试新算法来测定大样本的恒星参数,并尝试基于统计物理通过恒星参数来探讨机器学习的内在规律,促进该团队“物语星源-MWLUDPSG”计划中银河系与近邻宇宙的星系震动学和考古学的研究。