1998-2026年EarthScope波形数据集

张开发
2026/4/21 5:30:21 15 分钟阅读

分享文章

1998-2026年EarthScope波形数据集
摘要本数据集为通过 EarthScope NSF SAGE Facility Web Services 获取的 IU.ANMO 台站连续地震波形数据。波形数据由 fdsnws-dataselect 服务返回并保存为 miniSEED 文件台站与仪器响应元数据由 fdsnws-station 服务返回并保存为 StationXML 及文本清单。此数据集共 10028 个 .mseed 文件总体量约 60.04 GB55.92 GiB已保存文件名覆盖的时间范围为 1998-10-26T20:00:00Z 至 2026-04-08T00:00:00Z。数据查询参数为网络、台站、位置码、通道标识以及起止时间适用于地震事件波形截取与回放、震相拾取、频谱分析、噪声分析、仪器响应校正以及后续机器学习样本构建等研究工作。关键词地震波形数据miniSEEDfdsnwsStationXML引 言连续地震波形记录是地震学研究、台站运行评估和地球内部结构分析的重要基础数据。与事件目录不同连续波形以时间序列方式记录地面运动可在后续分析中按照研究需要截取任意时间窗支持从单次事件回放到长期背景噪声监测的多类任务。本数据集聚焦 IU 网络 ANMO 台站的 00 位置码宽频通道组台站元数据清单显示当前开放历元相关通道坐标约为纬度 34.94591经度 -106.4572历史采样率包含 20.0、40.0 Hz。数据时间跨度长、文件粒度清晰便于开展跨年度的连续波形检索、质量检查和再加工。1数据采集和处理方法1.1数据采集方法本数据集通过本地脚本 download_continuous_waveforms.py 调用 EarthScope Web Services 获取。波形服务接口为 https://service.earthscope.org/fdsnws/dataselect/1/台站服务接口为 https://service.earthscope.org/fdsnws/station/1/。波形请求使用 netIU、staANMO、loc00、chaBH?所有起止时间均采用 UTC。台站元数据通过 station 服务获取清单查询示例为https://service.earthscope.org/fdsnws/station/1/query?netIUstaANMOloc%2AchaBH%3Flevelchannelformattext。本地 inventory_summary.csv 显示位置码 00 下与 BH? 对应的主要通道包括 BH1、BH2 和 BHZ采样率包含 20.0、40.0 Hz传感器记录包括 Geotech KS-54000 Borehole Seismometer、Streckeisen STS-6A VBB Seismometer。1.2数据处理下载过程按 UTC 时间块组织请求主体历史数据以日为单位保存部分边界或测试时间窗为小时级或不足一天的时间块。服务返回成功后波形以 miniSEED 原始格式写入 mseed 目录台站响应元数据写入 stationxml 目录每次请求的状态、HTTP 状态码、字节数、查询参数、保存路径和保存时间写入 manifest.jsonl。2数据样本描述本数据集共包含 10028 个 miniSEED 文件总体量约 60.04 GB55.92 GiB。单个文件大小最小约 0.012 MB平均约 5.99 MB最大约 13.63 MB。已保存文件名记录的波形时间范围为 1998-10-26T20:00:00Z 至 2026-04-08T00:00:00Z。manifest 查询窗口范围为 1998-10-26T20:00:00Z 至 2026-04-08T05:29:39Z其中最后一个查询窗口返回 no_data因此未形成对应波形文件。文件命名格式为“网络.台站.位置码.通道组.开始时间_结束时间.mseed”。例如 IU.ANMO.00.BHQ.1998-10-26T200000Z_1998-10-27T000000Z.mseed 表示 IU.ANMO.00.BH? 通道组在 1998-10-26T20:00:00Z 至 1998-10-27T00:00:00Z 时间段内的波形数据。manifest.jsonl 当前共记录 10035 条请求其中 downloaded 为 10028 条no_data 为 7 条。no_data 时段主要包括 2000-11-10 至 2000-11-12、2022-05-07 至 2022-05-08、2025-03-22 至 2025-03-25 以及 2026-04-08 的部分查询窗口。3 数据质量控制和评估本数据集的基础质量控制首先依赖 EarthScope 服务端返回结果与本地 manifest 记录。HTTP 200 的请求被保存为 downloadedHTTP 204 等无数据响应被记录为 no_data不以空文件替代。manifest 中的字节数与 mseed 目录中文件总量一致可用于核对下载完整性和排查重复请求。台站与仪器响应信息以 StationXML 和 inventory 清单形式保留可用于检查通道可用性、采样率、传感器类型、方位角、倾角和响应系数。对于正式科研分析建议在读取 miniSEED 后进一步执行缺测、重叠、突跳、饱和、异常振幅和响应恢复检查并以 UTC 时间作为所有切片和事件匹配的统一时间基准。本地目录名 IU.ANMO.00.BHQ 中的 BHQ 是整理时使用的通道组标签不应理解为单一标准通道名。实际下载查询使用 BH? 通配符后续读取 miniSEED 时应结合 StationXML 或文件内部 trace header 识别具体通道。当前说明未对波形做重采样、滤波或事件截取数据仍保持为服务返回的连续波形文件。需要注意的是本数据集是连续波形数据而非“一个事件一条记录”的结构化事件目录。no_data 时间块在长期连续归档中较常见分析时应根据 manifest 和实际 trace coverage 明确可用时间窗。4数据价值本数据集的价值在于提供了 ANMO 台站较长时间跨度的连续宽频波形及配套元数据。相较于只保存事件截取波形的数据产品连续 miniSEED 文件允许研究者根据任意地震目录、震相到时或自定义触发条件回溯截取波形并可重复开展滤波、谱分析、仪器响应校正和噪声互相关等处理。EarthScope 提供的 FDSN Web Services 是地震波形和台站元数据获取的标准化接口。本数据集利用其中的 dataselect 服务下载连续波形利用 station 服务补充通道、采样率、传感器和仪器响应信息使波形文件与元数据能够在 ObsPy、SeisComP、SAC 等常用地震学软件中配套使用。数据同时保留了请求清单、StationXML 响应和通道清单便于复现实验流程、评估数据覆盖度并为事件检测、震相识别、背景噪声监测、台站长期运行状态分析和机器学习样本构建提供稳定的数据底座。参考文献[1] EarthScope Consortium. FDSN Web Services 总入口https://service.earthscope.org/fdsnws/.[2] EarthScope Consortium. fdsnws-dataselect 波形服务https://service.earthscope.org/fdsnws/dataselect/1/.[3] EarthScope Consortium. fdsnws-station 台站服务https://service.earthscope.org/fdsnws/station/1/.

更多文章