青岛市网站建设_网站建设公司_移动端适配_seo优化
2026/1/7 13:35:42 网站建设 项目流程

地理参照文本文档通常依赖两种方法:基于地名辞典的方法为地名分配地理坐标,或使用语言建模方法将文本术语与地理位置关联。

然而,许多位置描述通过空间关系相对指定位置,使得仅依赖地名或地理指示词进行地理编码不够准确。这一问题在生物标本采集记录中尤为常见,在GPS普及之前的记录常以叙述性文字而非坐标描述位置。

准确的地理参照对生物多样性研究至关重要,但该过程仍依赖大量人工操作,因此对自动化地理参照解决方案的需求日益增长。

本文探讨了大型语言模型自动处理复杂地理位置描述的潜力,重点关注生物多样性收藏领域。我们首先确定了有效的提示模式,随后使用量化低秩自适应方法,基于多区域多语言的生物多样性数据集对大型语言模型进行微调。

在训练数据量固定的条件下,我们的方法优于现有基准模型,跨数据集平均达到65%的记录定位在10公里半径范围内。

最佳结果(纽约州数据集)显示85%记录定位在10公里内,67%在1公里内。所选大型语言模型对冗长复杂的描述表现出良好性能,凸显了其在处理精密地理位置描述方面的潜力。

需要专业的网站建设服务?

联系我们获取免费的网站建设咨询和方案报价,让我们帮助您实现业务目标

立即咨询