Files
paper-writing/国内外研究现状/1.时空数据查询与读取.md

7 lines
1.9 KiB
Markdown
Raw Blame History

This file contains ambiguous Unicode characters

This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.

---
bibliography: references.bib
---
遥感数据的高效时空查询处理已经得到了广泛的研究早期的工作主要集中在关系数据库系统中的元数据组织和索引级修剪。传统的方法通常扩展基于树的空间索引如R-tree四叉树及其时空变体将图像足迹与时间属性组织在一起并且通常在关系后端例如MySQL和PostgreSQL上实现。这些方法为中等规模的数据集提供了有效的距离过滤但随着遥感元数据量的快速增长它们对平衡树结构的依赖往往导致较高的维护开销和有限的可扩展性。随着数据量和数据摄取速度的不断增加近年来的系统逐渐转向部署在分布式NoSQL存储上的基于网格的时空索引方案。通过使用GeoHash、GeoSOT或空间填充曲线[@li2023]将空间足迹编码为统一的空间网格并将其与时间标识符结合这些方法可以实现轻量级索引构建并在HBase和Elasticsearch等后端具有更好的水平可扩展性。这种基于网格的索引可以通过粗粒度的剪枝有效地减少候选搜索空间更适合于大规模、持续增长的遥感档案。
然而对于遥感工作负载单靠索引修剪不足以保证端到端的查询效率因为遥感工作负载中的单个图像通常很大查询结果需要进一步的像素级处理。为了减少原始I/O的数量谷歌Earth系统依赖于平铺和多分辨率金字塔将图像物理地分成小块。而最近的解决方案则利用COG和基于窗口的I/O来实现对整体映像文件的部分读取。OpenDataCube等框架利用这些特性只读取与查询窗口相交的图像区域从而减少不必要的数据传输。然而在确定候选图像之后大多数系统仍然对每个图像执行细粒度的地理空间计算包括坐标转换和精确的像素窗口推导当涉及许多图像时这可能会产生大量开销。