AWS 公共区块链数据项目为开发者、数据分析师与研究人员提供免费且高度结构化的区块链数据资源。所有数据均转换为经过压缩的 Parquet 格式文件,按日期分区存储,支持高效查询和复杂分析操作。
数据集概览
该项目汇总了多种主流区块链的数据,涵盖比特币、以太坊以及多个 Layer 2 和新兴公链。每个数据集以表格形式组织,并托管在 Amazon S3 上,用户可直接通过指定路径访问。
当前可用区块链数据集
- Bitcoin
维护方:AWS
路径:s3://aws-public-blockchain/v1.0/btc/ - Ethereum
维护方:AWS
路径:s3://aws-public-blockchain/v1.0/eth/ - Arbitrum
维护方:SonarX
路径:s3://aws-public-blockchain/v1.1/sonarx/arbitrum/ - Aptos
维护方:SonarX
路径:s3://aws-public-blockchain/v1.1/sonarx/aptos/ - Base
维护方:SonarX
路径:s3://aws-public-blockchain/v1.1/sonarx/base/ - Provenance
维护方:SonarX
路径:s3://aws-public-blockchain/v1.1/sonarx/provenance/ - XRP Ledger
维护方:SonarX
路径:s3://aws-public-blockchain/v1.1/sonarx/xrp/
数据更新与结构
该项目以每日频率更新数据,新的 Parquet 文件会被推送至对应日期的分区文件夹中。这种结构化设计特别适合时间范围查询和聚合分析任务,可大幅降低数据扫描成本和提高查询效率。
使用许可与文档
许可证
使用本数据集需遵守项目提供的开源许可证,具体条款可查阅项目 GitHub 中的 LICENSE 文件。
技术文档
详细的数据表结构、字段说明及分析示例,请参见官方文档中提供的分析指南。
数据维护与联系
维护机构
该项目由 Amazon Web Services 及合作伙伴 SonarX 共同维护。
联系方式
如有技术或数据访问问题,可通过邮件联系项目团队。
如何引用该数据集
如在研究或出版物中使用本数据,请按如下格式引用:
AWS Public Blockchain Data was accessed on [访问日期] from https://registry.opendata.aws/aws-public-blockchain.
使用案例与资源
以下为目前已公开的部分案例与研究,供使用者参考:
- 《Access Bitcoin and Ethereum open datasets for cross-chain analytics》
作者:Oliver Steffmann 等
文章介绍了如何利用这些数据进行跨链分析。 - 《New datasets added to the AWS Public Blockchain Datasets — available for analytics and research》
作者:Everton Fraga 与 Simon Goldberg
内容涉及新纳入数据集的介绍及其在研究中的应用。
常见问题
问:是否需要付费才能使用这些数据?
答:目前该项目所有数据均为免费提供,用户可直接从指定 S3 路径访问和分析数据。
问:是否支持实时区块链数据同步?
答:当前数据更新频率为每日一次,适合非实时的批量分析和研究场景。如需实时数据,建议寻求专业数据服务商。
问:Parquet 格式有何优势?
答:Parquet 是一种列式存储格式,具备高压缩率和查询性能,特别适合大数据场景下的聚合查询与分析任务。
问:是否提供数据schema或字段说明?
答:是的,项目的 GitHub 文档中包含了详细的数据表结构和字段定义,推荐在使用前先行查阅。
问:我可以在商业项目中使用这些数据吗?
答:可以,但需遵守项目中注明的开源许可协议,并按规定进行数据引用。
问:如果数据出现问题,该如何反馈?
答:用户可通过官方提供的联系邮箱反馈数据错误或访问异常等问题。
通过 AWS 公共区块链数据集,用户能够低成本、高效率地开展链上数据分析、学术研究及行业报告撰写,是区块链数据分析领域的重要开放资源。👉 查看实时区块链数据工具