设计 | Design

本页面详细概述了构成 Curio 的核心概念和组件，包括 HarmonyDB、HarmonyTask 等。

Design

设计

Curio Cluster

Curio 集群

Curio 的核心内部组件包括 HarmonyDB、HarmonyTask、ChainScheduler 以及配置和当前存储定义的数据库抽象。

Curio 集群是由多个连接到 YugabyteDB 集群和市场节点的 Curio 节点组成的集群。单个 Curio 集群可以根据需要为多个矿工 ID 提供服务，并在它们之间共享计算资源。

HarmonyDB

HarmonyDB 是一个简单的 SQL 数据库抽象层，由 HarmonyTask 和 Curio 堆栈的其他组件使用，用于存储和检索 YugabyteDB 中的信息。

Key Features:

关键特性：

弹性: 如果主连接失败，自动切换到备用数据库。
安全性: 防止 SQL 注入漏洞。
便利性: 提供常见 Go + SQL 操作的辅助函数。
监控: 通过 Prometheus 统计和错误日志提供数据库行为的洞察。

Basic Database Details

基本数据库详情

Postgres 数据库模式称为 “curio”，所有的 harmony 数据库表都在这个模式下。
表 harmony_task 存储待处理任务列表。
表 harmony_task_history 存储已完成的任务、超过限制的重试任务，并作为触发后续任务（可能在不同机器上）的输入。
表 harmony_task_machines 由 lib/harmony/resources 管理。此表引用注册的机器用于任务分配。注册不意味着义务，但有助于发现。

HarmonyTask

HarmonyTask 是纯粹的（无任务逻辑）分布式任务管理器。

Design Overview

设计概述

任务为中心：HarmonyTask 专注于将任务管理为小型工作单元，减轻开发人员的调度和管理负担。
分布式：任务分布在各个机器上以实现高效执行。
贪婪工人：工人主动认领他们可以处理的任务。
轮询分配：在 Curio 节点认领任务后，HarmonyDB 尝试将剩余工作分配给其他机器。

Model

模型

被阻止的任务: 任务可能因以下原因被阻止：
- 运行节点上的‘子系统’配置被禁用
- 达到指定的最大任务限制
- 资源耗尽
- CanAccept() 函数（任务特定）拒绝任务
任务启动: 任务可以通过以下方式启动：
- 定期数据库读取（每 3 秒）
- 当前进程添加到数据库
任务添加方法：
- 异步监听任务（例如，用于区块链）
- 由任务完成触发的后续任务（封装流水线）
防止重复任务：
- 避免重复任务的机制由任务定义决定，最有可能使用唯一键。

Distributed Scheduling

分布式调度

Curio 实现了一种通过 HarmonyDB 协调的分布式调度机制。Curio 节点根据它们可以处理的任务类型和资源来选择任务。节点在接受任务后不会贪婪，即使它们有足够的资源。其他节点轮流认领任务。每隔 3 秒，如果有可用资源，则会接受额外的任务。这确保了任务的更均匀调度。

Chain Scheduler

链调度器

CurioChainSched 或链调度器在应用或移除新的 TipSet 时触发一些回调函数。这相当于在每个 epoch 获取最重的 TipSet。这些回调函数依次为每种依赖链变化的类型添加新任务。这些任务类型包括 WindowPost、WinningPost 和 MessageWatcher。