GPU 雲端租用平台比較

Vast.ai

Vast.ai | Console

開源平台，使用者可以自行設定價格並提供硬體資源出租
全球節點廣泛，亞洲地區選擇多，（台灣）適合就近連線
支援多種租用模式（On-Demand、可中斷、預約）
適合需要短期、高效能且低成本 GPU 使用者

價格相對便宜，例如 H100 SXM 每小時最低約 $1.738/hr

Cudo Compute

compute.cudo.org/?create=virtual-machine

原本虛擬幣挖礦相關公司轉型而來，提供企業級的虛擬機服務，主打穩定與可控性

中心化平台，僅使用自家設備，品質較穩定
節點分佈以歐美為主，亞洲選擇相對少
使用者須自行設定 vCPU、記憶體等硬體規格，調整即增加費用
適合企業、研究單位等對穩定性與安全性要求高的使用情境

價格略高，例如 H100 SXM 每小時約 $2.50（加拿大）、$2.25（挪威）

Compter Cudo Price.png

GPU 算力比較

NVIDIA H100 系列 GPU（包括 SXM 與 NVL 版本）專為 AI 與高效能運算設計，無論在理論運算效能、記憶體頻寬還是軟體支援上，都遠超消費級的 RTX 4090。

H100 SXM

採用 Hopper 架構，具備 16,896 個 CUDA 核心與 528 個第 4 代 Tensor 核心
搭載 80GB HBM3 記憶體，記憶體頻寬高達 3.35 TB/s
FP16 Tensor 運算效能可達 1,000 TFLOPS，支援 FP8 精度與 Transformer Engine

H100 NVL

雙 GPU 模組，總計 94GB HBM3 記憶體，透過 NVLink 連接
記憶體頻寬與 SXM 版本相當，適合需要大量記憶體與高速資料傳輸的應用

RTX 4090

採用 Ada Lovelace 架構，具備 16,384 個 CUDA 核心與 512 個第 4 代 Tensor 核心
搭載 24GB GDDR6X 記憶體，記憶體頻寬約為 1 TB/s
FP16 Tensor 運算效能約為 330 TFLOPS，主要設計用於遊戲與創作應用

效能比較總覽

指標	H100 SXM	H100 NVL	RTX 4090
架構	Hopper	Hopper	Ada Lovelace
CUDA 核心數	16,896	16,896 ×2	16,384
Tensor 核心數	528	528 ×2	512
記憶體容量	80GB HBM3	94GB HBM3	24GB GDDR6X
記憶體頻寬	3.35 TB/s	3.35 TB/s	1 TB/s
FP16 Tensor 效能	1,000 TFLOPS	1,000 TFLOPS ×2	330 TFLOPS
主要用途	AI 訓練與推論	大型 AI 模型推論	遊戲與創作應用

H100 SXM：適合需要高效能訓練的研究人員與企業
H100 NVL：適合需要大量記憶體與高速資料傳輸的推論應用

Reference

Powered by Forestry.md