【CUDA】(一)基于CUDA的异构并行计算
(一)基于CUDA的异构并行计算
本篇笔记参考如下:
https://baike.baidu.com/item/冯·诺依曼结构/9536784
自本章开始使用配置和版本如下:
1234显卡:NVIDIA GeForce RTX 5060 Ti 16gCUDA Toolkit 安装版本:13.0.88架构:-arch=sm_120(Blackwell)优化级别:O2
1.1 并行计算
并行计算通常涉及两个不同的计算技术领域。
·计算机架构(硬件方面)
·并行程序设计(软件方面)
书中提及大多数现代处理器都应用了哈佛体系结构
123·内存(指令内存和数据内存)·中央处理单元(控制单元和算术逻辑单元)·输入/输出接口
实际上,如今在现代高性能计算机(如电脑、手机)中,普遍采用的是一种“混合模式”,通常被称为“改进型哈佛架构”(Modified Harvard Architecture)。
宏观层面(由于成本和灵活性):冯·诺依曼占主导
统一的内存(RAM): 16GB 或 32GB 内存条里,既存放着正在运行的软件代码(指令),也存放着你正在编辑的文档(数据)。
统一的存储(硬盘): ...
【CUDA】(零)前置知识
(零)CUDA前置知识
本人研究生阶段方向为高性能计算,做的是国内超算的调优与建模,且大多兼容CUDA生态,因此理解CUDA的相关思想是十分重要的,这也萌生了这个学习笔记,主要希望通过记录的方式督促自己完成CUDA的相关学习。学习笔记主要参照书籍《CUDA C编程权威指南》以及相关网络资源。
借鉴的示例源代码如下:
https://github.com/lugengyou/cuda_program
由于采用了sm_120架构,部分代码需要更新,本笔记的代码仓库如下
https://github.com/Earnshawnlpl/Cuda_program_code
本篇笔记参考内容如下:
https://blog.csdn.net/xue_csdn/article/details/105297919?ops_request_misc=&request_id=&biz_id=102&utm_term=cuda基础知识介绍&utm_medium=distribute.pc_search_result.none-task-blog-2~all~sobaiduw ...
Top500超算近十年统计数据
近10年超算架构分析
本文以近十年(2016—2025 年)TOP500 与 Green500 的公开榜单和系统说明为基础进行分析,由于top500和green500每年评定两次,为简化分析,本文仅采用2016-2025年6月的数据进行分析
TOP 500
2025.6
Rank
System
Cores
Rmax (PFlop/s)
Rpeak (PFlop/s)
Power (kW)
1
El Capitan - HPE Cray EX255a, AMD 4th Gen EPYC 24C 1.8GHz, AMD Instinct MI300A, Slingshot-11, TOSS, HPE DOE/NNSA/LLNL United States
11,039,616
1,742.00
2,746.38
29,581
2
Frontier - HPE Cray EX235a, AMD Optimized 3rd Generation EPYC 64C 2GHz, AMD Instinct MI250X, Slingshot-11, HPE Cray OS, ...
【入门】本地部署DeepSeek
【入门】本地部署DeepSeek
引言
2024年12月26日,杭州六小龙之一的 DeepSeek 公司 发布了 DeepSeek-V3 模型,这一消息在 AI 行业掀起了前所未有的震动,甚至可能对全球 AI 产业格局产生颠覆性影响。作为一名计算机专业的学生,我深感震撼,而游戏科学的 CEO 冯骥 更是评价其为**“可能是国运级别的科技成果”。DeepSeek-V3 的发布,直接撼动了 AI 领域的“霸主”——英伟达,导致其股价在短短几天内暴跌 17%,这一跌幅可谓是AI 时代的“黑天鹅事件”。一家仅有 百余人的中国 AI 公司,竟然能让全球芯片巨头遭受如此重创,这在科技史上极为罕见!就在几个月前,我国政府宣布对英伟达进行制裁**,试图削弱其在 AI 计算领域的主导地位。然而,英伟达 CEO 黄仁勋并未示弱,反而选择强硬对抗中国政府,因为他们拥有足够的“底气”——硬件(GPU)+ 软件(CUDA)深度绑定,打造了一条几乎不可逾越的技术护城河。在 DeepSeek-V3 发布前夕,黄仁勋仍在中国各地访问,包括 北京、上海、深圳、台湾 等核心地区,意气风发地侃侃而谈,丝毫不觉危机临 ...




