【CUDA】(零)前置知识
(零)CUDA前置知识本人研究生阶段方向为高性能计算,即使做的是国产超算相关内容,CUDA仍是绕不开的一道难关。这也萌生了这个学习笔记,主要希望通过记录的方式督促自己完成CUDA的相关学习。由于写了太多报告,导致习惯性的想先把相关知识介绍一下,学习笔记主要参照书籍《CUDA C编程权威指南》以及相关网络资源。
书籍源代码如下:https://github.com/lugengyou/cuda_program
本篇笔记参考内容如下:
https://blog.csdn.net/xue_csdn/article/details/105297919?ops_request_misc=&request_id=&biz_id=102&utm_term=cuda%E5%9F%BA%E7%A1%80%E7%9F%A5%E8%AF%86%E4%BB%8B%E7%BB%8D&utm_medium=distribute.pc_search_result.none-task-blog-2~all~sobaiduweb~default-0-105297919.142
https ...
Top500超算近十年统计数据
近10年超算架构分析本文以近十年(2016—2025 年)TOP500 与 Green500 的公开榜单和系统说明为基础进行分析,由于top500和green500每年评定两次,为简化分析,本文仅采用2016-2025年6月的数据进行分析
TOP 5002025.6
Rank
System
Cores
Rmax (PFlop/s)
Rpeak (PFlop/s)
Power (kW)
1
El Capitan - HPE Cray EX255a, AMD 4th Gen EPYC 24C 1.8GHz, AMD Instinct MI300A, Slingshot-11, TOSS, HPE DOE/NNSA/LLNL United States
11,039,616
1,742.00
2,746.38
29,581
2
Frontier - HPE Cray EX235a, AMD Optimized 3rd Generation EPYC 64C 2GHz, AMD Instinct MI250X, Slingshot-11, ...
【入门】本地部署DeepSeek
【入门】本地部署DeepSeek引言 2024年12月26日,杭州六小龙之一的 DeepSeek 公司 发布了 DeepSeek-V3 模型,这一消息在 AI 行业掀起了前所未有的震动,甚至可能对全球 AI 产业格局产生颠覆性影响。作为一名计算机专业的学生,我深感震撼,而游戏科学的 CEO 冯骥 更是评价其为“可能是国运级别的科技成果”。DeepSeek-V3 的发布,直接撼动了 AI 领域的“霸主”——英伟达,导致其股价在短短几天内暴跌 17%,这一跌幅可谓是AI 时代的“黑天鹅事件”。一家仅有 百余人的中国 AI 公司,竟然能让全球芯片巨头遭受如此重创,这在科技史上极为罕见!就在几个月前,我国政府宣布对英伟达进行制裁,试图削弱其在 AI 计算领域的主导地位。然而,英伟达 CEO 黄仁勋并未示弱,反而选择强硬对抗中国政府,因为他们拥有足够的“底气”——硬件(GPU)+ 软件(CUDA)深度绑定,打造了一条几乎不可逾越的技术护城河。在 DeepSeek-V3 发布前夕,黄仁勋仍在中国各地访问,包括 北京、上海、深圳、台湾 等核心地区,意气风发地侃侃而谈,丝毫不觉危机临近。然而,Dee ...



