CUDA 算子优化:Reduce 类
Sum 是最基础的规约操作,将数组中所有元素累加求和。许多其他规约操作(如 max、min、mean)都可以复用 sum 优化的核心技巧。
CUDA-GDB 入门与原理剖析
这里使用官方文档中的 bitreverse 示例演示 CUDA-GDB 的使用方法。 该程序对数据集执行简单的 8 位数据反转操作。
Python AST 插桩技巧
现在有一些基于对 python 代码进行 AST 插桩的工作, 比如 TrainCheck。 这篇博客主要介绍如何对 Python 进行 AST 插桩。
CS336 Assignment 1: basics
CS336 Lecture Notes 1
原始文本通常以 Unicode 字符串表示,但语言模型需要处理的是 token 序列(通常用整数索引表示)。因此,我们需要:
Spec Kit 初步使用
数据结构: 并查集
并查集 (Disjoint Sets) 是一种用于高效管理不相交集合的数据结构,常用于处理动态连通性问题,例如判断两个元素是否属于同一集合、合并集合等。
算法: 图论 (1)
图论 (Graph Theory) 是数学和计算机科学中的一个重要分支, 主要研究 图(Graph) 这种数学结构。
Profile Image of the Author
Ming
你是来找 Ming 学习的吗
🎉 欢迎来到 Ming 的博客
这里是我的个人博客,分享 AI Infra、LLM 等技术内容。欢迎关注交流!
分类
标签
站点统计
文章
8
分类
6
标签
8
总字数
11,954
运行时长
0
最后活动
0 天前

目录