Home of Gaofeng
深度学习环境配置 深度学习环境配置
CUDA、CUDNN相关的内容一般来说,如果要使用CUDA,一共需要安装3个东西Nvidia驱动、CUDA、CUDNN。 CUDA看作是一个工作台,上面配有很多工具,如锤子、螺丝刀等。cuDNN是基于CUDA的深度学习GPU加速库,有了它才
2025-10-23
DataProcess DataProcess
dataloader解析简单例子总结:对于一般的数据来说,我们把数据量放在第0维,例如[300,3,32,32]。300张3通道,高宽为32的图片。如果batch_size为16,那么每次读取的数据为[300,3,32,32] 假设我们有一
2025-10-23
DDP DDP
基础概念forward(前向传递):输入数据,得到输出的过程。backward(后向传递):根据输出结果,计算参数梯度的过程。 分布式训练技术 Data Parallelism (数据并行) Naive: 每个worker存储一份model
2025-10-21
深度学习Graph 深度学习Graph
同构图和异构图概念 同构图:节点类型和边的类型只有一种异构图:节点类型+边类型>2 在异构图中,节点类型可以代表不同的实体,如用户、商品、话题等,而边类型表示不同实体之间的关系,如用户之间的关注关系、用户与商品之间的购买关系等。节 异构图
2025-06-17
Transformer Transformer
参考资料:https://zhouyifan.net/2022/11/12/20220925-Transformer/ https://zhuanlan.zhihu.com/p/505105707 Transformer的诞生总结:机器翻译
2025-02-26
AI AI
Accurate, Large Minibatch SGD: Training ImageNet in 1 Hour本文旨在展示分布式同步SGD在大规模训练的可行性。 举了一个例子,模型ResNet-50,数据集是ImageNet(第五章实
2023-12-22
深度学习 深度学习
卷积相关的内容网络模型参数的关系编码器:convlstm_encoder_params = [ [ OrderedDict({'conv1_leaky_1': [1, 16, 3, 1, 1]}),
2023-12-11