沈阳市网站建设_网站建设公司_门户网站_seo优化-芜湖市网站建设公司

Triton 是一种用于并行编程的语言和编译器。它旨在提供一个基于 Python 的编程环境，以高效编写自定义 DNN 计算内核，并能够在现代 GPU 硬件上以最大吞吐量运行。

更多 Triton 中文文档可访问 →triton.hyper.ai/

triton.language.store(pointer, value, mask=None, boundary_check=(), cache_modifier='', eviction_policy='')

将数据张量存储到由指针定义的内存位置。

1.如果pointer是单元素指针，则加载 1 个标量。在这种情况下：

2.如果pointer是 1 个 N 维指针张量，则会存储 1 个 N 维张量。在这种情况下：

3.如果pointer是由make_block_ptr定义的块指针，则会存储 1 个张量。在这种情况下：

value会被隐式地广播为pointer.shape，并转换为pointer.element_ty类型。

参数**：**

pointer(triton.PointerType, 或 dtype=triton.PointerType 的块) - 存储 value 元素的内存位置。
value(Block) - 要存储的元素张量。
mask（triton.int1 的块,可选）- 如果 mask[idx] 为 false，则不将 value[idx] 存储在 pointer[idx] 处。
boundary_check（整数元组,可选）- 整数元组，表示应该进行边界检查的维度。
cache_modifier(str，可选，应为 {“”（空字符串）、“.wb”（表示缓存回写所有一致性层级）、“.cg”（表示全局缓存）、“.cs”（表示缓存流）、“.wt”（表示缓存直写）} 中的一个）更多详情请参见缓存操作符）—— 在 NVIDIA PTX 中更改缓存选项。
eviction_policy（str，可选，应为 {“”, “evict_first”, “evict_last”} 中的一个）- 更改 NVIDIA PTX 中的驱逐策略。

这个函数也可作为tensor的成员函数调用，使用x.store(...)方式而不是store(x, ...)。

沈阳市网站建设_网站建设公司_门户网站_seo优化