作者很懒,所以经常会立flag,这里是他写下的todo list
QAQ
| todo | 创建时间 | 状态 |
|---|---|---|
| 埃氏筛分块筛法 | 26/1/18 | 未完成 |
您可能感兴趣的其他内容
题目链接:3810. 变成目标数组的最少操作次数(中等) 算法原理: 解法:模拟 38ms击败11.30% 时间复杂度O(N) ①先计算出哪些是需要修改的 ②统计需要修改的下标 ③原数组中相同的数可以一起修改,所以只要统计不…...
阅读更多 →摘要 本文实现了一个基于Java的交互式计算器程序,具有加减乘除四种运算功能。程序通过定义四个独立的方法(add、subtract、multiply、divide)实现基本运算,采用while循环和switch结构实现用户交互界面。用户可以循环…...
阅读更多 →标签: #Triton #CUDA #AICompiler #HPC #PyTorch #LayerNorm 📉 前言:为什么 PyTorch 原生算子还不够快? PyTorch 的 torch.nn.LayerNorm 虽然底层调用了 cuDNN 或 ATen 的优化实现,但在处理特定 Shape 或与其他算子结合时,依然存在性能损耗: 显存带宽瓶颈:LayerNorm…...
阅读更多 →