tinygrad

mirror of https://github.com/tinygrad/tinygrad.git synced 2026-06-24 02:14:17 +00:00

History

qazal 854eac09c6 llama: no E_ copy after bf16 GEMM (#16458 )		2026-06-02 14:14:13 +09:00
..
cast_amax	llama: don't allocate grad_xw13 in bf16 (#16359 )	2026-05-28 04:33:07 +09:00
fp8_transpose	llama speed 6 (#16071 )	2026-05-06 20:51:03 -07:00
fused_ce	llama: no E_ copy after bf16 GEMM (#16458 )	2026-06-02 14:14:13 +09:00
fused_rmsnorm_mul_quantize_fp8	llama mp fixes (#16050 )	2026-05-05 15:35:32 -07:00
quantize_fp8_delayed	quantize_fp8 kernels in uops (#16288 )	2026-05-22 20:54:06 +09:00
rmsnorm	llama: move llama kernels to llama_kernels (#15952 )	2026-04-27 22:48:53 -07:00
__init__.py	llama: update local amax implementation after ParamArgs change (#16446 )	2026-05-30 16:55:43 +09:00