inferencerlabs
/

GLM-5-MLX-5.6bit

Text Generation

Model card Files Files and versions

inferencerlabs commited on 3 days ago

Commit

9ffbd0e

·

verified ·

1 Parent(s): ad39c62

Upload model file

Files changed (1) hide show

README.md +1 -1

README.md CHANGED Viewed

@@ -13,7 +13,7 @@ pipeline_tag: text-generation
 # CURRENTLY UPLOADING...
 **See GLM-5 MLX over in action - [demonstration video](https://youtu.be/3XCYruBYr-0)**
-#### Tested on across a M3 Ultra 512GB RAM and M4 Max 128GB RAM using [Inferencer v1.10.1 distributed compute](https://inferencer.com)
 - Distributed inference ~12.5 tokens/s @ 1000 tokens
 - Memory usage: ~444 GB / 49GB

 # CURRENTLY UPLOADING...
 **See GLM-5 MLX over in action - [demonstration video](https://youtu.be/3XCYruBYr-0)**
+#### Tested across a M3 Ultra 512GB RAM and M4 Max 128GB RAM with [Inferencer v1.10.1 distributed compute](https://inferencer.com)
 - Distributed inference ~12.5 tokens/s @ 1000 tokens
 - Memory usage: ~444 GB / 49GB