bigstral-12b-32k-8xMoE

Made using mergekit MoE branch with the following config:

base_model: abacusai/bigstral-12b-32k
gate_mode: random 
dtype: bfloat16
experts_per_token: 2
experts:
  - source_model: abacusai/bigstral-12b-32k
    positive_prompts: []
  - source_model: abacusai/bigstral-12b-32k
    positive_prompts: []
  - source_model: abacusai/bigstral-12b-32k
    positive_prompts: []
  - source_model: abacusai/bigstral-12b-32k
    positive_prompts: []
  - source_model: abacusai/bigstral-12b-32k
    positive_prompts: []
  - source_model: abacusai/bigstral-12b-32k
    positive_prompts: []
  - source_model: abacusai/bigstral-12b-32k
    positive_prompts: []
  - source_model: abacusai/bigstral-12b-32k
    positive_prompts: []

Downloads last month: 6

Safetensors

Model size

82B params

Tensor type

BF16

Model tree for bartowski/bigstral-12b-32k-8xMoE

Base model

mistralai/Mistral-7B-Instruct-v0.2

Finetuned

(1054)

this model

Quantizations

2 models