kanhatakeyama commited on
Commit
f4832c3
1 Parent(s): 06442c1

Update README.md

Browse files
Files changed (1) hide show
  1. README.md +82 -1
README.md CHANGED
@@ -1,3 +1,84 @@
1
  ---
2
  license: apache-2.0
3
- ---
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
  ---
2
  license: apache-2.0
3
+ language:
4
+ - ja
5
+ - en
6
+ library_name: transformers
7
+ tags:
8
+ - japanese
9
+ ---
10
+
11
+ # Tanuki-8x8B-dpo-v1.0
12
+
13
+ ## モデルについて
14
+
15
+ Tanuki-8x8Bは、フルスクラッチで?トークン事前学習された8x8Bパラメータ(総パラメータ約47B、アクティブパラメータ約13B)の大規模言語モデルです。
16
+ Tanuki-8x8B-dpo-v1.0は、Tanuki-8x8BにSFTおよびDPOを適用し作成された対話用モデルです。
17
+
18
+ ## 量子化モデル
19
+ - [AWQ 4bit量子化](https://huggingface.co/team-hatakeyama-phase2/Tanuki-8x8B-dpo-v1.0-AWQ)
20
+ - [GPTQ 4bit量子化](https://huggingface.co/team-hatakeyama-phase2/Tanuki-8x8B-dpo-v1.0-GPTQ-4bit)
21
+ - [GPTQ 8bit量子化](https://huggingface.co/team-hatakeyama-phase2/Tanuki-8x8B-dpo-v1.0-GPTQ-8bit)
22
+ - [GGUF量子化](https://huggingface.co/team-hatakeyama-phase2/Tanuki-8x8B-dpo-v1.0-GGUF)*
23
+
24
+ *GGUF版は性能低下が発生している可能性があり、非推奨
25
+
26
+ ## 使い方
27
+
28
+ ```python
29
+ from transformers import AutoModelForCausalLM, AutoTokenizer, TextStreamer
30
+
31
+ model = AutoModelForCausalLM.from_pretrained("weblab-GENIAC/Tanuki-8x8B-dpo-v1.0", device_map="auto", torch_dtype="auto", trust_remote_code=True)
32
+ tokenizer = AutoTokenizer.from_pretrained("weblab-GENIAC/Tanuki-8x8B-dpo-v1.0")
33
+ streamer = TextStreamer(tokenizer, skip_prompt=True, skip_special_tokens=True)
34
+
35
+ messages = [
36
+ {"role": "system", "content": "以下は、タスクを説明する指示です。要求を適切に満たす応答を書きなさい。"},
37
+ {"role": "user", "content": "AIによって私たちの暮らしはどのように変わりますか?"}
38
+ ]
39
+
40
+ input_ids = tokenizer.apply_chat_template(messages, add_generation_prompt=True, return_tensors="pt").to(model.device)
41
+ output_ids = model.generate(input_ids,
42
+ max_new_tokens=1024,
43
+ temperature=0.5,
44
+ streamer=streamer)
45
+ ```
46
+
47
+ ## プロンプト形式
48
+ Tanuki-8x8B-dpo-v1.0は日本語版Alpacaのプロンプトフォーマットを利用します。
49
+ ```
50
+ <s>以下は、タスクを説明する指示です。要求を適切に満たす応答を書きなさい。
51
+
52
+ ### 指示:
53
+ AIによって私たちの暮らしはどのように変わりますか?
54
+
55
+ ### 応答:
56
+
57
+ ```
58
+
59
+ なお、本モデルはデフォルトのシステムプロンプトである`以下は、タスクを説明する指示です。要求を適切に満たす応答を書きなさい。`以外を学習していないため、このシステムプロンプトの使用を推奨します。タスクの詳細はユーザープロンプトに記述してください。
60
+
61
+ ## ベンチマーク
62
+
63
+ **Japanese MT-Bench**
64
+ GPT-4による評価 (gpt-4-0613、平均スコア算出においてスコア-1は除外)
65
+
66
+ | | Tanuki-8B-dpo-v1.0 | Tanuki-8x8B-dpo-v1.0 |
67
+ | ---- | ---- | ---- |
68
+ | 平均スコア | 7.24 | 7.96 |
69
+ | coding | 5.4 | 6.75 |
70
+ | extraction | 6.65 | 6.90|
71
+ | humanities | 9.1 | 9.3 |
72
+ | math | 3.9 | 5.75 |
73
+ | reasoning | 5.75 | 7.35 |
74
+ | roleplay | 8.75 | 8.95 |
75
+ | stem | 9.35 | 9.40 |
76
+ | writing | 9.05 | 8.85 |
77
+
78
+ GPT-4oによる評価
79
+ ![image/png](https://cdn-uploads.huggingface.co/production/uploads/6348501e50fe0799927c3667/TMl4VIoTyUzzdbj5PdVEi.png)
80
+
81
+ **人手評価**
82
+ Chatbot Arena的なシステムを使った人手によるブラインドテストの結果
83
+ ![image/png](https://cdn-uploads.huggingface.co/production/uploads/6348501e50fe0799927c3667/RzPOQfETYD9_AFEjVkwCX.png)
84
+