procesaur commited on
Commit
75400d4
1 Parent(s): 3644a4f

Update README.md

Browse files
Files changed (1) hide show
  1. README.md +5 -5
README.md CHANGED
@@ -16,7 +16,7 @@ tags:
16
  ---
17
 
18
  <h4>
19
- <i class="highlight-container"><b class="highlight">jerteh-125</b></i> —
20
  BERT model specijalno obučen za srpski jezik.</h4>
21
 
22
  <img src="cover.png" class="cover">
@@ -35,7 +35,7 @@ BERT model specijalno obučen za srpski jezik.</h4>
35
 
36
  <ul style="font-weight:bold">
37
  <li>Vektorizuje reči, ili dopunjava nedostajuće reči u tekstu</li>
38
- <li>Zasnovan na RoBERTa-base arhitekturi, 125 miliona parametara</li>
39
  <li>Obučavan na korpusu srpskog jezika veličine 4 milijarde tokena</li>
40
  <li>Među najboljim rezultatima u modelovanju maskiranog jezika za srpski!</li>
41
  <li>Jednaka podrška unosa i na ćirilici i na latinici!</li>
@@ -51,7 +51,7 @@ kao i korpus [PDRS 1.0](https://www.clarin.si/repository/xmlui/handle/11356/1752
51
 
52
  ```python
53
  >>> from transformers import pipeline
54
- >>> generator = pipeline('fill-mask', model='jerteh/jerteh-125')
55
  >>> unmasker("Kada bi čovek znao gde će pasti on bi<mask>.")
56
  ```
57
 
@@ -67,8 +67,8 @@ kao i korpus [PDRS 1.0](https://www.clarin.si/repository/xmlui/handle/11356/1752
67
  >>> from transformers import AutoTokenizer, AutoModelForMaskedLM
68
  >>> from torch import LongTensor, no_grad
69
  >>> from scipy import spatial
70
- >>> tokenizer = AutoTokenizer.from_pretrained('jerteh/jerteh-125')
71
- >>> model = AutoModelForMaskedLM.from_pretrained('jerteh/jerteh-125', output_hidden_states=True)
72
  >>> x = " pas"
73
  >>> y = " mačka"
74
  >>> z = " svemir"
 
16
  ---
17
 
18
  <h4>
19
+ <i class="highlight-container"><b class="highlight">jerteh-81</b></i> —
20
  BERT model specijalno obučen za srpski jezik.</h4>
21
 
22
  <img src="cover.png" class="cover">
 
35
 
36
  <ul style="font-weight:bold">
37
  <li>Vektorizuje reči, ili dopunjava nedostajuće reči u tekstu</li>
38
+ <li>Zasnovan na RoBERTa-base arhitekturi, 81 milion parametara</li>
39
  <li>Obučavan na korpusu srpskog jezika veličine 4 milijarde tokena</li>
40
  <li>Među najboljim rezultatima u modelovanju maskiranog jezika za srpski!</li>
41
  <li>Jednaka podrška unosa i na ćirilici i na latinici!</li>
 
51
 
52
  ```python
53
  >>> from transformers import pipeline
54
+ >>> generator = pipeline('fill-mask', model='jerteh/jerteh-81')
55
  >>> unmasker("Kada bi čovek znao gde će pasti on bi<mask>.")
56
  ```
57
 
 
67
  >>> from transformers import AutoTokenizer, AutoModelForMaskedLM
68
  >>> from torch import LongTensor, no_grad
69
  >>> from scipy import spatial
70
+ >>> tokenizer = AutoTokenizer.from_pretrained('jerteh/jerteh-81')
71
+ >>> model = AutoModelForMaskedLM.from_pretrained('jerteh/jerteh-81', output_hidden_states=True)
72
  >>> x = " pas"
73
  >>> y = " mačka"
74
  >>> z = " svemir"