Probably a silly question, but IIRC BertModel can load the multilingual models. So what's the difference between distill mbert and distilbert with pretrained multilingual weights? Or is distilbert only a distilled version of the Bert-base models?
-
-
-
Fair question: Distil-mBERT is just an instance of DistilBERT with multilingual weights.
- Još 1 odgovor
Novi razgovor -
-
-
great ! Will you have a talk at Neurips ?
-
A short talk during the workshop days!
Kraj razgovora
Novi razgovor -
-
-
Great job! Transformers continues to amaze!
Hvala. Twitter će to iskoristiti za poboljšanje vaše vremenske crte. PoništiPoništi
-
-
-
اسرع in arabic... Hahahaha
Hvala. Twitter će to iskoristiti za poboljšanje vaše vremenske crte. PoništiPoništi
-
Čini se da učitavanje traje već neko vrijeme.
Twitter je možda preopterećen ili ima kratkotrajnih poteškoća u radu. Pokušajte ponovno ili potražite dodatne informacije u odjeljku Status Twittera.
by night | Into
>