In this work we analyze the performances of two of the most used word embeddings algorithms, skip-gram and continuous bag of words on Italian language. These algorithms have many hyper-parameter that have to be carefully tuned in order to obtain accurate word representation in vectorial space. We provide an extensive analysis and an evaluation, showing what are the best configuration of parameters for specific analogy tasks.
Autori: | ||
Data di pubblicazione: | 2017 | |
Titolo: | Analysis of Italian word embeddings | |
Rivista: | CEUR WORKSHOP PROCEEDINGS | |
Titolo del libro: | CEUR Workshop Proceedings | |
Digital Object Identifier (DOI): | http://dx.doi.org/10.4000/books.aaccademia.2475 | |
Appare nelle tipologie: | 4.1 Articolo in Atti di convegno |
File in questo prodotto:
Non ci sono file associati a questo prodotto.
I documenti in ARCA sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.