Ungoliant: An optimized pipeline for the generation of a very large-scale multilingual web corpus

Gespeichert in:
Bibliographische Detailangaben
Hauptverfasser: Abadji, Julien (VerfasserIn) , Ortiz Suárez, Pedro Javier (VerfasserIn) , Romary, Laurent (VerfasserIn) , Sagot, Benoît (VerfasserIn)
Weitere Verfasser: Lüngen, Harald (HerausgeberIn) , Kupietz, Marc (HerausgeberIn) , Bański, Piotr (HerausgeberIn) , Barbaresi, Adrien (HerausgeberIn) , Clematide, Simon (HerausgeberIn) , Pisetta, Ines (HerausgeberIn)
Dokumenttyp: Konferenzschrift
Sprache:Englisch
Veröffentlicht: Mannheim Leibniz-Institut für Deutsche Sprache (IDS), Bibliothek 2021
DOI:10.14618/ids-pub-10468
Online-Zugang:Resolving-System: https://doi.org/10.14618/ids-pub-10468
Resolving-System: https://nbn-resolving.org/urn:nbn:de:bsz:mh39-104688
Langzeitarchivierung Nationalbibliothek: https://d-nb.info/1237268664/34
Verlag, kostenfrei: https://ids-pub.bsz-bw.de/frontdoor/index/index/docId/10468
Volltext
Verfasserangaben:Julien Abadji, Pedro Javier Ortiz Suárez, Laurent Romary, Benoît Sagot ; Herausgeber: Harald Lüngen, Marc Kupietz, Piotr Bański, Adrien Barbaresi, Simon Clematide, Ines Pisetta
Beschreibung
Beschreibung:In: Proceedings of the Workshop on Challenges in the Management of Large Corpora (CMLC-9) 2021. Limerick, 12 July 2021 (Online-Event). - Mannheim : Leibniz-Institut für Deutsche Sprache, 2021, S. 1-9
Beschreibung:Online Resource
DOI:10.14618/ids-pub-10468