L’article presenta una investigació basada en el corpus de la distribució i interpretació de la combinació ‘u’ + N en sis llengües eslaves (rus, ucraïnès, txec, serbi, macedoni i búlgar). L’estudi té com a objectiu determinar si hi ha un procés continu de gramaticalització del numeral ‘u’ en les llengües eslaves, i, en cas afirmatiu, en quina fase de gramaticalització es troba cada llengua en la sincronia. Per tal de categoritzar els usos rellevants del lexema ‘u’ es dissenya un sistema d’anotació semàntica. Els resultats de l’estudi mostren un grau diferent de gramaticalització d’‘u’ en les llengües objecte d’estudi, amb el rus i l’ucraïnès al principi del procés (amb usos referencials ocasionals), el txec i el serbi en un estadi intermedi (amb una freqüència significativa d’usos referencials), i el búlgar i el macedoni com els més avançats a l’escala (amb uns quants usos no referencials). Cap de les llengües té un article indefinit totalment gramaticalitzat.
The article presents a corpus-based investigation of the distribution and interpretation of ‘one’ + N combination in six Slavic languages (Russian, Ukrainian, Czech, Serbian, Macedonian, and Bulgarian). The study aims at determining whether there is an ongoing process of grammaticalization of the numeral ‘one’ in Slavic, and, if so, at what stage of grammaticalization is each language situated in the synchrony. In order to categorize the relevant uses of ‘one’ a system of semantic annotation is devised. The results of the study show different degree of grammaticalization of ‘one’ in the languages under study, with Russian and Ukrainian being in the beginning of the path (with occasional referential uses attested), Czech and Serbian being in between (with a significant frequency of referential uses), and Bulgarian and Macedonian being the most advanced on the scale (with a few non-referential uses). None of the languages has a fully grammaticalized indefinite article.