12/10/2010

Problème pour récupérer les URLs en finnois

Eh oui, chez les jeunesses talinistes nous profitons des grèves pour travailler alors qu'il fait beau et qu'on serait quand même mieux dehors à boire des punchs coco.


J'ai pour ma part rencontré mon premier problème aujourd'hui même en cherchant des liens contenant le mot 'raja' (frontière en finnois). J'avais -un peu- oublié que le finnois est une langue complètement différente du français dans la mesure où elle compte un bon nombre de déclinaisons (mais n'est pas exempte de prépositions et postpositions toutes plus simples les unes que les autres bien sûr). Ainsi donc, le finnois est une langue où la forme des mots peut énormément changer selon le cas utilisé. On peut voir ici un exemple des différents changements subits par 'raja' selon les déclinaisons dans la liste suivante:


  • Nominatif:     raja
  • Nominatif pluriel:     rajat
  • Translatif:     rajaksi
  • Translatif pluriel:     rajoiksi
  • Génitif:     rajan
  • Génitif pluriel:     rajojen
  • Partitif:     rajaa
  • Partitif pluriel:     rajoja
  • Illatif:     rajaan
  • Illatif pluriel:     rajoihin
  • Essif:     rajana
  • Essif pluriel:     rajoina
  • Adessif:     rajalla
  • Adessif pluriel:     rajoilla
  • Inessif:     rajassa
  • Inessif pluriel:     rajoissa
  • Elatif:     rajasta
  • Elatif pluriel:     rajoista
  • Ablatif:     rajalta
  • Ablatif pluriel:     rajoilta
  • Allatif:     rajalle
  • Allatif pluriel:     rajoille
  • Abessif:     rajatta
  • Abessif pluriel:     rajoitta
  • Comitatif pluriel:     rajoineen
  • Instructif pluriel:     rajoin
Le problème posé est donc: à quel cas chercher des URLs? J'ai tout de même choisi la forme simple 'raja', cela réduit considérablement les liens que l'on obtient mais j'ai quand même pu en récupérer 25. La vraie question que je me pose est: est-ce que cela ne va pas perturber le traitement des textes récupérés dans la mesure où les différentes occurrences du mot 'raja' apparaissent sous d'autres formes? Cela va peut-être constituer un des défis de ce projet!
Yahou!

0 commentaire(s):

Enregistrer un commentaire