Lucene Résultats

Dans Lucene si vous aviez plusieurs index qui ne couvraient qu'une seule partition chacun. Pourquoi la même recherche sur différents index renvoie-t-elle des résultats avec des scores différents? Les résultats de différents serveurs correspondent exactement.

c'est-à-dire si je cherchais:

  • Nom - John Smith
  • DOB - 11/11/1934

Partition 0 would return a score of 0.345

Partition 1 would return a score of 0.337

Les deux correspondent exactement sur le nom et la date de naissance.

0
ajouté édité
Vues: 2

4 Réponses

J'ai reçu cette erreur la semaine dernière après avoir modifié ma variable d'environnement PYTHONPATH et mal orthographié mon chemin vers arcgisscripting.pyd.

Corriger le PYTHONPATH pour inclure 'c: \ Program files \ ArcGIS \ Bin' (orthographié correctement) a résolu le problème.

5
ajouté
Eh bien, j'ai dû mettre à jour la configuration d'exclusion avec le chemin d'arcgis \ bin ... et ça fonctionne maintenant, vraiment, vraiment, lentement ... mais ça marche. Je me demande pourquoi c'est si lent, le ralenti est beaucoup plus rapide à compiler.
ajouté l'auteur Rex M, source
Pour clarifier, je courais à partir d'un fichier batch ... pas d'éclipse. Est-ce que eclipse utilise un python différent? Quelle est la version de votre ArcGIS et de l'IDLE que vous utilisiez?
ajouté l'auteur Jay Cummins, source
Vous voudrez peut-être vérifier votre configuration eclipse (par exemple vogella.de/articles/Python/ images/pydev06.gif ) et voyez si vous utilisez la bonne version pour n'importe quel ArcGIS que vous utilisez ( wiki.gis.com/wiki/index.php/Python ).
ajouté l'auteur Jay Cummins, source
peut-être éclipse balaye l'arcgis \ bin (peut-être récursivement)? peut-être essayer de déplacer l'arcgisscripting.pyd dans un répertoire vide et mettre à jour votre config eclipse? ( Je ne connais pas l'éclipse donc prends mes suggestions avec un grain de sel )
ajouté l'auteur Jay Cummins, source
ou peut-être d'abord, lancez procmon.exe (SysInternals goo.gl/J5nW ) et voyez s'il y a quelque chose d'évident qui saute en dehors.
ajouté l'auteur Jay Cummins, source

Parce que le score est déterminé sur l'index si je ne me trompe pas complètement.

Si vous avez des index différents (plus / moins ou des données différentes qui ont été indexées), le score sera différent:

http://lucene.apache.org/core/3_6_0/scoring.html

(Attention: Contient des maths :-))

0
ajouté
ajouté l'auteur Gene T, source

Le notation contient l'inverse Fréquence de document (IDF). Si le terme "John Smith" est dans une partition, 0, 100 fois et dans la partition 1, une fois. Le score pour la recherche de John Smith serait plus élevé dans la partition 1 car le terme est plus rare.

Pour contourner cela, vous devriez avoir votre index sur toutes les partitions, ou vous auriez besoin de remplacer l'IDF.

0
ajouté
Ou vous pourriez construire un multisearcher à partir de tous les indices.
ajouté l'auteur Shashikant Kore, source

Vous pouvez également être intéressé par la sortie de explain() méthode , et le résultat Explication objet , ce qui vous donnera une idée de comment les choses sont marquées comme elles sont.

0
ajouté