Localisation du texte dans l'image

Je travaille actuellement sur un projet et mon but est de localiser du texte dans une image. OCR'ing le texte n'est pas mon intention pour le moment. Je veux essentiellement obtenir les limites du texte dans une image. J'utilise le composant d'imagerie AForge.Net pour la manipulation. Toute aide dans un sens ou un autre?

Mise à jour 2/5/09: J'ai depuis suivi une autre route dans mon projet. Cependant, j'ai essayé d'obtenir du texte en utilisant MODI (Microsoft Office Document Imaging). Il vous permet d'OCR une image et de tirer du texte avec une certaine facilité.

0

4 Réponses

C'est un domaine de recherche actif. Il y a littéralement des tas de papiers académiques sur le sujet. Il sera difficile de vous aider, en particulier sans plus de détails. Cherchez-vous des types spécifiques de texte? Polices? Que l'anglais? Connaissez-vous la littérature académique?

La "détection de texte" est un problème standard dans tout système OCR (reconnaissance optique de caractères) et par conséquent, il y a beaucoup de bits de code sur les interwebs qui le traitent.

Je pourrais commencer à énumérer des tas de liens de Google mais je suggère que vous fassiez juste une recherche de "détection de texte" et commencez à lire :). Il y a aussi un grand exemple de code disponible.

0
ajouté

Si vous êtes autorisé à utiliser une API en ligne pour cela, l'API sur http: //www.wisetrend. com / wisetrend_ocr_cloud.shtml peut faire de la détection de texte en plus de l'OCR.

0
ajouté

reconnaître le texte à l'intérieur d'une image est en effet un sujet brûlant pour les chercheurs dans ce domaine, mais a seulement commencé à devenir hors de contrôle quand captcha's est devenu la "norme" en termes de défense contre les robots spammeurs. Pourquoi utiliser captcha comme protection? parce qu'il est très difficile de localiser (et de lire) du texte dans une image!

La raison pour laquelle je mentionne captcha est parce que le plus grand progrès * est fait dans cette zone minuscule, et je pense que votre solution pourrait être mieux trouvée là. D'autant plus que les captchas sont en effet sur la localisation de texte (ou quelque chose qui ressemble à du texte) à l'intérieur d'une image encombrée et ensuite en essayant de lire correctement les lettres.

donc si vous pouvez vous trouver un bon outil de rupture de captcha open source , vous avez probablement tout ce dont vous avez besoin pour continue ta quête ...
Vous pourriez probablement même jeter le code le plus difficile qui gère la reconnaissance de caractères elle-même, parce que ces OCR sont utilisés pour lire du texte déformé, quelque chose que vous n'avez pas à faire.

*: avancement en termes d'informations visibles, utilisables et pratiques pour un "non-chercheur"

0
ajouté
L'autre raison de mentionner captcha est que c'est probablement ce que son "projet" est. :-)
ajouté l'auteur T.E.D., source

Stroke width transform can do that for you. That's at least what MS developed for their mobile phone OS. A discussion on the implementation is here at https://stackoverflow.com/

0
ajouté