تفصيل المؤلف
مؤلف Van Hooland,Seth |
الوثائق الموجودة المؤلفة من طرف المؤلف (2)
Affiner la recherche
Classification automatisée : rêve ou réalité ? Analyse critique de l'usage du text mining pour la conception de vocabulaires contrôlés / Hubain, Raphaël in i2D : information, données et documents, 2 (Trimestriel)
[مقالة]
عنوان : Classification automatisée : rêve ou réalité ? Analyse critique de l'usage du text mining pour la conception de vocabulaires contrôlés نوع الوثيقة : نص مطبوع مؤلفين : Hubain, Raphaël, مؤلف ; Van Hooland,Seth, مؤلف ; Verborgh, Ruben, مؤلف تاريخ النشر : 2016 مقالة في الصفحة: P70-P79 اللغة : فرنسي (fre) خلاصة : [étude] L'usage du traitement automatique des langues pour la classification et l'annotation documentaire reste aujourd'hui un rêve plus qu'une réalité. Pourtant, plus que jamais, les organisations font face à de grandes difficultés dans la gestion de leurs documents. Les vocabulaires contrôlés permettent certes d'organiser les contenus, mais toutes les organisations ne disposent pas de ressources suffisantes pour en implémenter. Au travers d'une étude de cas dans le secteur pharmaceutique, les auteurs de cet article, Raphaël HUBAIN, Seth van HOOLAND et Ruben VERBORGH, démontrent comment un établissement de taille réduite peut concevoir un vocabulaire contrôlé et indexer sémantiquement ses contenus et ce, sans dépendance vis-à-vis d'un fournisseur de logiciel grâce à des outils open source. Les données d'évaluation sont mises à disposition afin d'appliquer la méthodologie à d'autres domaines d'application.
in i2D : information, données et documents > 2 (Trimestriel) . - P70-P79[مقالة] Classification automatisée : rêve ou réalité ? Analyse critique de l'usage du text mining pour la conception de vocabulaires contrôlés [نص مطبوع ] / Hubain, Raphaël, مؤلف ; Van Hooland,Seth, مؤلف ; Verborgh, Ruben, مؤلف . - 2016 . - P70-P79.
اللغة : فرنسي (fre)
in i2D : information, données et documents > 2 (Trimestriel) . - P70-P79
خلاصة : [étude] L'usage du traitement automatique des langues pour la classification et l'annotation documentaire reste aujourd'hui un rêve plus qu'une réalité. Pourtant, plus que jamais, les organisations font face à de grandes difficultés dans la gestion de leurs documents. Les vocabulaires contrôlés permettent certes d'organiser les contenus, mais toutes les organisations ne disposent pas de ressources suffisantes pour en implémenter. Au travers d'une étude de cas dans le secteur pharmaceutique, les auteurs de cet article, Raphaël HUBAIN, Seth van HOOLAND et Ruben VERBORGH, démontrent comment un établissement de taille réduite peut concevoir un vocabulaire contrôlé et indexer sémantiquement ses contenus et ce, sans dépendance vis-à-vis d'un fournisseur de logiciel grâce à des outils open source. Les données d'évaluation sont mises à disposition afin d'appliquer la méthodologie à d'autres domaines d'application. L'extraction d'entités nommées : une opportunité pour le secteur culturel ? / Hengchen, Simon in i2D : information, données et documents, 2 (Trimestriel)
[مقالة]
عنوان : L'extraction d'entités nommées : une opportunité pour le secteur culturel ? نوع الوثيقة : نص مطبوع مؤلفين : Hengchen, Simon, مؤلف ; Van Hooland,Seth, مؤلف ; Verborgh, Ruben, مؤلف تاريخ النشر : 2016 مقالة في الصفحة: P70-P79 اللغة : فرنسي (fre) خلاصة : [étude] Les champs de métadonnées non structurés tels que « description » offrent une plus-value considérable à la compréhension pour les utilisateurs finals. Néanmoins, leur caractère non structuré les rend peu exploitables dans un contexte électronique et d'automatisation. Cet article explore les possibilités et les limitations de la reconnaissance d'entités nommées (« Named-Entity Recognition », NER) et de l'extraction terminologique (« Term Extraction », TE) dans la prospection de données non structurées afin d'en extraire des concepts significatifs. Ces concepts permettent de tirer parti d'une recherche et d'une navigation améliorées, mais peuvent également jouer un rôle très important dans la recherche en humanités numériques. À travers une étude de cas basée sur les champs de description des archives historiques de la ville de Québec, les auteurs, Simon HENGCHEN, Seth van HOOLAND, Ruben VERBORGH et Max DE WILDE, proposent une évaluation de quatre services tiers d'extraction d'entités afin de promouvoir l'expérimentation de la reconnaissance d'entités nommées et l'extraction terminologique. Dans le but de couvrir autant le NER que la TE, ils utilisent, pour l'évaluation des entités nommées, une approche quantitative basée sur la précision, le rappel et le F-score calculés sur la base d'un référent manuel (« gold standard corpus »). Une seconde approche, plus qualitative, permet ensuite de prendre en compte la pertinence des termes extraits et aborde la question du multilinguisme.
in i2D : information, données et documents > 2 (Trimestriel) . - P70-P79[مقالة] L'extraction d'entités nommées : une opportunité pour le secteur culturel ? [نص مطبوع ] / Hengchen, Simon, مؤلف ; Van Hooland,Seth, مؤلف ; Verborgh, Ruben, مؤلف . - 2016 . - P70-P79.
اللغة : فرنسي (fre)
in i2D : information, données et documents > 2 (Trimestriel) . - P70-P79
خلاصة : [étude] Les champs de métadonnées non structurés tels que « description » offrent une plus-value considérable à la compréhension pour les utilisateurs finals. Néanmoins, leur caractère non structuré les rend peu exploitables dans un contexte électronique et d'automatisation. Cet article explore les possibilités et les limitations de la reconnaissance d'entités nommées (« Named-Entity Recognition », NER) et de l'extraction terminologique (« Term Extraction », TE) dans la prospection de données non structurées afin d'en extraire des concepts significatifs. Ces concepts permettent de tirer parti d'une recherche et d'une navigation améliorées, mais peuvent également jouer un rôle très important dans la recherche en humanités numériques. À travers une étude de cas basée sur les champs de description des archives historiques de la ville de Québec, les auteurs, Simon HENGCHEN, Seth van HOOLAND, Ruben VERBORGH et Max DE WILDE, proposent une évaluation de quatre services tiers d'extraction d'entités afin de promouvoir l'expérimentation de la reconnaissance d'entités nommées et l'extraction terminologique. Dans le but de couvrir autant le NER que la TE, ils utilisent, pour l'évaluation des entités nommées, une approche quantitative basée sur la précision, le rappel et le F-score calculés sur la base d'un référent manuel (« gold standard corpus »). Une seconde approche, plus qualitative, permet ensuite de prendre en compte la pertinence des termes extraits et aborde la question du multilinguisme.