Dernières techniques NLP : Classification sémantique des adjectifs

Découvrez comment une meilleure classification sémantique des adjectifs améliore la compréhension des machines pour de meilleures techniques NLP : analyse des sentiments, enrichissement des catalogues de produits, etc.

DANS CET ARTICLE

Prêt à extraire l'or de vos données ?

Ce mois-ci, nous avons publié une mise à jour révolutionnaire de notre technologie de traitement du langage naturel : une classification sémantique améliorée des adjectifs conçue pour faire progresser la compréhension des machines. Nous avons conçu ce nouveau cadre linguistique pour aider les systèmes d'intelligence artificielle à comprendre les significations complexes et nuancées des adjectifs dans leur contexte.

Comme d'autres parties du discours, les adjectifs sont des mots riches en significations, qui nous permettent d'exprimer divers concepts tels que des qualités, des états ou des émotions. Cependant, les adjectifs peuvent aussi être ambigus et sujets à interprétation. Cette classification actualisée propose une taxonomie structurée des adjectifs, divisée en sept branches significatives : caractéristiques, situations, quantités, sentiments, goûts, actions et relations. Notre nouvelle catégorisation aide les modèles d'intelligence artificielle à reconnaître et à représenter les liens entre les adjectifs et les concepts qu'ils modifient.

Comme nous l'avons expliqué dans notre récent article intitulé "The Importance of Disambiguation in Natural Language Processing" (L'importance de la désambiguïsation dans le traitement du langage naturel), la compréhension précise du sens et de l'intention est cruciale pour les projets NLP . Notre classification sémantique améliorée s'appuie sur les capacités de désambiguïsation existantes de Lettria pour fournir aux modèles d'IA une base linguistique encore plus solide.

Grâce à cette base linguistique améliorée, Lettria continue de repousser les limites du traitement du langage naturel pour les entreprises. Notre nouvelle classification sémantique se traduit directement par de meilleures performances dans les techniques clés de NLP telles que l'analyse des sentiments, l'enrichissement des catalogues de produits et l'IA conversationnelle. Ce guide explique en détail comment la taxonomie mise à jour améliorera nos modèles Machine Learning et permettra aux entreprises de bénéficier d'une intelligence artificielle optimisée.

Découvrez notre hiérarchie sémantique

Caractéristiques Branche

La branche des caractéristiques comprend des adjectifs décrivant des êtres vivants, des objets ou des concepts, qu'ils soient concrets ou abstraits, permanents ou non. Ces informations se trouvent généralement dans les structurations sémantiques ou les ontologies sous la forme d'attributs de classe ou d'attributs individuels. Outre les catégories très générales concernant la mesure, la qualité ou l'importance, il existe des catégories décrivant des propriétés physiques telles que l'odeur, le goût, le son, la texture, la forme, la couleur et d'autres caractéristiques visuelles. Les caractéristiques humaines (et parfois animales) telles que l'intelligence ou la gentillesse sont également incluses.

Direction générale de la situation

La branche situation contient des adjectifs indiquant l'état ou la situation de quelque chose ou de quelqu'un : les manières d'être, les caractéristiques spatiales, le fait d'être lié à quelque chose sans mentionner expressément cette chose (ces adjectifs sont dans une autre catégorie), la situation relative dans l'espace, le temps ou la hiérarchie, l'antériorité, la postériorité ou la simultanéité, le fait d'être ancien ou nouveau, la régularité et d'autres caractéristiques temporelles.

Quantité Branche

La branche quantité permet d'exprimer des propriétés numériques : nombre, ordre, fraction, multiplication, petite ou grande quantité, totale ou partielle.

Branche des sentiments

La branche des sentiments est divisée en deux sous-branches. La première contient des adjectifs indiquant que le référent éprouve un sentiment ou une émotion. La seconde indique que le référent suscite un sentiment ou une émotion chez quelqu'un d'autre. Cette distinction entre les adjectifs qualifiant un patient et ceux qualifiant un agent (dans les sens linguistiques) est essentielle pour structurer correctement l'information et éviter les erreurs d'interprétation.

Branche du goût

La branche goût se divise également en deux sous-branches. La première contient des adjectifs indiquant que l'on est attiré, repoussé ou indifférent à quelque chose ou à quelqu'un. La seconde exprime le fait d'attirer, de repousser ou de laisser indifférent.

Branche Action

La branche action se divise en deux catégories regroupant les adjectifs relatifs aux actions. Les adjectifs "is_doing" indiquent que le référent effectue une action. Les adjectifs "likely_to" indiquent la possibilité de réaliser ou de subir une action.

Direction générale des relations

Enfin, la catégorie relationnelle est une branche à part entière pour les adjectifs relationnels indiquant une relation avec quelque chose. Il s'agit d'une catégorie d'adjectifs clairement identifiée dans la grammaire contemporaine, dont les propriétés syntaxiques sont assez différentes de celles des autres adjectifs.

Quelques observations sur la taxonomie :

  • En raison de la polysémie, certains adjectifs peuvent appartenir à plusieurs catégories en fonction du contexte. Par exemple, doux peut appartenir à la catégorie saveur ou à la catégorie bonne_caractéristique_humaine. Le contexte détermine le sens à donner à l'adjectif.
  • Les noms de certaines catégories pourraient faire l'objet d'un débat. Par exemple, "making_need" dans la branche sentiment n'est pas particulièrement transparent. Des noms alternatifs pourraient être "covet-inducing" ou "desirous". Cependant, les noms ne sont que des étiquettes, alors que ce qui importe, ce sont les concepts et les significations sous-jacents.
  • Les langues n'étant pas mathématiques, il existe des cas limites qui pourraient être classés dans l'une ou l'autre catégorie. La catégorisation n'est pas toujours claire ou définitive. Toutefois, l'approche consistant à attribuer la catégorie la plus représentative ou la plus centrale en fonction de l'usage et de la signification est pragmatique.
  • La taxonomie couvre non seulement les adjectifs qualificatifs, mais aussi les adjectifs relationnels, qui fournissent un mécanisme crucial pour relier les entités ou les concepts. La branche relationnelle est essentielle pour les réseaux sémantiques et les ontologies.

Comment cela affectera-t-il les projets construits avec Lettria?

Si l'on prend les projets d'analyse des sentiments comme exemple clé, la branche élargie "sentiment" permet une catégorisation plus nuancée des adjectifs porteurs d'émotions. En faisant la distinction entre les adjectifs décrivant les propres sentiments d'un sujet et ceux décrivant les sentiments que le sujet suscite chez les autres, nos modèles peuvent acquérir une compréhension plus riche du sentiment exprimé. La reconnaissance de ces nuances permettra une classification plus précise des sentiments positifs, négatifs ou neutres.

Pour l'enrichissement des catalogues de produits, les caractéristiques et les attributs exprimés par les adjectifs sont essentiels pour capturer les propriétés et les qualités d'un produit. Les catégories "caractéristiques" et "quantité" correspondent directement aux types d'attributs nécessaires pour décrire les produits dans des catégories telles que l'habillement, l'alimentation et les boissons, les pièces mécaniques, etc. Nos modèles peuvent désormais identifier davantage de types d'attributs à partir des descriptions de produits, ce qui nous permet de suggérer des attributs structurés supplémentaires à inclure dans les catalogues de produits. La branche "relations" permet également d'identifier les liens entre les produits et les composants ou accessoires.

L'ensemble du processus de désambiguïsation et de structuration au sein de la plateforme Lettria a fait l'objet d'une mise à jour majeure grâce à ces dernières améliorations concernant les adjectifs. En enrichissant notre modélisation de la signification des adjectifs, la plateforme Lettria continue de repousser les limites de la compréhension du langage par les machines. Cette base linguistique améliorée se traduit par de meilleures performances dans les applications clés de NLP pour les entreprises. Notre mission est de construire une IA dotée d'une véritable intelligence linguistique, et l'amélioration de la classification sémantique est fondamentale pour atteindre cet objectif.

Conclusion

Notre taxonomie actualisée des adjectifs constitue un cadre pratique pour représenter et comprendre la signification des adjectifs. La catégorisation pourrait continuer à être améliorée et élargie ; cependant, en tant que base à large couverture, elle atteint l'objectif de faciliter le traitement du langage naturel, l'interopérabilité sémantique et le développement d'ontologies. La branche relationnelle, en particulier, fournit une structure pour relier les entités par le biais d'adjectifs qui dénotent des relations. Dans l'ensemble, la taxonomie est un modèle informatif pour la sémantique des adjectifs.

Avec cette mise à jour, nos utilisateurs bénéficient d'un avantage concurrentiel supplémentaire grâce à nos techniques innovantes NLP et à une linguistique continuellement optimisée. Testez la mise à jour en créant un compte Lettria dès aujourd'hui, explorez le glossaire mis à jour dans notre documentation et lisez plus sur notre travail linguistique dans notre article précédent : Le projet de catégorisation sémantique de l'entreprise dans le cadre du développement d'une solution NLP .

Vous êtes curieux de connaître les caractéristiques uniques de Lettriaet les techniques de NLP ? Consultez nos pages consacrées à la taxonomie, à l'ontologie et à la gestion des dictionnaires.

Callout

Lorem ipsum dolor sit amet, consectetur adipiscing elit. Suspendisse varius enim in eros elementum tristique. Duis cursus, mi quis viverra ornare, eros dolor interdum nulla, ut commodo diam libero vitae erat. Aenean faucibus nibh et justo cursus id rutrum lorem imperdiet. Nunc ut sem vitae risus tristique posuere.

This is some text inside of a div block.
This is some text inside of a div block.
This is some text inside of a div block.
This is some text inside of a div block.

Continuer à lire

Voir tous les articles ->
Créez votre pipeline NLP en 2 minutes
Démarrez ->